いまさらですが、使ってみました。


おかげ様で忙しい毎日を過ごさせていただいております。ありがとうございます。

案件が予約の場合はスケジュールが組めるのですが、いきなりポイッと音源を送ってくださるお客様もいらして、なかなかどうして期日内にこなすのが非常に厳しいという状況もままあります。

そこで、いまさらですが「音声認識ソフト」なるものを大枚はたいて購入してみました^^;(2019年2月に購入)

認識率99%、世界シェアNO.1! ...こんな謳い文句に踊らされて、ついうっかりと(製品名は伏せておきますが、お分かりになる方も多数おられるのではと推察)。

使用感がどんなものかと思っている同業者の皆さまもおられるのでないでしょうか。

ということで、使用感を少し書いてみます。購入をご検討されている方のご参考となれば幸いです。


■価格

世の中にはフリーものから有料のものまで、様々な価格帯の音声認識ソフトがあります。

どちらが優れているかといえば、知っている限りで言えば、やはり有料のものに勝るフリーソフトは無いと思います。

では、価格は? それほど需要があるとも思えない(使用用途が)この類の製品ですが、だいたい17,000~27,000円前後かと思われます。購入を検討されているのであれば、キャンペーンとかクーポンとかがあるお店を探して、賢く購入されることをお勧めします。高いか安いかは、使う方の価値観によりますので何とも言えませんが、使いこなすことができれば安いかもね、というのが個人的な実感です。ちなみに探しに行った店頭にはなく、ダウンロード版で入手しました。


■で、実際のところ使えるの?

これは「はい」でもあり、「いいえ」でもあります。

 

どういうことかというと... あちらこちらで「この製品、いいね」みたいなブログやら紹介ページを隅々まで見てみると、

【マイクからの音声認識率は99%】【これ一つでSNSなども簡単に更新できる】などの文字が。

敏い方はお分かりになったかと思いますが、認識率が高いのは①特定の個人であり、②ソフトにたくん勉強をさせて賢くなっている場合、という条件付きになります。

なので、例えば、私自身が自分の声でマイクに向かってソフトが判別しやすいようにクリアにゆっくり話すと、かなり精度は良いと思います。まだそれほど学習させていないので賢くありませんが、それでも7割ぐらいは良い感じで文字にしてくれます。満足度は70点ぐらいでしょうか。

 

で、ここからが音声起こしを生業とする方への回答になります。使えるのか? 答えは「いいえ」です(笑)。

★いいえポイント①

どういうことかというと、それぞれの声での学習をした場合に精度が向上するので、毎回、違う方のお声では精度はそれほど良くないというのが一つ。複数人数で話しているのも無理です。標準語じゃないと、かなり厳しいです。

★いいえポイント②

何よりびっくりしたのが、長時間の音源は文字にしてくれないということ。

てっきり1時間とかの音源をセットすれば、1時間分を全部文字にしてくれるものと思っていましたが、実際は3分程度でしょうか。そのあとは、容量が足りませんだったか限界を超えましただったか忘れましたが、そんな感じのエラーボックスが出てきて、細切れにしか文字にできません。こちらについては設定などでPCの使用領域を増やしてあげれば多少は多くできるようですが、そこまでまだ使いこなせていないのでペンディングです。もう少し詳しくなったら追記していきたいと思います。

★いいえポイント③

範囲指定ができません(たぶん)。「ここからここまでを文字化したい」と思っても、音源の最初からしか文字化してくれません。なので、手持ちの音源をすべて文字化したい場合は、別のソフトを駆使して音源をぶつ切りにし、音源の読み込み→文字化を繰り返せば不可能ではないと思います。

★いいえポイント④

単語登録の使い勝手が悪すぎます。同じ読みで、違う単語ってありますよね。会話の中によく出てくる短縮語を登録しようとしたら、「その読みは、すでにあります。違う読みを設定してください」みたいなメッセージが。「はい? おっしゃっている意味が、よく分かりません」と、思わずソフトに突っ込みを入れたくなりました。

★その他、使えない理由のいいえポイントはたくさんあるのですが、切りがないのでペンディングにします。


■どうやって使うのか

一番、気になるところですよね。

①自分の声で学習をたくさんさせて、ソフトを賢くして精度を上げる。(長いスパンで考えましょう)

②録音音源を聞きながら、マイクで復唱する(←結局、手間はかかるのですよ。大ショック)。

 

というか、窓を締め切った独りの部屋で作業するならともかく、声に出して読み上げしている時点で守秘義務に反するのでは? と考えると、仕事には使えないですよね...@@


【参考】

本ページ、冒頭部分の「いまさらですが、使ってみました」の部分を、ボイスレコーダーで録音して文字化させてみました。こんな感じになります。はぁ。いっぱい学習させなくっちゃ。

 

いっす61位とりまやるございます換金が予約の場合はスケジュールが組めるのですがいきなり本当に送ってくださるお客様も癒してなかなかどうして期日内にこなすのが非常に厳しいという状況もままありますで今更ですが音声認識ソフトなるものを大枚はたいて購入してみました認識率99%世界シェアno1こんな謳い文句に踊らされてついうっかりと製品名は伏せておきますがお分かりになる方も多数おられるのではと推察資料館がどんなものかと思っているとお嬢さんの皆様もおられるのではないでしょうかということで使用感を少し変えてみます購入をご検討されている方のご参考となれば幸いです

 

あ、因みに、手元にあったとても真面目な会議の音源を文字化してみたところ、下記のようになりました。

(まったく意味が分からないので大丈夫だと思いますが、音源、勝手に使ってすみません!)

 

もう心にも出演。主任4年夏の本文が15分考え自分を緩めるものですと言う船の力ぐぬぬぬぬぬ-あF1進むほむのサングラス紛失お休みも見る広島風便なるも辞さない覚悟する者はグリーフ5分のする事は無いはずですスノッブの春分の日も過ごしてるそしてズルズル引きずる者になるが、そもそもふふふども?愛ね15分くらいはパブロフホームズはグループの出演スノッブなスノッブな情報夫婦は消費税増・レコーダーん???大変-荒涼たるそのぶんむむむむむ?-6匹5進んで5歩するもの久世ひろみズルズル不滅探すのも~~オススメ本本文部分の本数分ホールの左右です。他のにゴホゴホむむむむむふふふふふふふふふふふふする、もう1ズルズル本文へぬるぬるぬるぬるぬるぬるでも有名です「ラルズの部分とのの色の違いも増えるですスノッブですんんんんんんんんもう?本当にスノッブというのに本文情報の部分が4分の分を取るウルフルズその辺のデレデレスノッブふふふふふふ♪重詰めんんんんんんんんんんんんんんんんんんんんんとも思うのだがんんんお??むむむむむぬるぬる動くことだろうがふふふ~のほほんホームholes財務部方法に自らの手に入らないのですが水洗いされるホテルへ進める便利なのであるのもの、 60年096ほほほほ~んんんんんんん?ふふふふふふふふふの本数分ふふふ、ふふふんんんんんんん?んんんんんんんんんんんので15分には食べられるます?んんんんんんんんんんんんんんんん♪んほふふふんんんんんふふふふふふんんんんんんんんんんんんんんんんんんんんんんんんんんんんんんんんんんほほほむほむほむは本が49 stadium-90でうんんんんんんんんだよな。その記事もそうですぐぬぬぬぬぬぬぬぬぬぬぬぬむむむむむのもんふふふららららんんん?んふふふふふふふふふふふふんんんんん

 

「ラルズ」も「ホテル」も会話には出てきませんし、ましてや歌や音楽なんか録音されていません…。

しかも、水洗いされるホテルって何なんでしょうか^^;