議事録を書くのがめんどくさい!
インタビューの文字起こしが大変!
音声メモをもじにしたい!
などなど
音声を文字化することができれば、
文字を解析してプログラミングが動き、
結果を音声で返す!
SiriやGoogleホーム、アレクサなどはこんな原理で動いています。
これで会議の議事録も自動でできる!!
と、思ったのですが残念ながらもう少し時間がかかりそうです。
SiriやGoogleホームなどは個人の音声を先にサンプリングし、声の特徴を覚えて解析しやすい状況を作っているからです。
また、Siriなどがきちんと反応すように意識してしゃべっている人が多いのではないでしょうか?
この意識の差が大きな差になります。
会議で文字起こししやすいようにしゃべってくれる人はいませんからね。。
そこで大事なのが、システムの精度だけではなく、【録音環境】になるのです!!