« テレワーク導入のメリットは? | トップページ | 検察庁前の路上で麻雀大会? »

2020年5月24日 (日)

話した内容をリアルタイムで字幕化してWebカメラ映像に合成するシステム

まあ、商品化されないということはそれほど需要がないということか。コロナの影響で、ワクチン開発とかアビガンなどに比べると電子分野は影が薄い。コロナ不況で失業者も増えるだろうから省力化も一休み。なんとも冬の時代ですが音声認識。AIの実用化分野のトップじゃないかな。試したがぎりgoogleのクラウドタイプの性能は圧倒的。自動翻訳もなかなかのもの。
 ただクラウドとなとどうしても用途が限られる。スタンドアロータイプを探したが、特定話者(自分の声を登録する)なら安い基板でも実用になるが、不特定話者をなると心もとない。そこで見つけたのがJuliusu。これはラズパイでもWindowsでも使える。音声のテキスト変換もできそう。当ブログの閲覧数もすっかり元に戻ったところで、山田電気も脱コロナ。
:
:
:
>ビデオ会議やネット発表会が増える中、話した内容をリアルタイムで字幕化してWebカメラ映像に合成するシステムを開発する人が現れて注目を集めています。
 開発したのは筑波大学大学院修士課程の鈴木一平さん。カメラとマイクをオンにしてGoogle ChromeからWebサイトにアクセスすると、話したことをリアルタイムで音声認識してWebカメラの映像に字幕として表示します。
 ブラウザの画面をキャプチャーしたり共有したりしてビデオ会議ツールに表示すると、字幕付きで会議に参加することが可能。音声認識結果のログをダウンロードすることもできます。ソースコードはGitHubで公開されています。
https://news.infoseek.co.jp/article/itmedia_nlab_20200523036/

|

« テレワーク導入のメリットは? | トップページ | 検察庁前の路上で麻雀大会? »

Raspberry Pi」カテゴリの記事