パナソニック システムソリューションズジャパン(PSSJ、片倉達夫社長)は10月28日、放送や新聞、出版などマスメディア業界向けクラウドベースの音声処理・音声認識技術を使った文字起こしサービス「P-VoT(ピーボット)」を発表。11月13日から商用サービスとして提供を開始する。

 P-VoTは、動画や音声ファイルをパナソニックのクラウドサービスにアップロードするだけで、文字起こしを自動化する。番組制作のワークフローの中で時間と手間がかかる文字起こし作業を、約3分の1の時間に短縮できる。録音環境にもよるが、1時間のコンテンツの文字起こし作業が、従来の約5時間から約1.5時間に短縮できる。
 取材現場で撮影・録音したデータをその場でアップロードすると自動で文字起こしをするため、放送局にいるスタッフがすぐに編集作業に取り掛かることができる。
 ウェブブラウザで作業でき、各パート別に複数人で修正・編集できるグループデータ管理を実現。編集した作業内容はリアルタイムで反映される。担当者間での個別メールの送付が不要になるため、利便性と安全性を兼ね備えた運用・管理が可能になる。
 PSSJでは、効率的な文字起こし作業をサポートすることで、業界における不規則な労働や長時間労働の改善による働き方改革につなげる。
 高精度音声認識には、AI技術の多層ニューラルネットワーク(Deep Neural network:DNN)技術を用いており、幅広いジャンルの文字起こしに対応できるという。
 サービス価格は、1コンテンツを基準とした従量制で10秒当たり20円。1カ月で6時間以内4万円の上限付き固定プラン(6時間以上は従量制)も用意する。
 P-VoTは、2019年6月13日からβ版として85社・400ユーザーに提供しており、今回、音声認識精度やUIの改良を施した。β版の申し込みは放送業界の75%、新聞・出版業界の25%だった。