会議などの議事録を作成したり、プレゼンテーションの内容を後から確認したりするため、音声を録音したいこともあるだろう。そのような場合、数年前まではICレコーダーを利用するのが一般的だったように思うが、最近ではスマートフォン単体で録音できるアプリも増えてきた。

 また、そうして録音した内容を文字起こしするのは、以前は人力で行うのが当たり前だったが、今では自動で文字起こしまで行ってくれるものも出てきている。そのような自動で文字起こしを行ってくれるLINEのアプリ「CLOVA Note」を実際に利用したので、どの程度使えるものなのか簡単に紹介しよう。

●β版として無料提供 アプリでもファイルのアップロードでも利用可能

 CLOVA Noteは、LINEがこの5月からβ版として無料で提供しているAI音声認識アプリだ。単に録音するだけではなく、その内容を自動で文字起こし(LINEの音声認識AI「CLOVA Speech」を使用)してくれるというサービスで、Webブラウザー(対応ファイル形式はM4A/MP3/AAC/AMR/WAVE)の他に、AndroidとiOSのどちらでもアプリを利用できる。

 音声ファイルをアップロードする際に「日常会話」や「会議」、「講演」などの形式(シチュエーション)や参加者の人数を指定すれば、音声をより正確に認識/区別できるという。

 AI文字起こしといえば、Googleも「レコーダー」というアプリをリリースしている。利用できるのは同社のPixel端末のみだが、日本語と英語の他、フランス語やドイツ語の文字起こしにも対応、音声を録音しつつ、リアルタイムに文字起こしを行えるのが特徴だ。

 後から確認するだけではなく、今現在話されている内容を文字で確認することもできる。筆者の場合、海外の発表会など、英語でのプレゼンテーションの場合に、単語を聞き取れなくても文字で確認できるので重宝している。なお、録音/文字起こしした内容は「recorder.google.com」からも確認できる。

 CLOVA Noteも録音/文字起こしを行えるのはレコーダーと同じだが、リアルタイムでの文字起こしには対応しておらず、録音終了後に録音データをアップロードし、一括で文字起こしが行われる。

 この点だけを見ると、レコーダーに劣る印象もあるが、Pixel以外のAndroidスマートフォンやiPhoneでも利用できるのが強みと言えるだろう。もちろん、Web上で録音や文字起こしした内容を確認可能だ。

 レコーダーにはない特色として、録音時に複数の話者を区別することが可能となっている。レコーダーの場合も、ある程度空白の時間があると段落をわけて文字起こしを行ってくれるが、話者が変わっても途切れることなく話が続くと、連続した文章として文字起こしされてしまう。

 この点、CLOVA Noteでは話者を認識し、同様のケースでも別々の文章として表示してくれる。また、司会者など、たびたび登場する話者を同一人物として認識してくれるので、後から確認する場合に非常に見やすい。議事録作成にも役立つだろう。

 この他、スマートフォンで録音中に、Webサイトからその録音に対するメモを作成できる。メモは時間にひもづけられるので、後から見返す場合に便利だ。なお、音声や文字起こしの内容(音声記録)、メモは個別にダウンロードできる。

 続いて、実際の精度はどの程度か試してみよう。

●単語登録にも対応 変換テキストはダウンロードも可能

 肝心の文字起こしの精度だが、録音状態にはよるものの、概ね7〜8割の精度といった印象だ。そのままでの利用は難しいが、固有名詞などを中心に多少の手直しで議事録として利用できるレベルにはあると感じる。

 議事録を作成せず、発表内容を後から確認するような場合には、一度音声を聞いているので多少の誤変換があっても読み進められるだろう。また、文字起こしの内容をざっと目を通し、どうしても意味が分からないような箇所は、その文章をタップすれば、そこから音声の再生を行える。

 面白い機能として、よく使う単語をあらかじめ登録(500語まで)しておくこともできる。登録した単語は音声認識の精度が高まるとのことだ。

 CLOVA Noteの利用は無料だが、文字起こしできる音声ファイルの時間は月300分(1アカウントにつき)までとなっている。AI学習のための音声データ活用に許諾すれば、月600分まで利用できる。

 β期間中は、スマートフォンからは無制限で利用可能だ。今後、多言語サポートやWeb会議システムとの連携対応なども予定しているとのことなので、正式リリースを楽しみにしたいところである。