オーディオスタートアップのKrispは水曜日、新機能を発表しました。この機能はAIを使用して、通話中にユーザーのアクセントを変換するものです。最初の対応として、インド英語のアクセントを米国英語に変換する機能が導入されます。
同社によると、このアクセント変換プロセスでは話者の声質は維持しつつ、音素のみをアメリカ英語の発音に適応させる仕組みになっています。この機能は企業環境でテストされており、現在ベータ版がKrispのデスクトップアプリで利用可能になっています。ユーザーは通話中または通話前にこの機能をオンにすることができます。
共同創業者の**アルト・ミナシアン(Arto Minasyan)**氏によると、この機能のアイデアは自身の経験から生まれたといいます。
「私自身、英語をうまく話しているつもりでも、多くの人が私のアクセントを理解してくれませんでした。アクセントを変えることで、コミュニケーションがより円滑になるのではないかと考えました。この問題に2年前から取り組み、ついにベータ版としてリリースすることができました」とミナシアン氏は述べました。
しかし、記者がこの機能をテストしたところ、変換後の音声は完全に自然とは言えず、一部の単語が抜けることもあったとのことです。これについて、同社は「現在はベータ版であり、今後モデルの精度が向上していく」と説明しています。
Krispの発表によると、企業でのテスト結果では営業の成約率が26.1%向上し、1件あたりの売上が14.8%増加したとのことです。また、最初にインド英語のアクセントを対象にした理由として、「インドはSTEM分野(科学・技術・工学・数学)のグローバルな労働市場において大きな割合を占めている」ためと説明しています。さらに、今後はフィリピン英語など他のアクセントにも対応予定とのことです。
類似技術を提供するスタートアップとしては、GV(Google Ventures)が出資するSanasなどがあり、大規模なコールセンター向けに同様の技術を導入しています。
Krispによると、このAIモデルは、さまざまなアクセントや方言を含む数千の音声サンプルをもとに訓練されました。また、同社の会議アシスタント機能を通じて収集された音声データを、ユーザーの同意のもとで活用したとしています。
ミナシアン氏は、この機能のもう一つのメリットとして「事前の個別トレーニングが不要であり、リアルタイムで話者のプロファイルを作成できる」点を挙げました。
2021年に最後の資金調達を行ったKrispは、今年中にiOSおよびAndroid向けアプリをリリース予定で、対面での会話にも対応する計画です。また、Google Meetと連携するためのChrome拡張機能の開発も進めているとのことです。