Meta社が2023年12月に発表した「Seamless」は、リアルタイムで異なる言語間の会話を可能にするAI言語翻訳システムです。Seamlessは、3つの洗練されたニューラルネットワークモデルを組み合わせることで、話し手の声のスタイル、感情、韻律を保持しながら、100以上の話し言葉と書き言葉間のリアルタイム翻訳を可能にします。
Seamlessの3つのモデルは、以下のとおりです。
eamlessStreaming:約2秒の待ち時間でほぼリアルタイムの翻訳を可能にするストリーミング翻訳モデル。話者が話している間に翻訳を生成し、リアルタイムでの会話を可能にします。
SeamlessM4T v2:他の2つのモデルの基礎となるものであり、音声とテキストの両方の翻訳に対応します。
SeamlessM4T v2-T2T:テキストからテキストへの翻訳に特化したモデルです。
Seamlessは、大規模な言語データセットでトレーニングされており、さまざまな言語間の翻訳精度を向上させています。また、話し手の感情や抑揚をしっかりと保持することで、より自然で人間らしい翻訳を実現しています。
Seamlessは、ビジネス、教育、観光、エンターテインメントなど、さまざまな分野で活用されることが期待されています。例えば、ビジネスでは、海外の取引先との会議や交渉で使用することで、コミュニケーションの効率化や円滑化に貢献することができます。
教育では、外国語学習のサポートや、多言語でコンテンツを配信する際に使用することで、学習者のモチベーション向上や、コンテンツの利便性向上につながります。観光では、訪日外国人観光客とのコミュニケーションの円滑化や、多言語対応の観光案内サービスの提供に使用することで、観光客の満足度向上につながります。
エンターテインメントでは、映画やテレビ番組の字幕や吹き替えの作成、ライブやイベントの多言語配信などに使用することで、視聴者の利便性向上につながります。
Seamlessは、まだ開発の初期段階ですが、今後のさらなる技術の進歩により、より広範囲にわたって活用されることが期待されます。