iFLYTEK、次世代AI同時通訳機を大阪・関西万博で発表。「Spark LLM」搭載の2画面翻訳機で85言語に対応

Ernest

 中国iFLYTEKは17日、大阪・関西万博の中国パビリオンにて、大規模言語モデル「Spark LLM」を搭載した次世代AI翻訳機「デュアルスクリーン翻訳機2.0」の発表会を開催した。



 この新製品は85言語に対応し、オンライン・オフラインの会議や商談、ビジネス接待など多様な場面で活用できる。発表会は「声で世界をつなぐ、言葉の壁がない未来」をテーマに行われた。

スポンサーリンク

端から端への同時通訳技術を世界初実現

 今回の発表で最も注目すべき技術的革新は、「端から端への同時通訳技術」を実現したことである。iFLYTEKの製品担当者・孫境廷氏はこの技術について次のように説明した。

製品担当者の孫境廷氏

 「従来の同時通訳技術では、音声ノイズ除去後にテキスト認識、翻訳、合成という複数の段階を踏んでいましたが、新技術では音声から直接音声への翻訳が可能となりました。認識プロセスをスキップすることで、むしろ翻訳精度が向上するという結果が得られています」

 この技術革新により、同時通訳の遅延時間(発話から翻訳結果が出るまでの時間)は平均3.76秒に短縮された。孫氏によれば「3.76秒という時間は、プロの同時通訳者に要求される3~5秒以内という基準をクリアし、高度な人間の通訳者のレベルに近づいている」という。

 発表会場では商談シーンを想定したデモンストレーションが行われ、プレス加工工場、鋼板とアルミ板といった専門的な業界用語を含む内容がスムーズに翻訳され、字幕がリアルタイムで表示された。また、大阪城や地元料理の紹介など、文化的背景知識を要する事例でも優れた翻訳性能を示した。

 「20年以上の音声技術の蓄積と、大規模言語モデルの組み合わせによって、同時通訳技術は大きな飛躍を遂げました」、「単に言葉を変換するだけでなく、異句切分・順序再構成といった同時通訳の専門技術や、大量の専門用語の理解までをモデルに組み込んでいます」と孫氏は強調した。

オフライン翻訳と強力なノイズキャンセリング機能を実現

 iFLYTEKの調査によると、同社の翻訳機ユーザーの40%以上がオフライン翻訳を利用しているという。「展示会場や建設現場、郊外の工場など、ネットワーク環境が不安定な場所での需要が非常に高い」と孫氏は語る。

孫境廷氏が手に持つのは新製品

 この需要に応えるため、新製品には専用のニューラルネットワーク計算ユニットが組み込まれ、毎秒3.2兆回の浮動小数点演算を実現。クラウド上の翻訳大規模モデルをダウンサイジングして端末内に組み込み、オフライン状態でも高精度な翻訳を可能にした。発表会では、飛行機モードに設定した端末でロシア語やベトナム語への翻訳デモが行われ、工業用語などの専門的な表現も正確に翻訳された。

 また、騒がしい環境でも使用できるよう、「ドーム型1メートル音響バリア」と呼ばれる強力なノイズキャンセリングアルゴリズムを搭載。製品の上部、底部、側面に計5つの高精度マイクを配置し、独自の配列レイアウトを形成している。

 現場デモでは、複数の人が周囲で大声で話す中でも、中央の話者の声だけを正確に拾い上げることに成功。孫氏は「展示会場や工場など90デシベルを超える騒音環境でも、クリアな翻訳を実現できる」と述べた。

 さらに、会議場面では10~12人規模の会議をカバーし、直径最大8メートルの範囲からでも音声を明瞭に拾うことができるという。会議用の全方向集音モードを選択することで、テーブル中央に置いた1台の端末が会議全体をカバーし、自動的に話者の言語を判別して翻訳する。

AI翻訳の「できること」と「限界」を国際的な専門家が議論

 発表会後半では、中国科学技術大学の趙翔副社長がモデレーターを務め、日本のドキュメンタリー映画監督の竹内亮氏、慶熙芸術大学経済学部の吉川栄生教授、上海外国語大学高級翻訳学院執行院長の李正仁教授、そしてiFLYTEKの製品総監の孫静平氏によるパネルディスカッションが行われた。「AI翻訳技術の能と不能」をテーマに、翻訳技術の現状と未来について活発な議論が交わされた。

(左から)ドキュメンタリー映画監督の竹内亮氏、慶熙芸術大学経済学部の吉川栄生教授

 竹内監督はAI翻訳機の効率性を高く評価し「演説時に通訳が入る場合、時間が倍かかっていましたが、この技術のおかげで会議時間が半分になる。最も満足している点は、演説機能の素晴らしさです」と述べた。一方で人間の通訳者の判断能力も重視し、「状況によっては一部の内容を意図的に翻訳しないという判断ができるのは人間だけ。例えば最近、ドキュメンタリーを撮影していた時、現地スタッフが冗談交じりに彼女を批判する場面がありましたが、通訳者は賞賛の部分だけを訳して批判部分は訳さないという機転を利かせました。これはAIにはできないことです」と指摘した。

 吉川教授は映像字幕制作の観点から「日本の映画字幕には1秒4文字という厳格なルールがあります。原文の内容をくみ取りつつ必要な部分だけを残すという作業は、現状ではAIより人間の方が適しています」と述べた。

(左から3人目)上海外国語大学高級翻訳学院執行院長の李正仁教授、iFLYTEKの製品総監の孫静平氏

 李正仁教授は国連での30年以上の翻訳経験を踏まえ、「専門知識や数字の変換においてAI翻訳は大きな助けになります。中国語は『万』単位、英語は『千』単位で、この変換ミスは高位の通訳者でも起こり得るもの。ここでAIは大きな助けになります」と評価。一方で「非公式な会談や水面下の協議では記録を残せない場面があり、そこではAIではなく人間の通訳が必要」と述べた。

 孫静平氏は技術開発者の立場から「人工知能技術、特に現在のいわゆるニューラルネットワークは、統計学モデルであり人間を模倣しているに過ぎません。商談の場では、純粋な言葉のやり取りは10%程度で、残りは感情表現や身振り手振りなどのノンバーバルコミュニケーションだと言われています。この部分はAIが苦手とする領域です」と技術の限界にも触れた。

 討論では、AI翻訳技術の進化と人間の役割について、「将来的には人間とAIが協働するモデルが最適」という見解で一致。李教授は「良い通訳者とは、機械の提供するあらゆる便利さを十分に活用できる者です。機械翻訳を使いこなせる通訳者こそが、これからの時代に求められる通訳者でしょう」と締めくくった。

次世代コミュニケーションツールとしての展望

 新製品「デュアルスクリーン翻訳機2.0」はAIの「Spark LLM」を内蔵し、翻訳機能に加えて、写真翻訳のAI画像読み取り機能やAI対話アシスタント機能も備えている。価格は5,999元(約12万円)で、中国国内ですでに販売が開始された。

デュアルスクリーン翻訳機2.0

 発表会の締めくくりに、竹内監督はユーモアを交えて「価格の部分が日本語に翻訳されていないので、日本人には分からないのでは?」と指摘し、会場の笑いを誘った。この指摘は、まさにAI翻訳と人間の協働が必要な場面を象徴するものであった。

 iFLYTEKの趙翔副社長は「2025年大阪・関西万博という国際的な舞台で製品を発表できたことを光栄に思います。『声で世界をつなぐ、言葉の壁がない未来』というビジョンのもと、今後も言語の壁を超えた自由なコミュニケーションの実現に向けて努力を続けていきます」と語った。

 会場には翻訳機の体験コーナーも設けられ、多くの来場者が実際に85言語間の翻訳を試す様子も見られた。発表会自体も中国語での発表を日本語にリアルタイム翻訳する形で進行され、デモンストレーションの場ともなった。

\最大7.5%ポイントアップ!/
Amazon
Index
記事URLをコピーしました