サムスン電子は14日、サムスンリサーチ傘下のポーランド研究所(Samsung R&D Institute Poland)と、北京研究所(Samsung R&D Institute China-Beijing)が、様々なグローバルAIコンテストで優勝するなど成果を上げていると明らかにした。
ポーランド研究所と北京研究所は、世界的に伝統ある言語の自動翻訳ワークショップの一つであるIWSLT(International Workshop on Spoken Language Translation)に参加し、2つの別々の課題で優勝したという。
ポーランド研究所は、英語で構成されたTED講演をドイツ語に翻訳する課題を独自の研究能力で正常に行い、2年連続でオーディオ – テキスト翻訳部門1位を獲得したという。テキスト – テキスト翻訳部門を含めると今年で4年連続IWSLTコンテスト1位となる。
ポーランド研究所は、英語 – ドイツ語のオーディオ – テキスト翻訳部門に参加し、入力された音声をすぐに翻訳するエンドツーエンド(End-to-End、E2E)システムでの課題を解決したという。E2Eシステムに基づいた単独型のエンコーダ – デコーダディープニューラルネットワークを使用し、英語とドイツ語両方の言語のテキストをすべて作成できるようにしたとのこと。録音過程を含め、音声認識の段階のエラーが頻繁に生じる既存システムとは異なり、E2Eは音声入力後すぐに翻訳が行われ、エラーを減らすことができるという。 E2E音声翻訳システムは、まだ研究機関が短く、注目度が低い方式であるという。
さらに、ポーランド研究所は国際電気電子工学会(IEEE)が開催したDCASE(Detection and Classification of Acoustic Scenes and Events)2020コンテストでも2位になったという。
一方、北京研究所もIWSLTに参加し、日本語 – 中国語間の翻訳能力を評価する「オープンドメイン翻訳(Open Domain Translation)」の課題で優勝したという。これは、アジア言語間の翻訳研究を活性化し、機械翻訳のためのウェブコーパスの活用とデータソースの細かい処理を促進するための課題であったとのこと。
北京研究所は、日本語を中国語に翻訳する分野に参加した。採用された方式は、大規模の翻訳モデルのデザインをベースにした「相対的な位置アテンション(Relative Position Attention)」で、事前のデータ処理の洗練を高め翻訳の精度を引き上げた。それだけでなく、バイトペアのエンコード(Byte Pair Encoding)を介して、単語を意味のある単位に分解した結果と、文章を構成した作品を比較したという。ニューラルネットワーク機械翻訳(Neural Machine Translation、NMT)のパフォーマンスを向上させるために、単一の言語コーパスを本来の言語で逆翻訳する過程も含まれた。
先に北京研究所は6月のコンピュータビジョンの分野で世界最高水準学会CVPR(Conference on Computer Vision and Pattern Recognition)2020が主催した各種コンテストでも優秀な成績を収めたという。 △仮想環境下でロボットが人間の命令を理解し、適切な行動をすることができるように誘導する「マテリアライズ人工知能コンテスト」、△視覚障害者が撮影した画像の適切な説明を予測出す「ビーズウィズキャプションコンテスト」 、△さまざまな言語で映像について説明することができるモデルの開発の進捗状況を比較・評価する「バーテックス映像キャプションコンテスト」等に参加し、それぞれ2位となった。