韓国電子通信研究院(ETRI)は20日、所属研究グループが人工知能(AI)を使った音響認識技術を競う国際大会で世界1位を達成したと発表した。
これにより、機械が人のように聴覚を備え、様々な産業分野と音響認識技術の融合が加速するとの見通しを示した。
韓国電子通信研究院(ETRI)は、人工知能ベースの音響イベント・シーン認識技術コンテスト(DCASE)に参加し、「音響シーン認識分野」において、各国の企業および大学チームと競い、優秀な成績を収めたと明らかにした。
今年で6度目を迎えた本大会は、世界最大の電気・電子技術者協会(IEEE)AASPが主管し、Google、Intel、アマゾン、IBM、サムスン、LGなども参加する音響技術関連の唯一の大会とされる。
大会は6つの分野で合計138のチームから473のシステムが提出され、3月から6月中旬まで課題別技術における競争が行われた。
ETRIが参加した分野の一つである「複数端末対象音響シーン認識」の課題は、複数の種類の端末で録音した音から、録音された場所を当てるものだ。
アクションカムとバイノーラルマイクだけでなく、ノイズが容易に混合される一般的なスマートフォンに至るまで、機器ごとに異なる信号特性を併せて正確に判断する分野だ。
チーム別に最大4つの技術への提出が可能で、28チーム・92のシステムが出場したなか、ETRIの技術は最高の成績を収め、1位を獲得したという。2位には、ジョージア工科大-中国科学技術大-テンセント-UEKの連合チームが入った。
同技術は、お年寄りや聴覚障害者などのための「リスク回避技術」分野での応用が可能であるという。他にも音を聞いて関連情報を引き出すメディアの自動タグ付け技術、自動車、工場ラインの音を聞いて異常の有無を調べる機器の状態監視、ロボットなど、様々な分野での利用率が予想される。
ETRIのキム・フンムク=メディア研究本部長は、「ディープラーニングベース音響認識技術は、今後の新たなアプリケーションサービス技術の開発を通じて、国内関連産業の競争力確保と市場の活性化に大きく寄与するだろう」と述べた。
研究者は、本技術に関連して、過去2017年から国内外で特許17件を出願し、技術論文11件を発表したという。
一方、ETRIは先月14日、人工知能、画像圧縮の大会であるCLIC 2020でも世界1位を収めている。