アリババグループのデジタルテクノロジーとインテリジェンスの中枢であるアリババクラウドは、杭州で開催されるアジア競技大会とアジアパラ競技大会の持続可能性と包括性に貢献するため、選手、ジャーナリスト、スタッフが利用する3つのアジア大会村において、低炭素行動を奨励するサステナビリティ関連のウェブアプリを立ち上げ、また、聴覚障害者が大会により円滑に参加できるように仮想手話通訳者の提供開始を発表しました。
アリババクラウド・インテリジェンスの最高技術責任者(CTO)である周 靖人(Jingren Zhou)は、次のように述べています。
「クラウドベースのテクノロジーは、アジア大会の持続可能で包括的な発展を推進します。当社は、パートナーとの協力のもと、テクノロジーの力を活用し、より環境に優しく、誰もが参加しやすい大会を実現するための取り組みを進めております。」
(中略)
聴覚障害者のコミュニケーションを促進するデジタルアバター
世界保健機関(WHO)によると、現在、世界人口の約20%にあたる15億人以上が難聴を患っています。
アリババクラウドは、10月22日から28日にかけて開催されるアジアパラ競技大会での包括性を促進するため、聴覚障害者の手話通訳者としてデジタルアバター「シャオ・モー(Xiaomo、中国語:小莫)」の導入を発表しました。
アリババクラウドは、シャオ・モーを決済プラットフォーム「アリペイ」のミニアプリに統合し、手話と中国語音声の双方向翻訳をサポートします。
ユーザーが音声メッセージを入力すると、シャオ・モーが聴覚障害者のために手話に翻訳します。
ミニアプリは手話を音声言語に変換することもできるため、聴覚障害者と非聴覚障害者とのシームレスなコミュニケーションを促進します。
手話は、ジェスチャーや表情、体の動きを独自に組み合わせているため、音声言語とは異なる独自の音声学、語彙、文法があります。
これらの複雑さに対応するため、アリババクラウドは、中国浙江省全域の手話使用者や聴覚障害者から収集し注釈を付けた2万5000個の手話ジェスチャーをまとめた手話翻訳データセットを作成しました。
アリババクラウドは、高度な視覚認識アルゴリズムとモーション追跡機能を活用して聴覚障害者の動きを取り込み、言語翻訳モデルを使って手話を音声言語に翻訳しました。
音声言語を手話に変換するために、アリババクラウドはディープニューラルネットワークとリップムーブメント生成モジュールも開発し、仮想通訳者のキャラクターが手話のジェスチャーを正確に行えるようにしました。
アリババクラウドのアルゴリズムエンジニアである張 邦(Matt Zhang)は、次のように述べています。
「アリババクラウドは、自然言語処理、コンピュータービジョン、機械学習技術を統合し、手話通訳システムを開発しました。このイノベーションは、聴覚障害者がアジアパラ競技大会により参加しやすくし、大会をより包括的なものとすることを目指しております。」
AI手話通訳ツールのシャオ・モーはアジア競技大会のニュースチャンネルにも組み込まれており、大会のアナウンス機能のアクセシビリティを向上させました。
アジアパラ競技大会期間中、シャオ・モーは聴覚障害を持つ参加者が会場でボランティアと交流したり、道を尋ねたり、医療支援を求めたり、試合観戦のサポートを受けたりするうえで、さまざまな支援を提供しています。
リンク先はPR TIMESというサイトの記事になります。