ディープラーニングにより、人工内耳ユーザーの複数話者干渉下での音声明瞭度が回復

ディープラーニングにより、人工内耳ユーザーの複数話者干渉下での音声明瞭度が回復

抄録

人工内耳(Cochlear implants, CIs)は、騒がしい環境では静かな環境ほど効果的ではありません。

現在の補聴器や人工内耳に搭載されている単一マイクの雑音低減アルゴリズムは、予測可能で定常的な雑音のみを除去するものであり、複数の話者による干渉などの現実的で非定常的な雑音には効果がありません。

最近のディープニューラルネットワーク(DNN)アルゴリズムの開発は、特に音声ノイズの除去において、音声強調および分離において注目すべき成果を上げています。

しかし、DNNアルゴリズムが人工内耳装着者を対象にした場合の音声ノイズの除去にどれだけの可能性があるかを調査するには、さらなる研究が必要です。

本研究では、音声処理アプリケーションに適した2つのDNNアルゴリズムを実装しました。

(1)リカレントニューラルネットワーク(RNN)
(2)SepFormer

これらのアルゴリズムは、カスタマイズされたデータセット(約30時間)でトレーニングされ、その後、13名の人工内耳装着者でテストされました。

RNNとSepFormerの両アルゴリズムは、人工内耳装着者の騒音下での音声の聞き取り能力を大幅に向上させ、音声全体の知覚された品質を損なうことなく改善しました。

これらのアルゴリズムは、定常的な非音声ノイズだけでなく、従来の信号処理戦略が効果を発揮しない非定常的なノイズにおいても、聞き取り能力を著しく向上させました。

これらの結果は、複数の話者によるノイズ干渉の課題に対する解決策としてDNNアルゴリズムの可能性を示しています。


リンク先はscientific reportsというサイトの記事になります。(原文:英語)
Back to blog

Leave a comment