音声認識と環境音認識のバランスをとるための最適な音声対背景比

要約

目的
この研究の目的は、健聴者（NH）と聴覚障害者（HI）のリスナーが、音声と環境音が混在する状況で、両方の信号を認識できる音声対背景音声比率（SBR）を決定することでした。また、個々の音が音声認識と環境音認識（ESR）に与える影響、およびこれらのタスクにおける分割された対選択的注意の影響も調査しました。

デザイン
実験1（分割された注意）では、11人のNHリスナーと10人のHIリスナーが、さまざまなSBRで環境音と混在した文章を聞き、各試行で同時に音声認識とESRのタスクを実行しました。実験2（選択的注意）では、20人のNHリスナーがこれらのタスクを別々の試行で実行しました。各タスク、リスナーグループ、および環境音について、心理測定関数が生成されました。音声認識とESRの両方が高い範囲、およびそれぞれの対応する心理測定関数の交点として定義される認識とESRのバランスをとるための最適なSBRが決定されました。

結果
NHリスナーは、SBRが約20 dB以上の範囲で同時音声認識とESRの両方が95%以上の正確度で達成しました。NHリスナーの音声認識とESRを最大化するための最適なSBRは、約+12 dBでした。一方、HIリスナーは、両方のタスクで95%のパフォーマンスが観察された範囲がはるかに小さく（1 dBの範囲）、最適値は+5 dBでした。音響分析によれば、リスナーの聴力状態に関係なく、音声と環境音の刺激は同様に聞こえやすかったが、音声の方が環境音よりも変動が大きかった。分割された対選択的注意条件は、性能の差を生じさせましたが、統計的に有意でありながらわずかな差でした。すべての条件および両リスナーグループにおいて、同じ強度で提示されたとき（つまり、0 dB SBR）、環境音の方が音声よりも高い認識が得られました。これは、環境音が音声のマスカーとしてより効果的であることを示しています。この研究で使用された25の環境音のうち（1つを除く）、音声認識とESRの両方が95%以上であるSBRの範囲が存在しました。これらの範囲は大部分が重なっていました。

結論
NHおよびHIリスナーの両方において、音声と環境音が高い精度で同時に認識されるSBRの範囲が存在しますが、この範囲はNHリスナーの方が広いです。音声認識とESRを共に最大化するための単一の最適なSBRも、NHとHIリスナーで異なります。環境音の音声に

著作権 © 2024 Wolters Kluwer Health, Inc. すべての権利を保有します。

リンク先はEAR and HEARINGというサイトの記事になります。（原文：英語）

https://journals.lww.com/ear-hearing/abstract/9900/the_optimal_speech_to_background_ratio_for.287.aspx

Back to blog

Item added to your cart

音声認識と環境音認識のバランスをとるための最適な音声対背景比

Leave a comment