Программное обеспечение адаптирует речь к уровню окружающего шума

Если мимо проезжает грузовой поезд, пассажиры обычно понимают только половину объявления, такого как «Поезд во Франкфурт-на-Майне сегодня отправляется с платформы…."Исследователи из находящейся в Ольденбурге проектной группы по слуховым, речевым и аудиотехнологиям Института цифровых медиа-технологий им. Фраунгофера IDMT разработали программное обеспечение, которое значительно улучшает разборчивость речи – даже для голосов выступающих на конференциях или разговоров по мобильным телефонам.
Микрофон анализирует уровни шума

Уловка программного обеспечения ADAPT DRC заключается в том, что окружающий шум постоянно анализируется с помощью микрофона, и речь подстраивается под него в реальном времени. «Недостаточно просто сделать голос громче через громкоговоритель или мобильный телефон, чтобы заглушить шум», – говорит руководитель проекта д-р. Ян Реннис-Хохмут.

Такие технологии уже используются сегодня в автомобильных радиоприемниках, делая голос громче, но не обязательно более понятным, потому что на большой громкости динамики достигают предела и начинают дребезжать. «Речь намного сложнее», – говорит Реннис-Хохмут.
Во-первых, важно целенаправленно усилить определенные высоты звука, частоты. Гласные – это относительно глубокие, длинные компоненты слова, которые легко понять. Однако согласные, такие как «п», «т» и «к», очень короткие и имеют более высокие частоты.

Несмотря на то, что они очень важны для понимания сказанного, как правило, их непросто понять в шумной обстановке. Например, согласные влияют на то, думает ли адресат, слушающий объявление на немецком языке, что он слышал слово «Kasse» или «Tasse» (на английском языке, «checkout» или «cup»). «Наши алгоритмы могут определять приоритеты определенных частот и в нужное время усиливать именно те, которые особенно нарушены окружающим шумом», – добавляет Реннис-Хохмут.

Усиление компонентов тихой речи
Во-вторых, программа учитывает те части речевого сигнала, которые имеют разную громкость. Поскольку разговорный язык состоит из громких и тихих частей, эксперты используют термин «динамика голоса».«Разборчивость речи повышается, особенно когда громкие части систематически приглушаются, а тихие – специально усиливаются.

Этот метод называется сжатием динамического диапазона (DRC). Это также интересно, если, например, вы звоните по мобильному телефону, находясь на шумной улице.

Программное обеспечение ADAPT DRC уже разработано до уровня зрелости приложений и доступно для промышленных партнеров. Поскольку современное конференц-оборудование или мобильные телефоны уже имеют встроенные микрофоны, устройства уже обладают технологией, необходимой для записи окружающего шума.

Для акустических систем на вокзалах или в аэропортах сначала необходимо установить дополнительные микрофоны.