Контакты
Подписка
МЕНЮ
Контакты
Подписка

Влияние шумоочистки на результаты последующего идентификационного исследования

В рубрику "Специальные технические средства" | К списку рубрик  |  К списку авторов  |  К списку публикаций

С. Коваль
Г. Зубов
Центр речевых технологий, Санкт-Петербург

Влияние шумоочистки на результаты последующего идентификационного исследования

Записанный звуковой сигнал всегда в той или иной степени отличается от оригинального. Поэтому часто возникает потребность в проведении шумоочистки - специальной обработки звукового сигнала, главной целью которой является доведение качества и разборчивости записанной речи до уровня, приемлемого для комфортного прослушивания и понимания фонограммы.

Очевидно, что процедура шумоочистки изменяет исходный звуковой сигнал, в силу чего у некоторых специалистов возникают сомнения в возможности последующей идентификации личности по записанной речи.

Однако исходя из содержания используемых алгоритмов шумоочистки можно обоснованно утверждать, что влияние шумоочистки на речевой сигнал вполне сопоставимо с влиянием на него стандартных средств звукозаписи и звукопередачи. Поэтому логично будет предположить, что идентификационное исследование возможно и после контролируемых преобразований сигнала, приводящих к устранению или снижению негативного влияния шумов и искажений.

Утверждение о том, что любая шумоочистка и идентификация вообще несовместимы, является некорректным. В каждом частном случае шумоочистки используются конкретные, отличные от аналогов параметры и преобразования сигнала.

Общий подход к оценке допустимости использования шумоочистки

Процедуру оценки допустимости можно производить поэтапно:

  1. Выделение параметров и свойств речевого сигнала, которые могут быть использованы в последующей процедуре идентификации.
  2. Составление представления о том, как применяемый способ обработки сигнала изменяет или может изменить именно эти параметры речевого сигнала.
  3. Выбор таких установок и режимов преобразования сигнала, которые не оказывают существенного влияния на измеряемые параметры сигнала либо могут быть учтены при дальнейшем исследовании.

Наиболее важными критериями пригодности фонограмм для проведения идентификационных исследований являются:

  • отношение сигнал/шум;
  • разборчивость реплик;
  • степень выраженности спектральных признаков речи;
  • достоверность и качество отображения индивидуальных признаков речи.

Улучшить качество звука на фонограмме по трем первым критериям зачастую возможно только при использовании шумоочистки. Вероятно, сомнения в допустимости использования шумоочистки могут относиться к соответствию обработанной фонограммы последнему из перечисленных критериев.

Условия допустимости использования шумоочистки

Базовое правило, которому нужно следовать при проведении обработки фонограммы, состоит в том, что в случае малейшего сомнения в результатах измерений после выполнения процедур шумоочистки эти измерения необходимо производить на исходном, не прошедшем обработку сигнале. Например, это относится к форманто-спектральным особенностям речи, к содержанию установленных реплик, к индивидуальным признакам голоса.

Можно утверждать, что большинство способов и алгоритмов шумоочистки при их грамотном использовании сохраняют существенную для идентификации личности информацию. Это касается прежде всего алгоритмов спектральной фильтрации, двухканальной адаптивной фильтрации и адаптивного спектрального выравнивания, удаления шума на основе спектральных эталонов. Алгоритмы адаптивной фильтрации не мешают идентификации в случае фиксирования характеристик фильтра или в случае, когда значение постоянной времени изменения характеристик фильтра установлено существенно выше характеристической постоянной времени речевого сигнала.

Поясним более детально особенности фильтров различных типов по отношению к шумоочистке. Фильтры, имеющие постоянные характеристики, вносят в сигнал искажения, которые либо несущественны для последующих измерений, либо могут быть легко учтены с помощью соответствующих поправок. Субъективное качество речи после прохождения сигнала через постоянные фильтры меняется. Однако если фильтр построен корректно и речь после фильтрации становится более нормативной по своим основным характеристикам, то оценки идентификационно значимых признаков голоса и речи будут более достоверными. Кроме того, согласно современным научным воззрениям восприятие речи в основном опирается на динамические, быстро изменяющиеся свойства сигнала и, как правило, слабо зависит от постоянной характеристики канала звукопередачи при условии относительной нормативности этой характеристики. Обычно для большей стабильности слухового сравнения голосов на двух различных фонограммах их следует сводить к одному типу представления обработанного сигнала. Например, перед слуховым сравнением рекомендуется выполнять процедуру инверсной фильтрации исследуемых фонограмм.

Адаптивные фильтры с переменными свойствами могут внести в динамику свойств сигнала нежелательные изменения, поэтому их необходимо применять более осторожно и умело. Для большинства таких фильтров предполагается, что устраняемая фильтром помеха меняется медленнее, чем речевой сигнал. Адаптивный фильтр, в зависимости от типа своего устройства, удаляет стационарные или медленно меняющиеся гармонические, регулярные помехи, широкополосные шумы, неравномерности АЧХ канала звукозаписи. Обычно все измеряемые и используемые при идентификации признаки речевого сигнала связаны с реализацией отдельных звуков и характерными изменениями сигнала при переходе от одного звука к другому. В свою очередь, адаптивный фильтр при большой постоянной времени адаптации на протяжении каждого слова и даже короткой фразы не меняет своих свойств, то есть не вносит изменений в динамику спектров. Стоит отметить, что речь, не относящаяся к нормативной (например, пение), требует скорректированного подхода к выбору параметров шумоочистки.

Степень влияния той или иной процедуры шумоочистки на последующие идентификационные исследования зависит от конкретного метода идентификации. Так, например, в автоматизированной системе "Диалект" в рамках интегрального анализа используются средние значения энергии сигнала в спектральных полосах и другие, близкие к ним по природе спектральные характеристики. В связи с этим применение даже простых эквалайзеров с относительно большими перепадами вносимой спектральной коррекции АЧХ, а также любых адаптивных и неадаптивных фильтров может существенно повлиять на конечный результат измерений. Однако и в этом случае умелое применение средств шумоочистки позволяет повысить надежность получаемых результатов.

В заключение следует подчеркнуть, что изменения, которые речевой сигнал претерпевает в процессе шумоочистки, являются вполне предсказуемыми и управляемыми и могут быть учтены при последующем идентификационном исследовании.

Опубликовано: Журнал "Системы безопасности" #6, 2004
Посещений: 15996

  Автор

 

С. Коваль

Центр речевых технологий, Санкт-Петербург

Всего статей:  1

  Автор

 

Г. Зубов

Центр речевых технологий, Санкт-Петербург

Всего статей:  2

В рубрику "Специальные технические средства" | К списку рубрик  |  К списку авторов  |  К списку публикаций