Контакты
Подписка
МЕНЮ
Контакты
Подписка

Смартвидео: системы интеллектуальной обработки видеоинформации. Технологии распознавания лиц

В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик  |  К списку авторов  |  К списку публикаций

И.В. Богданов
Директор департамента исследований компании ISS

Смартвидео: системы интеллектуальной обработки видеоинформации.
Технологии распознавания лиц

Количество видеокамер наблюдения увеличивается из года в год, приводя к лавинообразному росту загруженности центров мониторинга. Современные компьютерные системы видеонаблюдения обеспечивают мгновенный доступ к данным, поступающим с десятков, сотен и даже тысяч видеокамер. Но беда в том, что все эти гигабайты и терабайты информации зачастую лишь занимают место на дисках и востребованной бывает лишь очень малая часть данных

Cледить за потоком данных, поступающих в реальном времени одновременно из многих источников, очень проблематично и недешево. Одним из наиболее перспективных направлений в области видеонаблюдения является создание автоматизированных компьютерных систем интеллектуальной обработки видеоинформации, выполняющих всю рутинную работу без вмешательства человека, которому остается лишь принимать решения. Такие системы позволяют сократить объемы поступающей к оператору информации и более эффективно использовать человеческие ресурсы. Они позволяют отслеживать движущиеся объекты, классифицировать их, анализировать траектории их движения и поведение людей, обнаруживать оставленные предметы, производить в автоматическом режиме идентификацию транспортных средств и их государственных номеров, идентифицировать лица и производить многие другие действия. Эффективность применения таких систем настолько высока, что для них даже был введен специальный термин: "смартвидео". Эта статья посвящена возможностям одной из наиболее впечатляющих составляющих современных технологий смартвидео - системы захвата и распознавания лиц.

Как работают системы захвата и распознавания лиц

Компьютерные системы распознавания лиц позволяют быстро и с достаточной достоверностью производить сравнение лиц и поиск похожих образцов в многомиллионных базах данных. Человеку порой бывает нелегко с достоверностью определить сходство лица человека с его фотографией в паспорте, особенно если этот человек принадлежит к другой национальной (расовой) группе. Так, например, европейцу очень трудно идентифицировать азиата, и наоборот. Компьютерные системы могут в короткий срок решить эту задачу без участия человека или предложить оператору возможность самостоятельного сравнения, но не со всеми хранящимися в базе данными, а только с немногочисленной выборкой, наиболее соответствующей запросу.

Существует несколько классов таких систем:

  • системы, позволяющие сравнивать фотографии из паспорта и реальное изображение человека, требуют присутствия оператора, позволяют производить операции в полуавтоматическом режиме. Необходимое условие для успешного сравнения изображений - сотрудничество со стороны исследуемой персоны (установленное поведение перед камерой, позволяющее произвести качественный захват лица). Время поиска - в пределах от нескольких секунд до нескольких минут.

  • системы, осуществляющие контроль доступа путем сравнения изображения лица человека и изображения из базы данных, как правило, требуют дополнительных методов верификации (по проксимити-карте, по отпечаткам пальцев, по голосу и т.п.). Они могут функционировать в автоматическом режиме, требуют сотрудничества со стороны объекта исследования (предъявления проксимити-карты, фиксации перед камерой). Время сравнения составляет несколько секунд.

  • системы идентификации личности по видеоизображению позволяют идентифицировать движущиеся лица, производя поиск, отслеживание и сравнение с базой данных в реальном времени. Они могут быть установлены для мониторинга в общественных местах, позволяя идентифицировать людей в толпе и т.д. Идентификация не требует участия исследуемой персоны и может производиться скрытно. Есть возможность работы в автоматическом режиме, обрабатывая поступающую видеоинформацию и предоставляя результаты в течении 1-3 секунд.

Давайте попробуем разобраться, как работают подобные системы. Происходящий в них технологический процесс может быть разбит на несколько этапов. Для большей ясности рассмотрим каждый из них отдельно.

Поиск лица на изображении

На этом этапе производится поиск лица на изображении с целью его дальнейшего распознавания. Для выделения области лица существует несколько способов:

  • выделение областей изображения, близких по цвету к коже и образующих область, схожую с лицом по пропорциям. Достоинства: простота реализации, быстрая работа алгоритма. Недостатки: работе алгоритма мешают сильные вариации в цвете кожи у разных людей и сильно неравномерное освещение лица.

  • выделение контуров на изображении, последующая аппроксимация контуров овалом с заданными параметрами погрешности и трактовка данной области как лица при успешной аппроксимации. Достоинства: алгоритм работает при нефронтальном позиционировании лица. Недостатки: низкая устойчивость к шуму.

  • выделение симметрий на изображении с нейросетевой классификацией. Недостаток у подобных систем только один: они требуют наличия у производителя специальных наукоемких технологий, которые возможно создать только после многих лет целенаправленной работы. Достоинства: устойчивость к шуму и неравномерной засветке лица.

Алгоритм выделения лица должен соответствовать условиям эксплуатации системы. В охранных системах используются стандартные CCTV-камеры, очень часто эксплуатация происходит при низком освещении и, как следствие - высоком уровне шума. Стандартные камеры имеют низкое разрешение, не всегда достаточное для выполнения требований к надежности захвата лица. При выборе системы нужно учитывать, какой класс алгоритмов использует данный продукт.

Трекинг лица между кадрами видеопотока

В системах обработки видеоизображения такили иначе имеются схемы трекинга: отслеживания перемещения лица между кадрами для выбора оптимального ракурса и качества изображения. При работе с видеопотоком изображения поступают с частотой 25 кадр/с.Такая частота смены ракурса крайне неудобнадля оператора и сводит на нет экономию размера архива. Поэтому система должна из всей последовательности выбрать 1-2 ракурса и предоставить оператору по одной фотокарточке на человека. Для этого используются алгоритмы аппроксимации и предсказания вектора движения или корреляционные алгоритмы. В случае с видеопотоком возможны комбинации вышеперечисленных методов с межкадровым анализом и т.п. Существует достаточное количество хорошо зарекомендовавших себя методов, однако не все они подходят для систем, работающих в реальном времени

Поиск основных признаков лица

Следующим этапом процесса идентификации является поиск на изображении основных признаков лица, таких, как глаза, нос, рот и т.д. Для этого могут быть использованы многие из вышеперечисленных алгоритмов.

После того как найдены основные признаки, изображение лица приводится к стандартному виду: масштабируется, разворачивается, в некоторых случаях также определяется положение (фас, 3/4 или точные 3D-координаты). Изображение корректируется; нормализуются яркость, контрастность.

Непосредственное сравнение полученного изображения с другими ресурсоемко и неэффективно, поэтому из него, как правило, выделяют характерные признаки и преобразуют его в другую, более подходящую для сравнения форму: в вектор малой размерности или в граф.

Сравнение полученного представления изображения с существующей базой данных

Последним этапом обработки изображения является сравнение полученного представления с имеющимися в базе данных (идентификация) или сравнение "один-к-одному" (верификация).

Практика применения систем захвата и распознавания лиц

В настоящее время системы захвата и распознавания лиц окружены ореолом различных мифов. Специалисты в области компьютерного зрения с пеной у рта спорят о надежности процедуры верификации лиц. Многие считают системы распознавания лиц скорее атрибутом фантастических фильмов, чем реально работающими технологиями. Однако уже в настоящее время существует ряд объектов с успешно внедренными на них автоматическими системами захвата и распознавания лиц в реальном времени. Таким образом, проблема внедрения таких систем все еще требует детального разбора с приведением примеров.

Прежде всего разделим задачи систем распознавания лиц на две группы, каждая из которых обладает самостоятельной ценностью. Первая группа - захват лиц в потоке людей и ведение по ним базы данных. Можно считать, что уже сейчас эти задачи имеют надежное технологическое решение, с чем врядли кто-нибудь из специалистов будет спорить. Вторая группа задач - автоматическая верификация - сейчас также вполне решаема на практике, хотя и не однозначна. Например, едва ли можно в настоящее время рекомендовать подобные системы для реализации автоматического доступа на особо важные объекты: вероятность ложной несработки слишком велика для данного типа задач. Однако представьте себе другую ситуацию: система захвата и верификации лиц установлена в мониторинговом центре, осуществляющем слежение (при помощи оператора, разумеется) за местами массового скопления людей, холлами крупных отелей, залами ожидания аэропортов и железнодорожных вокзалов и им подобными. Даже если система всего лишь поможет обратить внимание оператора на какие-либо лица, обладающие сходством с имеющимися в базе данных, это существенно увеличит оперативность реагирования с целью предотвращения опасных ситуаций. Для решения задач данного типа системы распознавания лиц не только необходимы, но и уже сейчас вполне могут быть реализованы на практике. Примеры из жизни способны доказать то и другое.

Пример первый: Palace Hotel, Нью-Йорк

Установленная система распознавания лиц обслуживает 96 камер со скоростью 5 кадр/с на один видеоканал (такая скорость работы была специфицирована службой безопасности гостиницы), для чего используются 3 видеосервера. Система осуществляет захват лиц и сравнение их с изображениями, имеющимися в базе данных полиции Нью-Йорка. При обнаружении сходства сравниваемых изображений оператору выдается предупреждающий сигнал, после чего служба безопасности гостиницы проводит тщательную проверку данной ситуации.

Пример второй: Железнодорожная станция TaiYuan City, Китай

Установленная система захвата и распознавания лиц обслуживает все камеры железнодорожной станции, передавая результат обработки видеоинформации на большой экран центра мониторинга. Система настолько успешно себя зарекомендовала, что ее работе была посвящена специальная статья в одной из центральных газет КНР.

Опубликовано: Журнал "Системы безопасности" #5, 2004
Посещений: 13092

  Автор

Богданов И. В.

Богданов И. В.

Директор департамента исследований компании ISS

Всего статей:  4

В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик  |  К списку авторов  |  К списку публикаций