В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик | К списку авторов | К списку публикаций
А.С. Чижов
Директор по развитию продуктов ITV
Компьютерное зрение - тема не только интересная сама по себе, но и важная для развития рынка охранного видеонаблюдения, где уже стало привычным словосочетание "интеллектуальное видеонаблюдение". Информация, получаемая в результате обработки видеоданных математическими алгоритмами, позволяет по-новому строить логику работы всего охранного видеонаблюдения, меняя отношение к системам безопасности в целом и превращая их из простого подспорья охранной службы в решения, сосредоточившие в себе новейшие достижения науки
Компьютерное зрение -направления исследований
Компьютерное зрение - это теория и технология создания машин, которые могут видеть, как мы с вами. Это направление динамично развивается и совершенствуется, и машина, которой является компьютер, извлекает все больше информации из поступающего к ней изображения, отделяя полезные данные от помех: вот дерево, на нем есть ветви, которые раскачивает ветер, - это неинтересная для нас информация, а вот человек, проходящий рядом с этим деревом, - важный объект с точки зрения охранного видеонаблюдения.
С другой стороны, компьютерное зрение - это любая форма обработки графической информации, которая может быть представлена как статическим изображением - одним кадром, так и последовательностью кадров, меняющихся во времени, - видеозаписью. Особый интерес представляют алгоритмы, использующие в качестве источника данных несколько видеопотоков, поступающих от различных камер. Результатом компьютерного зрения может являться не только видоизмененное видеоизображение, но и список значений некоторых параметров изображения. Например: "красный объект размером 20x20 пикселей в левом нижнем углу кадра" - для одного кадра или "красный объект размером 20x20 пикселей пересекает кадр слева направо со скоростью 50 км/ч" - для видеозаписи. Эти данные могут использоваться в дальнейшем для построения логики работы интеллектуальной системы видеонаблюдения.
Три основных направления исследований и разработок в сфере компьютерного зрения показаны на рисунке. Конечно, существует множество смежных областей, которые мы также будем стараться не упускать из вида: системы управления процессами (конвейер по сборке автомашин), системы организации информации (индексация баз данных изображений), системы моделирования объектов или окружающей среды (анализ медицинских изображений, топографическое моделирование), системы взаимодействия (например, устройства ввода для системы человекомашинного взаимодействия или управление курсором на экране с помощью взгляда) и др.
Существует множество методов для решения различных, строго определенных задач компьютерного зрения. Эти методы часто зависят от данных задач и редко используются для широкого круга задач. Многие из методов и приложений еще находятся в стадии фундаментальных исследований, но все большее их количество находит применение в коммерческих продуктах, где они составляют часть системы, решающей сложные задачи.
Итак, разберем три направления компьютерного зрения подробнее.
Распознавание образов
Распознавание образов может использоваться в системах видеонаблюдения (простейшие детекторы, определение цветов объектов, детектор трекинга и оставленных предметов, детектор лиц, LPR и др. - см. таблицу), в технической диагностике, прогнозировании и диагностике в медицине, в планировании, поиске в геологии, прогнозировании в химии. Причем это лишь вершина айсберга, основная часть которого связана с автоматизацией последующего интеллектуального анализа контента, полученного с помощью важных инструментов - методов распознавания образов, которые развиваются с конца 1970-х гг. Актуальность данной проблемы обусловлена, в первую очередь, бурным ростом объемов получаемой информации, необходимостью в качественной, максимально быстрой и полной ее обработке, а также в решении проблем хранения и передачи этой информации в сжатой форме. Данная тематика привлекает большое число исследователей, однако подавляющее большинство работ в этой области имеет эмпирический характер.
До сих пор по большей части применяются методы обработки изображений, заимствованные из области цифровой обработки сигналов, и традиционные математические методы, главным образом статистические. Известны публикации, посвященные возможностям расширения, применяемого при анализе изображений математического аппарата (например, использования вейвлетов), а также методам и аппарату математической теории распознавания.
Обработка и анализ считаются во всем мире актуальным и перспективным направлением исследований. Сравнительно недавно замечен курс на разделение задачи распознавания изображений: на задачу приведения изображений к удобному для распознавания виду и задачу распознавания. В связи с этим возникла потребность в разработке методов и средств построения формальных описаний изображений - метрик. Примером тому могут служить современные системы машинного зрения, которые позволяют в реальном времени получать трехмерные портреты человеческих лиц в виде облака точек. Задача их анализа при биометрической идентификации требует введения метрики для сравнения портретов.
Анализ изображения
Включение в разработки компьютерных систем видеонаблюдения алгоритмов, отвечающих за получение высокоуровневой информации из видео, несомненно, продвинет эти системы далеко вперед. Это направление активно развивается на рынке безопасности, ведь именно видеоанализ отвечает, к примеру, за обнаружение в реальном времени людей, удаляющихся от камеры или приближающихся к ней, и отличает это событие от любого другого изменения пикселей изображения на экране. Анализ изображения классифицирует данные пиксели, то есть позволяет идентифицировать не только признак, но и характер движения, а также однозначность типа объекта, который из этих пикселей состоит.
При последующем просмотре архива может применяться постпроцессинг (обработка и поиск уже произошедших событий) с целью сокращения времени и повышения качества поиска, понимания того, когда наступило событие и какого оно рода.
Еще одно очень перспективное направление анализа изображения - реконструкция формы и свойств объекта по набору кадров. Это значит, что, имея видео реального объекта, можно реконструировать его форму и представить объект в виде набора треугольников. Причем алгоритмы, используемые при этом, могут напоминать принципы работы связки человеческого глаза и мозга. Правда, задача автоматической реконструкции столь сложна, что пока даже самые современные алгоритмы компьютерного зрения работают только в определенных условиях, причем достаточно неустойчиво, и даже в этих случаях восстановление точной формы объектов в настоящее время практически невозможно. Однако дальнейшее развитие этого направления, без сомнения, принесет огромные дивиденды отрасли интеллектуального видеонаблюдения.
Обработка изображений
В настоящее время область обработки видеоинформации, как и два других направления компьютерного зрения, переживает бурный период развития. К этой области относятся самые разнообразные задачи. Среди них можно назвать вопросы оценки параметров движения снимающей камеры и перемещающихся объектов, проблемы распознавания и совмещения изображений и сцен.
Итог
В завершение остановимся на вопросах построения автоматических и автоматизированных систем компьютерного зрения и применения к нему алгоритмов. При построении систем видеонаблюдения реального времени одной из ключевых проблем является достижение высокой скорости обработки изображений с сохранением качества получаемого результата. Однако существует ряд сложностей, связанных с эффективным распараллеливанием вычислений на несколько потоков при программной реализации алгоритмов, а также трудности аппаратной реализации на высокопроизводительных вычислительных системах. Качество результата напрямую зависит от производительности программы и аппаратной платформы, поэтому высококачественная реализация универсального алгоритма приведет к сильному удорожанию системы. Многие производители подобного ПО выходят из ситуации, адаптируя алгоритмы под конкретные задачи и различные аппаратные платформы с целью оптимизации по скорости, игнорируя универсальность. Это, в свою очередь, может привести к некоторой путанице - алгоритмы с одинаковым названием от разных производителей могут работать совершенно по-разному!
И все-таки, несмотря на сложности, сегодня на рынке существует множество компаний, которые уже начали применять "математику" - мне известно порядка 50. Использование таких алгоритмов - это движение в будущее. Благо задачи для систем видеонаблюдения постоянно усложняются, спрос на интеллектуальные системы постоянно растет, и уже совсем скоро никого не устроит задача "тупо смотреть в монитор".
Опубликовано: Журнал "Системы безопасности" #2, 2008
Посещений: 19911
Автор
| |||
В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик | К списку авторов | К списку публикаций