В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик | К списку авторов | К списку публикаций
Ю.М.Гедзберг
Генеральный директор ООО "Мост Безопасности"
"Замкнутый" или "закрытый"?
Для начала стоит заметить, что традиционный перевод термина Closed Circuit Television - "система замкнутого телевидения" - едва ли можно считать удачным. Замкнутым, в смысле локальной передачи видеосигналов, оно с самого начала не было (использовались и радиоканал, и телефонный канал), да и промышленное телевидение было таким же "замкнутым". Думается, что "closed" в данном случае ближе к понятию "закрытый", в том смысле, какими бывают закрытые архивы, закрытая переписка - одним словом, специальная техника, закрытая от посторонних глаз. Другое дело, что первоначально системы охранного телевидения строились таким образом, что сигналы от видеокамер действительно замыкались на один пост охраны, где и осуществлялась их обработка.
Централизованные системы
Бурное развитие охранного телевидения инициировалось появлением доступных и технологичных видеокамер на ПЗС-матрицах. Для построения систем был использован существовавший стандарт вещательного телевидения, рассчитанный на эмоциональное воздействие на зрителя, тогда как задачей охранного телевидения является непрерывная выработка суждения об уровне опасности на охраняемом объекте. Со временем это различие задач стало проявляться все сильнее. Изначально при организации охранного телевидения было представление о том, что оператор охраны находится в комфортном, безопасном месте и, не покидая его, может получать визуальную информацию о ситуации на охраняемом объекте. Сигналы от видеокамер могут коммутироваться поочередно, либо может использоваться их мультиплексирование. В первом случае образуется неконтролируемое время, во втором - движение на экране видеомонитора становится прерывистым. В любом случае происходит потеря информации (невозможно без потерь "втиснуть" в один стандартный видеосигнал стандартные сигналы от нескольких видеокамер). Для уменьшения потерь и нформаци и в тревожной ситуации изображение и видеозапись зоны, где сработал тревожный извещатель, могут обновляться с большей скоростью (организация приоритетов). Однако при этом сигналы от других видеокамер будут обновляться реже, поскольку общая скорость мультиплексированного потока не может превышать стандартные 25 кадр/с. Использование компьютерных систем охранного телевидения, а также видеорегистраторов, осуществляющих запись в режиме реального времени, позволило преодолеть это ограничение. Скорость обновления информации определяет длину условно мертвой зоны, она напрямую связана со скоростью пересечения людьми сектора обзора видеокамеры. Обнаружив на экране тревожную ситуацию, оператор может выслать к месту тревоги сотрудников охраны. В частности, пресечение попытки проникновения через бетонный забор с колючей проволокой возможно за 18 с, так что, если работники охраны могут выдвигаться к месту тревоги со скоростью 10 м/с, то на расстоянии от поста охраны, не превышающем 180 м, они способны гарантированно пресекать действия нарушителей. Видеокамеры, размещенные для наблюдения за обстановкой на существенно большем расстоянии, могут использоваться лишь для констатации происходящего.
Глаза далеко от мозга
Одновременно с желанием контролировать обстановку сразу в нескольких местах реализуется и задача наблюдения за удаленными зонами. В отличие от организации зрения че-ловека, у которого мозг и глаза размещены достаточно компактно (рис. 1), "глаза" системы охранного телевидения бывают значительно удалены от "мозга" системы (рис. 2). Плата за такое решение - необходимость организации канала для передачи сигнала от видеокамеры и осознание того, что это всегда сопряжено с какой-то потерей информации (за счет активных потерь и искажений спектра передаваемого видеосигнала, влияния шумов и наводок, оцифровки). Перспективное решение - передача сигналов от камер в цифровой форме, то есть использование IP-видеокамер и видеосерверов (рис. 3). В этом случае к тому же реализуется распределенная структура, позволяющая легко модифицировать организацию видеонаблюдения и видео-регистрации на различных компьютерах объекта. Для уменьшения трафика при передаче по компьютерной сети и уменьшения места на диске при регистрации используется сжатие видеопотоков. Недостатком такого подхода оказывается то, что на вход компьютера видеопоток от IP-видеокамеры поступает после компрессии, а значит, в компьютере невозможно использовать детектор движения, видеоанализ изображений.
Детекторы движения
Насколько важно последнее замечание? В настоящее время возможности детекторов движения достаточно скромны, пожалуй, эти
приборы хорошо работают лишь в условиях стабильной освещенности. Их удобно использовать для экономии места на жестком диске при записи, например, в момент открывания двери (хотя, заметим, магнитоконтактный извещатель тоже неплохо справляется с подобной задачей). Эти детекторы могут использоваться для поиска записей в архиве. Настораживает другое - несмотря на подробно описанные в рекламных проспектах возможности детекторов движения (отстройка от облаков, снега, падающей листвы, выбор направления движения, селекция по размеру, скорости и пр.), до сих пор отсутствуют триумфальные пресс-релизы о практическом использовании детекторов движения, например, для охраны периметров серьезных объектов. Можно только приветствовать работы по совер-шенствованию детекторов движения, детекторов оставленных или унесенных предметов, однако следует отдавать отчет в том, что интеллект человека (как охранника, так и злоумышленника) будет еще долгое время оставаться намного более совершенным инструментом, чем интеллект детектора движения. Компания Sony предложила технологию DEPA, при которой работа детекторов движения происходит на несжатом видеопотоке: детектор движения расположен в самой IP-видеокамере. При срабатывании детектора IP-видеокамера посылает в компьютер сообщение, в результате чего компьютер может инициализировать передачу информации из IP-видеокамеры; такое решение позволяет существенно снизить трафик. Возникает вопрос: а если детектор движения работает некорректно? И как быть, когда ситуация в кадре все время меняется? Рассмотрим зоны видеонаблюдения, величина которых зависит от активности в поле зрения видеокамеры.
Зона "А": люди могут быть
Зоной "А" назовем область, где перемещение людей, транспорта - это обычное и ожидаемое явление (супермаркеты, стадионы, вокзалы). Для анализа изображений необходимо постоянное участие человека, и только он может справиться с задачей выявления тревожной ситуации в этой зоне: использование здесь детектора движения малоэффективно. Действительно, никто не заменит человека в принятии решения. Только человек может увидеть, куда покупатель кладет банку пива - в корзину или за пазуху, радостно обнимаются болельщики или дерутся и т.д. Здесь, чем подробнее визуальная информация, тем легче и раньше можно обнаружить нештатную ситуацию и тем проще анализировать видеозапись. При этом компрессия изображения, увы, эффективности работе оператора не прибавляет. Если ракурс видеокамеры в контролируемой зоне выбран правильно (в поле зрения не попадает большая часть потолка или неба), то это значит, что практически каждый пиксель изображения в любой момент времени может изменять свою яркость произвольным образом (люди движутся в пределах всего изображения). Например, если ПЗС-матрица видеокамеры содержит m * n пикселей, а каждый пиксель условно может принимать одно из k градаций яркости, то максимальное количество информации в одном полном кадре видеосигнала равно i = log2(m * n * k) [бит] (1)
В любой другой точке данного канала видеосистемы количество информации может быть только меньше. Поток информации равен
Р = i - v, (2)
где v - скорость обновления информации (кадр/с), а объем полученной оператором информации равен V = i-vt, (3) где t - время наблюдения, необходимое оператору для принятия решения.
Количество информации, поступающей к оператору, определяется качеством изображения каждой зоны и количеством одновременно просматриваемых зон.
Если качество изображения недостаточно высокое (мало информации i в кадре или мала скорость обновления v), то оператор вынужден накапливать информацию (чтобы получить необходимый для принятия решения объем информации), то есть всматриваться в мелкое, с артефактами компрессии, малоконтрастное, прерывистое, зашумленное, расфокусированное изображение в течение большего времени t, а это ведет к задержке оперативного реагирования на возможные угрозы. Иначе говоря, оператору должно предъявляться качественное (а значит, достаточно информативное) изображение.
Переход количества в качество
Один из основных показателей качества изображения - разрешающая способность (чем больше количество телевизионных линий, тем различимее мелкие детали). Сколько должно быть ТВЛ? Напрашивается ответ: "Как можно больше!".
Но ведь даром ничего не бывает. Увеличение разрешающей способности ведет к повышению объема передаваемой информации, а значит, потребует канала с большей пропускной способностью. Одну мегапиксельную видеокамеру можно использовать для распознавания автомобильных номеров, например, не по одной, а сразу по нескольким полосам движения; но не следует забывать, что полезной информацией в кадре являются номерные знаки, так что придется передавать много избыточной информации. Наверное, можно сказать, что важна не максимально достижимая разрешающая способность, а такая, которая бы при выбранном угле обзора и точке установки видеокамеры обеспечивала бы необходимое количество телевизионных линий, приходящихся на изображение лица человека, государственного номерного знака автомобиля и пр. Видеосистема должна состоять из определенного числа оптимально установленных и настроенных видеокамер, гарантирующих видеозапись любого предмета с заданными размерами на заданном расстоянии с определенной степенью вероятности. Если это требование не выполняется - надо ставить еще одну камеру, использовать другой объектив и пр. И тогда не будет мелких деталей, потерянных после компрессии. Потому что мелких деталей на экране не должно быть по определению: если они важны, то на экране они должны быть до-статочно крупными. Это всего лишь психологическая ловушка, в которую мы сами себя загоняем - до бесконечности стремиться видеть как можно больше: а вдруг когда-нибудь понадобится. Думается, задачу охранного телевидения можно сформулировать следующим образом: предоставление оператору оптимального потока информации для обоснованного принятия им решения с минимальной вероятностью ошибки.
Если ограничений на количество передаваемой информации из одной зоны (то есть качество изображения), с точки зрения работы оператора, не существует, то предъявление оператору чрезмерно большого числа изображений раз-личных зон чревато задержкой реакции на тревожное событие и даже пропуском сигнала тревоги, поскольку в этом случае количество обрабатываемой оператором информации не растет, а падает. Согласно известному принципу Мил-лера, кратковременная память человека может запомнить и повторить только 7+2 элементов. Поэтому система охранного телевидения должна содержать не максимально возможное количество видеокамер, а минимально необходимое. В системе должно быть не максимальное число мониторов и изображений на нем, а лишь такое, с которыми оператор может эффективно работать.
Зона "B": людей не должно быть
Зоной "В" назовем область, где не должно быть перемещения людей или транспорта, а несанкционированное вторжение в охраняемую зону оператор должен трактовать как тревогу. Возможно два режима работы оператора:
В первом случае оператор постоянно испытывает нервно-психологическое напряжение, во втором случае - нагрузка на оператора слабее, однако "ответственность" за пропуски событий во многом ложится на детектор движения (при наличии большого числа ложных тревог операторы нередко отключают детектор движения). Во втором случае может также использоваться управляемая по тревоге скоростная поворотная видеокамера (аналогия того, как человек поворачивает голову туда, откуда донесся резкий звук). Это наиболее оправдано при установке такой видеокамеры внутри контролируемой территории и отсутствии в поле зрения конструкций, образующих мертвые зоны - только в этом случае возможный сектор просмотра контролируемой территории составляет по горизонтали 360° (при размещении ее на углу здания этот сектор составляет 270°, при установке на стене - 180°). Следует помнить, что в это время поворота по тревоге видеокамеры, установленной для наблюдения вдоль забора, "оголяется" другая часть забора. Если используется скоростная поворотная камера, угол обзора которой перпендикулярен забору, то по тревоге она должна переходить на работу с самым широким углом обзора, чтобы гарантированно охватить целиком весь тревожный сегмент периметра (в противном случае возможна неопределенность, а значит, и потеря информации). Можно также заметить, что делегирование оператору функций ручной настройки изображения в режиме тревоги создает для него дополнительную нагрузку. Для работы в зоне "В" требования к максимально естественному отображению контролируемой зоны не такие высокие, как в зоне "А". Для обнаружения нарушителя может использоваться, например, тепловизор, да и угол обзора видеокамеры тоже ведь зачастую существенно отличается от того, "какими глазами мы смотрим на мир". Поскольку появление нарушителя в зоне "В" не следует считать равновероятным (как для зоны "А"), то и для анализа элементов его изображения может использоваться не равновероятный подход, а учитываться априорная информация. Это позволит не передавать по каналу избыточную информацию, зато актуальную информацию можно передавать с минимальными потерями и максимальной скоростью.
Промежуточные выводы
1. Вероятность наступления тревожного события в зоне "В" достаточно мала, поэтому обнаружение тревоги - чрезвычайно важное событие.
2. Если предположить, что охранное телевидение пойдет по пути широкого использования IP-видеокамер, то резонно задуматься над тем, как можно преодолеть противоречие между удобством передачи визуальной информации в цифровом виде и ограничением пропускной способности канала для потока передаваемой информации (2).
3. В настоящее время снижение трафика достигается либо путем компрессии видеопотока (уменьшают объем передаваемой информации i), либо при срабатывании встроенного в IP-камеру детектора движения уменьшают скорость обновления информации. Как следует из пункта 3 в обоих случаях возрастает время наблюдения t, что чревато снижением эффективности сил охраны объекта. Между тем существует возможность снижения трафика без ухудшения информативности видеосистемы. Чтобы понять, о чем идет речь, обратимся к устройству человеческого глаза.
Неравномерность влияет на информацию
В центральной части сетчатки глаза плотность рецепторов в 10-20 раз выше, чем на периферии; мышечная система глаза производит "настройку" на лучшее изображение, его анализ (рис. 4). Когда человек хочет получить больше визуальной информации, он "настраивает" глаза так, чтобы интересующая часть изображения сфокусировалась в центральной части сетчатки глаза, а менее важное оказалось на периферии. Таким образом, не увеличивая общего потока информации (количество палочек и колбочек не изменилось), в живой природе достигается получение ценной информации. В стационарной видеокамере объектив закреплен "намертво", чувствительные ячейки ПЗС-матрицы распределены по ее поверхности равномерно. Если мы хотим в нашей видеосистеме получать больше визуальной информации о контролируемой зоне, мы вынуждены повышать разрешающую способность видеокамеры, то есть увеличивать количество пикселей. Это сложно, дорого и требует увеличения пропускной способности канала связи. Ясно, что в ближайшем будущем едва ли следует ожидать появления видеокамер, способных самостоятельно и с быстрым анализом обстановки, адаптировать свою оптическую систему к некой ПЗС-матрице с неравномерным количеством светочувствительных ячеек. Вместе с тем имеется более простой путь к снижению трафика IP-видеокамер с одновременным получением большей информации.
Еще раз о "методе декораций"
Для выработки суждения о наличии тревоги в зоне "В" оператору на посту охраны приходится в каждое свое дежурство постоянно смотреть один и тот же "многосерийный фильм" под названием "Двор" (или "Улица", или "Коридор", или "Лестничная площадка" и т.п.), сюжет которого, как правило, однообразен, и при этом на экране ничего не происходит. С точки зрения теории информации энтропия для зоны "В" значительно меньше максимально возможной: у нас имеется априорная, многократно записанная на диске информация о "декорациях", в которых в течение многих месяцев и даже лет разыгрывается действие (если вообще что-то происходило). В отличие от зоны "А", яркость пикселей зоны "B" оказывается достаточно прогнозируемой (вероятность преодоления нарушителем забора довольно мала - зачем же тогда наблюдать небо?). Вследствие этого от видеокамеры до оператора большую часть времени поступает малоинформативный поток (ничего не меняется!), который у оператора вызывает апатию и утомление. Зачем, спрашивается, мучить охранника, зачем прокачивать по каналу связи пустопорожнюю информацию? Пусть бы "декорации" отображались сами по себе (или не отражались вовсе, пока нет сигнала тревоги), а движущиеся объекты - сами по себе? Ведь в конце концов можно передавать не сами сигналы, а только коды, соответствующие хранимым на диске компьютера изображениям "декораций" в разное время суток и года ("метаданные" в терминологии разработчиков технологии DEPA), а также передавать от IP-камеры лишь изображения движущихся объектов.
Два потока!
Передача кодов "декораций" - это лишь крайний случай предлагаемого подхода. Коль скоро в настоящее время невозможно автоматически фокусировать части изображения на областях с повышенной разрешающей способностью специальной ПЗС-матрицы, то можно попытаться программно "сфокусировать" оцифровку изображения на его движущихся частях и передавать эти данные без компрессии или с минимальной компрессией, зависящей, например, от размера движущегося объекта. Остальную часть изображения (за вычетом движущегося объекта) можно передавать со значительно большей компрессией (меньше i) или намного реже (меньше v) - при этом формируется существенно меньший информационный поток "P", и трафик значительно снижается (рис. 5). Итак, главное отличие предлагаемого решения в том, что компрессия осуществляется не по отношению ко всему кадру, а к двум его составляющим, причем к каждой из них существенно по-разному:
минимальное сжатие для области с движущимся объектом, максимальное - для области "декораций"; соответственно формируются два потока - высокоинформативный и низкоинформативный. Аналогичный подход возможен и для реализации видеоанализа: IP-камера должна научиться отделять изображение автомобильного номера от остального изображения и передавать его с минимальной компрессией. Конечно, это лишь концепция возможного развития IP-видеокамер, и совсем не просто ее
реализовать (тут бы и пригодились силы разработчиков детекторов движения - научить IP-камеры отделять движущиеся изображения от "декораций", важное от неважного). И, наверное, следует осознать, что можно и нужно доверить "мозгу" IP-камеры передавать то, что ОНА считает важным и как ОНА считает нужным. Так же, как мы доверяем охранным извещателям. Конечно, возможны пропущенные и ложные тревоги - а разве оператор не допускает ошибок? Проблема в допустимой вероятности
ошибки, то есть в "мозге" IP-видеокамеры. Стоит лишь отметить, что в случае воплощения этой идеи в жизнь уже само появление на экране монитора качественного изображения движущегося объекта в зоне "В" будет говорить о возникновении тревожной ситуации - а это, по сути, и есть цель охранного телевидения.
Опубликовано: Журнал "Системы безопасности" #2, 2007
Посещений: 12842
Автор
| |||
В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик | К списку авторов | К списку публикаций