Контакты
Подписка
МЕНЮ
Контакты
Подписка

Дурная наследственность

В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Дурная наследственность

М.В. Руцков
Эксперт, к.т.н.

Как и обещал, выдаю статью на техническую тему. Но все ж не могу сдержаться, поэтому "пара ласковых" - в качестве вступления. Итак, довелось мне недавно прочитать завораживающую публикацию из одного солидного издания по безопасности. Чтоб не ходить вокруг да около - сразу выдаю выдержку оттуда, дословно:

"В одном из подразделений военной разведки на советско-китайской границе произошло событие, которое по праву можно назвать днем рождения одного из самых динамично развивающихся сегодня направлений отрасли обеспечения безопасности". О как - уже интересно! Посмотрел далее и просто обомлел:

"Время, напомним, было "перестроечное". Не за горами - распад великой некогда державы. Массовый исход людей, секретных сведений, военного имущества и прочих ценностей за границу. Все - на продажу! Государственные интересы у тогдашнего чиновника были где-то на двадцатом месте в его личной системе ценностей". Ну, и это еще как-то можно выдержать, хотя попахивает неким нигилизмом! Апокалипсис - отнюдь! Вот так, по-простому - всех под одну гребенку. Действительно - были уроды редкие, да и сейчас имеются. Как не стыдно -так хаять все и вся! И вдруг - луч света в темном царстве, цитирую дословно: "Через четыре месяца в часть приходит посылка, в которой лежало долгожданное заветное устройство - плата ввода видео с восемью оттенками цвета в компьютер через COM-порт. Вот так в руках лейтенанта Гришанина оказалась первая и единственная в мире компьютерная система CCTV". Итак, описываемые события, развивались в 1989 г. Поэтому хочу обратиться к руководству издания: "Друзья, вы хоть сами понимаете, какую ересь публикуете!". Можно, конечно, предположить - журналист напортачил, так на то у вас и выпускающие редакторы имеются. Неужели так трудно было проверить - иль хорошо заплатили? Когда, например, публикуются мои статьи - в другом издании по безопасности, то в силу моей "неуправляемости", в плане выражения собственных взглядов, всегда присутствует класфраза: "Статья печатается в авторской редакции". И все - вся ответственность с издательства автоматически снимается. Ну, так и пишите тогда: "Статья заказная - за содержание редакция ответственности не несет", типа объявления об интиме. И вопросов ни у кого не будет. Это ж не шуточки - тираж в двадцать тысяч экземпляров (так заявлено было), каждый из которых морочит нормальным людям головы. А потом ненароком появится очередной релиз о том, что упомянутый лейтенант в 1991-м первым в мире на Луну слетал - по "секретному заданию"! В "те времена" существовало навалом всякого рода "компьютерных систем CCTV". Наша компания, например, уже серийно выпускала целую линейку плат ввода изображений, а дотого (когда костяк будущей фирмы работал еще в НИИ) был реализован ряд проектов по Системам технического зрения. Да что там далеко ходить, в 1981 г. (почувствуйте 8-летнюю разницу) я сам лично слепил фрэйм-граббер для Института Океанологии РАН им. П.П.Ширшова. И было там 256х256х4 бита (16 градаций серого) на двойном "корыте" для "Элек-троники-60". Тогда еще и IBM PC в помине не было, только в 1986-м г. появились. Вот нравилась мне схемотехника - до сих пор помню откуда у 155ЛА3 или ТМ2 ноги растут. Ладно, извините за резкость, - просто думайте, что печатаете, товарищи СМИ-шники! Одно дело - пропиарить, и совсем другое - переврать историю! Вот это и есть один из элементов "дурной наследственности" - сказки рассказывать. Если не унять сию "пургу" в зародыше - заметет по самую макушку! А теперь займемся уже техническим анализом на тему: "Как мы докатились до жизни такой, и куда нас несет!". Речь пойдет о нашем любимом - "Цифровом охранном видеонаблюдении". Сразу предупреждаю - это лишь мое субъективное мнение.

Поля и кадры

Итак, досталось сие наследие цифровому видеонаблюдению от аналогового, которому в свою очередь - от телевидения! В те далекие времена, при разработке телевизионного стандарта, учитывались многие факторы: ограниченность полосы пропускания каналов связи, совместимость черно-белого сигнала с цветным, частота напряжения в силовой сети и, конечно же, нейрофизиология зрения человека. Наш мозг устроен таким образом, что может воспринимать последовательность отдельных статических картинок как единый непрерывный процесс. Но при этом частота предъявления должна быть не менее "критической частоты мельканий". Для человека она составляет 48-50 Гц.

Далее, еще один нейрофизиологический факт говорит о том, что мы не различаем мелких деталей движущихся объектов. Такая же история и с цветом - на мелких деталях он не воспринимается, даже на статике. Вот отсюда и появилась чересстрочная развертка как способ снижения ширины полосы спектра сигнала. Видео передается полями с частотой 50 Гц. Каждое поле содержит в два раза меньше информации, чем полный кадр. Но этого вполне достаточно - все равно не видно мелких деталей в движении, зато мельканий нет. И все бы хорошо, если мы смотрим кино на диване! Но у нас-то - охранное видеонаблюдение с совсем другими задачами! При просмотре художественного фильма нет необходимости вглядываться в мелочи - все снято крупным планом при хорошем освещении. Главное, чтоб ничего глаз не раздражало! А вот в охранном видеонаблюдении все наоборот - полно мелких слабоконтрастных деталей! И основная работа сводится к просмотру стоп-кадров. Сразу возникает естественный вопрос - а как этот стоп-кадр получается? Если просто из двух полей собрать, с соблюдением чересстрочности, то получим характерное двоение движущихся объектов. Тут уж вообще ничего не разберешь. Поэтому стоп-кадр надо выращивать из одного поля путем дублирования строк с интерполяцией. И никакой деинтерлейсинг не поможет, но об этом чуть позже. Кстати, упование на "целительные свойства" этой процедуры является одним из самых глубоких заблуждений! Сделать ничего нельзя -между полями интервал в 20 миллисекунд! Ну, какая ерунда - так мало! А вот и нет - например, при скорости 6 км/час объект за 20 мс смещается на 3,5 см. Соответственно получаем два носа и четыре глаза, а это еще не самая высокая скорость! Да и перемещения не всегда линейны - поворот головы, например!

Тогда естественно возникает вопрос - зачем писать полный кадр 768х578 пиксел (европейский стандарт), если стоп-кадр все равно выращивается из одного поля - 768х288. А может быть, пойти еще дальше - работать с четвертушками 384х288. Экономия дискового пространства еще больше будет. А вот и нет - более высокое горизонтальное разрешение легко разменивается на общее. Например, проверено на практике, что для распознавания автомобильных номеров при работе с полями ширина зоны захвата равна 3 метрам, а при использовании четвертушки - только 2! Кроме того, надо опять учесть физиологию зрения - по горизонтали пространственная чувствительность выше, что обусловлено развитием стереозрения. Основными ориентирами для определения дистанции древним людям служили деревья - в лесу они жили и охотились. Ну, это уже лирика. А вот наличие аналоговых мониторов с разрешением в 800 и более ТВ-линий - говорит само за себя. Вроде бы все ясно. Так почему же так настойчиво пропагандируются системы с записью полного кадра - 768х576, или у "них" - 640x480? Итак, для просмотра стоп-кадров полноформатная запись - 50 поле/с не дает никаких преимуществ перед записью только четными или только нечетными полями со скоростью - 25 полей/с. Хотя нагрузка на систему по ресурсам процессора, дисковому простран ству и сетевому трафику практически в два раза больше. Обычно сторонники полнокадровой записи проводят "бронебойную демонстрацию" - берут испытательную телевизионную таблицу и направляют на нее камеру, показывая потребителю более высокую разрешающую способность. А кому интересно рассматривать статический фон? Вы возьмите, да дерните таблицу, а потом покажите стоп-кадр из архива. Ведь в охранном видеонаблюдении важно видеть внедрение объекта и его действия в контролируемой зоне. А это в чистом виде - движение. Есть лишь один, но достаточно сомнительный аргумент в пользу записи со скоростью 50 полей/с. Это скорость протекания процессов. Однако для подавляющего числа приложений по безопасности вполне хватает и 6 полей/с! Тут же начинают вспоминать казино. Да, там 6 поле/с, может быть и маловато, а вот 25 полей/с - в самый раз. Так почему же всем поголовно подай полнокадровый режим -768х576 пиксел (еще и в цвете) со скоростью 25 кадр/с? Ладно бы для записи телеканалов, а вот зачем это надо в охранном видеонаблюдении?

А это наследие "конкурентной гонки вооружения" - или "стахановщина"! Достаточно подробно это явление было описано мной 2 года назад в статье "Видеобум или Что день грядущий нам...". Любой ценой превзойти конкурента! Поскольку преимущества технологии видеодетектирования в цифровых системах охранного видеонаблюдения еще не достаточно понятны большинству пользователей, да и разработчикам тоже, то основной упор делается на достижении максимально возможных характеристик записи, как таковой! Все начиналось с ограниченного числа мультиплексированных каналов видео, причем не с самым высоким разрешением. Однако компьютерные платформы стремительно развивались, что привело к достижению максимально возможных характеристик оцифровки стандартного телесигнала. Остался лишь один показатель, который "сорви-головы" готовы увеличивать до бесконечности -число real-time каналов на один системный блок! Уже отрапортовали о 64-х!!! А это -полная нелепость при современных тенденциях развития в сторону распределенных -децентрализованных систем. Наверное, в понимании тех самых "голов", так проще убедить пользователей: "Вам нужны максимальные характеристики - вы их получите!!!". Абсолютный тупик!

Деинтерлейсинг

А это уже следствие "дурной наследственности". Деинтерлейсинг - что ж за зверь-то такой? А это - убийца "гребенки", причем безжалостный! И того не легче. Сколько ж мифов ходят-бродят об этой "зверюшке". Давайте разбираться! Итак, как известно, Голливуд, да и остальная киноиндустрия, заваливает нас своей продукцией. Причем не только целлулоидными пленками! До конца 20-го века основными носителями для просмотра сих творений на теликах были видеокассеты, на которых все это кино записывалось в стандарте ТВ-сигнала, то есть наша любимая чересстрочная развертка - 50 полей/с. Однако компьютерный прогресс стремительно прогрессировал и допрогрессировался до DVD-дисков, на которые уже можно было записывать 2-часовые фильмы с более высоким качеством - спасибо MPEG-2-му! Про MPEG-1 даже и вспоминать не хочется - баловство. Все бы хорошо - купил DVD-плеер, да смотри в "дурацкий ящик" - вот так телевизор окрестили. Ан нет, быстро смекнули, что и других, не менее "дурацких ящиков" навалом - компьютеры называются. Так что ж добру пропадать - надо и там поспешать. Налепили софта, губы раскатали и... - нарвались на ту самую "гребенку"! Суть следующая - чересстрочный ТВ-видеопоток пытаются воспроизвести на компьютерном мониторе с прогрессивной разверткой, у которого еще и частота регенерации значительно выше! Что получается? У телевизионного ЭЛТ-монитора нет кадровой памяти - приехало первое поле кадра (последовательно, естественно, по мере прохода электронного луча), засветило люминофор и он, благодаря послесвечению -держит картинку, которая по экспоненте плавно угасает и мозг не напрягает! Затем второе поле пошло - красота. А на компьютерах все гораздо быстрее - есть кадровый буфер, который со страшной скоростью вываливается на экран. В результате мы видим оба поля одновременно! Что-то типа кирпичной кладки - каждое поле смещено на 20 мс относительно друг друга, но торчит на экране все 40 мс! Этакое перекрытие - сначала 1-е поле дружит со 2-м, затем то же 2-е - с новым 1-м и т.д.! Значит движущийся объект "разъедется" - в нечетных строках он будет занимать одну позицию, а в четных - другую. Вот отсюда и возникает "гребенка". И как же с этим явлением бороться? Знамо дело -деинтерлейсингом! Самое простое, что придумали, можно назвать - "глобально тупым деинтерлейсингом"! В изображениях просто срезаются высокие частоты - что-то типа "замыливания". Отличный результат - "гребенка" размывается, все остальные детали - тоже! Муть конечно, зато глазу приятно - рези нет!!! Далее додумались до адаптивного деинтерлейсинга - "за-мыливаются" только зоны с активностью (в частном случае - движением). Красота еще шибче - статический фон "блещет высоким разрешением", создавая иллюзию "высокого качества". Мне это напоминает мои школьные 60-е - телевизоры тогда были "серыми" и чтобы народу жизнь такой же не казалась, кто-то, из ЦК наверное, придумал этакие пленки. Снизу в них было зелененькое, а сверху голубенькое, что посредине - не помню. Возьмешь такую штучку, на кинескоп прилепишь - вроде телик цветной получается: небо голубеет, трава зеленеет!!! Однако вернемся к нашим... к нашему адаптивному деинтерлейсингу. С фоном-то все хорошо, а вот фрагменты с движением - именно то, что нам и нужно в охранном видеонаблюдении, - безжалостно "сглаживаются"! Дай бог, если эта процедура выполняется только при выводе на экран. Если сие сотворить на платах с аппаратной компрессией до записи -то потом костей не соберешь, все будет утеряно для стоп-кадрового просмотра! Ну и, наконец, "шибко умный деинтерлейсинг". Там такое "колдовство предикативное" идет, что на экране появляется даже то, чего на самом деле и не было!

Итак - сухой остаток! Проблема - "гребенка", появляющаяся при воспроизведении источника с чересстрочным ТВ-сигналом (а все аналоговые и даже некоторые цифровые камеры такие) на компьютерном мониторе с прогрессивной высокоскоростной разверткой. Про 100-герцовые телевизоры пока говорить не будем, там своя песня. Есть три варианта решения: Упереться рогом и, используя деинтерлейсинг, "скрашивать" картинку для глаза. То есть - тащить в охранное видеонаблюдение все, что наработала мультимедийная индустрия для просмотра "Голливуда" на компьютере! Напряг для системных ресурсов самый высокий. Причем можно угробить деинтерлейсингом всю изначальную информацию для просмотра стоп-кадров. Поставить специальный преобразователь чересстрочного потока - в стандартный ТВ-сигнал и смотреть сие хозяйство на классическом аналоговом ТВ-мониторе. Кстати, это подсознательная мечта любого охранника! Но для обыкновенного "unlimited Интернет-качальщика" -слишком большие расходы. Абсолютно разные мечты, да и категории! Решить задачу путем изменения самой постановки задачи - писать только полями! Деинтерлейсинг исчезает - как класс! Преимущества более чем очевидные - снижение нагрузки на процессор, системную память, периферийную шину, диски и сеть! Стоп-кадр не страдает. Так почему ж такая упертость в вариант "Number One"? Вот и пойми русскую душу! Видать песен дурных наслушались и других приучили! Хочу обратить особое внимание на тот факт, что деинтерлейсинг - это чисто мультимедийное изобретение, которое бездумно перетащили в охранное видеонаблюдение. Ведь так проще, да и голову напрягать не надо. И как бы не совершенствовались алгоритмы в этом направлении, надо понять следующее - сам подход порочен! Выход только один - работать с полями или переходить на камеры с прогрессивной разверткой. Думаете, на этом "дурная наследственность" исчерпывается? Да ничего подобного - "тащат" все подряд! Но об этом уже в следующей статье.

Опубликовано: Журнал "Системы безопасности" #3, 2006
Посещений: 10804

  Автор

Руцков М. В.

Руцков М. В.

Генеральный директор компании MegaPixel Ltd., к.т.н.

Всего статей:  47

В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик  |  К списку авторов  |  К списку публикаций