В рубрику "Наука" | К списку рубрик | К списку авторов | К списку публикаций

Сжатие телевизионного сигнала: более простое и с лучшим качеством, чем у стандартных MPEG-4 и NEVC

В журнале "Системы безопасности" № 5/2014¹ мною был описан двумерный анализ-синтез (ДАСИ) со сжатием в 10–20 раз телевизионных изображений (ТВИ) при качестве ТВИ лучшем, чем у исходного ТВИ. Алгоритмы ДАСИ основаны, в соответствии с рекомендациями 1948 г. К. Шеннона, на зрительном восприятии (ЗВ) контуров². Реализован ДАСИ был для стандарта ТВИ СССР (625 строк, 25 кадров) на устаревшей (1957–1969 гг.) элементной базе (лампы, камеры перезаписи, ультразвуковые задержки и пр.)^{1, 3}. Цель этой работы – показать возможности разработок на микросхемах конкурентной на мировом уровне аппаратуры сжатия ДАСИ, улучшающей качество ТВИ, которая более чем в 1000 раз проще, чем стандарты систем сжатия H.264 (MPEG-4) и H.265 (HEVC), которые не улучшают качество ТВИ

Юрий Брауде-Золотарев
Независимый эксперт

Рассмотрим ДАСИ того же стандарта, что и в публикации в журнале "Системы безопасности" № 5/2014, принятого позже в Европе как стандарт 576i (625/50) с полосой ТВИ около 5 МГц. Кадр содержит 625 строк – 576 активных и 49 служебных; около 700 элементов в активных строках. Всего – около 400 тыс. элементов на кадре. Исходный сигнал ТВИ требует 128 уровней квантования (УК) и 7 разрядов квантования – около 2,8 Мбит на кадре. В журнале "Системы безопасности" № 5/2014 показаны возможности сжатия кадра на базе ДАСИ в 10–20 раз. Для всех низкочастотных двумерных фильтров (НДФ) ДАСИ достаточны 16 УК – 4 бита квантования, так как ложные контуры квантования отфильтровывает синтез.

Сжатие кадра при ДАСИ

Рассмотрим три НДФ, удобные для реализации на микросхемах. Для всех апертур НДФ выберем квадрат 3х3 с общим размером 9 элементов, весами строк (1, 1, 1), (1, 1, 1), (1, 1, 1) и общим весом 9. Эффективные диаметры апертур (ЭДА) НДФ-1, НДФ-2 и НДФ-3 увеличены последовательно в 2 раза – до 2, 4, 8 элементов. Отсчеты этих НДФ на кадре располагаем с шагами (2, 4, 8), одинаковыми по элементам вдоль строки и строкам (по вертикали) соответственно. Это снижает у них количество отсчетов на кадре соответственно в 4, 16, 64 раза. Строки и столбцы соседних апертур НДФ при этом совпадают, что обеспечивает равномерное покрытие растра. На кадре с 400 тыс. элементов количество отсчетов у этих НДФ – 100, 25, 6,25 тыс.

Полосовые двумерные фильтры (ПДФ) формирует разность апертур – границ ПДФ. Они имеют участки "положительной и отрицательной прозрачности" с нулевым общим весом и поэтому выделяют, как и в ранее рассмотренном случае¹, только контуры переходов яркости. Квадратная апертура каждого ПДФ соответствует разности центрального элемента с весом 9 и квадратной апертуры НДФ – его границы. Веса ее строк (1, 1, 1), (1, 8, 1), (1, 1, 1). У всех периферийных элементов вес единиц отрицательный. Положительный вес центрального элемента 8 обеспечивает у апертур всех ПДФ нулевой общий вес.

Апертуры с ЭД 1, 2, 4, 8 элементов образуют три ПДФ с границами (1–2), (2–4), (4–8) элементов и НДФ-3 с ЭДА 8 элементов. Каждый ПДФ выделяет только контуры ТВИ с размером, соответствующим его меньшей границе (1, 2, 4 элементов). Выберем, как и ранее1, для сигнала ПДФ-1 два уровня квантования (УК) – 1 бит, для ПДФ-2 – 4 УК (2 бита), для ПДФ-3 – 8 УК (3 бита) и для НДФ-3 – 16 УК (4 бита). Количество отсчетов на кадре с 400 тыс. элементов у этих ПДФ – 400, 100, 25 тыс. элементов и у НДФ-3 – 6,25 тыс. элементов. Объем сигналов на кадре у них – 400, 200, 75 и 25 Кбит, общий объем – 700 Кбит. Такой ДАСИ сжал кадр в 4 раза и при этом улучшил качество ТВИ.

Сложность ДАСИ кадра

Обработка информации на двоичных регистрах сдвига (ДРС) проще обработки в узлах памяти. Для формирования НДФ-2 и ПДФ-1 нужны две строчные ДРС на 1 бит, каждая на 700 отсчетов – 1400 отсчетов (1,4 Кбит). Для следующих НДФ и ПДФ из-за прерывистой развертки с шагами 2, 4, 8 элементов вдоль строки нужны ДРС на 700, 350, 175 элементов с количеством бит – 2, 3, 4 соответственно. У них сложность 1,4, 1,050 и 0,7 Кбит, а общая сложность всех ДРС анализа кадра – около 3,15 Кбит (1,4 + 1,05 + 0,7).

При синтезе необходимо совместить сигналы всех ПДФ и НДФ-3. Cигналы НДФ-3 и ПДФ-3 задержки не требуют. Сигнал ПДФ-2 требует 4 строки задержки на 700 элементов с 2 битами – 1,4 Кбит. Сигнал ПДФ-1 требует 8 строк задержки на 700 элементов с 1 бит – 5,6 Кбит. Для их суммирования нужны сумматоры и вспомогательные цепи общей сложностью около 3–4 Кбит. Общая сложность ДАСИ кадра со сжатием ТВИ в 4 раза – около 14 Кбит. При пяти условных вентилях (УВ) на каждый разряд ДРС для реализации на микросхемах этого ДАСИ нужны около 70 тыс. УВ.

Сложность инерционного сжатия при ДАСИ

Инерционное сжатие (ИС) использует медленное прослеживание контуров и подобие смежных кадров. В статье, опубликованной в журнале "Системы безопасности" № 5/2014, отмечена незаметность смещений компонент ДАСИ на 6 кадров (0,24 с). Были заметны расфокусированные на 8 элементов компоненты НДФ-3 только при сменах сюжета и при очень быстром движении, что, однако, не ухудшало качества ТВИ. Это доказало возможность прореживания и предсказания компонент следующих кадров по предыдущим со сжатием до 8 раз также для сигналов ПДФ. Исследования ИС с таким сжатием не были завершены из-за недостатка средств. Использовали сжатие компонент ДАСИ кадра в 2, 4, 4, 4 раза и получили на кадре 200, 50, 18,75 и 6,25 Кбит соответственно, а всего – 275 Кбит1. Было получено сжатие в 10 раз при высоком качестве ТВИ. Сложность этого этапа сжатия – около 60 Кбит, что при реализации ИС на микросхемах близко к 300 тыс. УВ.

В журнале "Системы безопасности" № 5/2014 упомянут MPEG-4 – система ИС, где кадры разделены на опорные и предсказываемые. Она допускает снижение качества ТВИ и использует огромную память – до 32 предыдущих кадров. Это доказывает возможность выбора ИС с интервалами компонент ДАСИ значительно меньшими, чем в MPEG-4, но в 2 раза большими, чем в предыдущей публикации1, – 4 кадра для ПДФ-1 и 8 кадров для других. Объем сигнала кадра при этом ИС будет снижен до 137,5 Кбит. Сложность такого ИС возрастет до 120 Кбит (600 тыс. УВ). Кадр будет сжат в 20 раз, но сохранит улучшение качества ТВИ. Общая сложность ДРС сжатия кадра с таким ИС (14 + 120) – около 134 Кбит (0,67 млн УВ). Инерционное сжатие снижает возможности дальнейшего сверточного сжатия, уменьшая статистическую избыточность.

Сложность сверточного сжатия при ДАСИ

Сокращение статистической избыточности сигнала кадра без инерционного сжатия было предложено еще в 1961 г.⁴ и реализовано программно в 1979 г.⁵. Необходимые "характеристические сдвиги"5 задавали отводы двоичных регистров сдвига (РС) анализатора синдрома (АС) сверточного кодека помехозащиты с малой плотностью проверок на четность (МППЧ – Low Density Parity Check – LDPC) со свойством "не более одного совпадения позиций ненулевых членов". Эти сдвиги задавали генераторные полиномы (ГП) кода, подбираемые вручную. Исследования КСС были проведены программно для кодовой скорости R=4/55. Двоичные символы контурного сигнала ПДФ-1 эти ГП преобразовывали в 4 последовательности, которые поступали на 4 входа АС, где их обрабатывали в четырех ГП подобно обработке четырех ветвей информационного сигнала при формировании проверочной последовательности. Было получено сжатие сигнала ПДФ-1 в 4 раза. При синтезе из них восстанавливали исходный контурный сигнал. Возникающие на хаотических позициях темные точки ошибок "интерференции" были незаметны. Испытать более высокие КСС компонент ПДФ-1 (до 10 раз) и КСС ПДФ-2 (до 8–15 раз) не удалось из-за трудностей поиска нужных ГП. Такая возможность возникла позже для ГП на базе таблиц совершенных разностных множеств (СРМ), использованных в кодеках МППЧ6, 7. В них были реализованы АС на микросхемах – стационарный ГП на СРМ-553 (Н1515ХМ7-158) для космического челнока "Буран" и нестационарный ГП на СРМ-133 (5503ХМ1-006) c изменяемыми характеристическими сдвигами от кадра к кадру для космического канала беспилотника⁶. Преимущества нестационарных ГП существенны и для микросхем КСС, так как сигналы смежных ПДФ и НДФ сильно коррелированны. Нестационарные ГП улучшают подавление интерференционных помех.

Для сжатия сигналов ПДФ-1 в 4 раза и других ПДФ и НДФ-3 в 8 раз нужны КСС с общей длиной ДРС вместе с вспомогательными цепями около 50 Кбит – 250 тыс. УВ. Сложность у КСС в 2,7 раза меньше, чем у второго ИС. Общий объем сигнала кадра КСС снижает до 137,5 Кбит, что соответствует такому же, как у ИС, сжатию сигнала ТВИ в 20 раз – скорости около 3,5 Мбит/с при высоком качестве ТВИ. Общая сложность сжатия кадра (14 Кбит) вместе с КСС (50 Кбит) – около 64 Кбит (320 тыс. УВ).

Сравнение аппаратуры сжатия ТВИ на микросхемах

Стандартизованные (H.264 и H.265) системы сжатия объема телевизионного сигнала дают малое сжатие ТВИ монохромного стандарта 576i (625/50) – в 2 раза у H.264 (Moving Picture Experts Group – MPEG-4) и в 4 раза – у H.265 (High Efficiency Video Coding – HEVC) при сохранении или незначительном снижении качества ТВИ. На рынке до сих пор преобладает H.264, но быстро идет переход к H.265. Важная особенность этих систем – переход от программной реализации к аппаратной на микросхемах, но они очень сложны. Для MPEG-4 (Ericsson SVP 5500) нужна память на 2 Гбит. Для HEVC с двухъядерным процессором Qualcomm Snapdragon S4, показанном 29.02.2012 г. и реализованном на микросхемах с технологиями 45 и 28 нм типа System on a Chip – SoC (система на кристалле), нужна память 32 Гбит.

В кодере HEVC первый кадр ТВИ кодируют внутрикадровым предсказанием отсчета внутри кадра по соседним отсчетам. В следующих кадрах работает межкадровое предсказание, в котором по отсчетам опорного кадра и вектора движения, использующего подобие смежных кадров, оценивают текущие отсчеты каждого блока. Это предсказание много сложнее НДФ и ПДФ, используемых в ДАСИ. Кодер и декодер создают идентичные межкадровые предсказания, компенсируя движение с помощью векторов движения и данных выбранного режима, которые передают дополнительно. Возможно, что векторное предсказание в сочетании с сигналами НДФ и ПДФ позволит сжать кадр ДАСИ проще, чем описанные выше инерционное и сверточное сжатие. Но такое сжатие еще не исследовано и здесь не рассмотрено. Сложность сжатия кадра в 20 раз при ДАСИ со сверточным сжатием около 60 Кбит. Оно улучшает качество ТВИ и проще стандартов H.264 и H.265 более чем в 1000 раз.

Реализация аппаратуры сжатия ТВИ на микросхемах

Постановление Правительства РФ № 809 от 26.11.07 "Развитие электронной компонентной базы и радиоэлектроники на 2008–2015 гг." требует разработок на микросхемах аппаратуры, конкурентной на мировом уровне. Оно предусматривает реализацию технологии 45 нм в 2015 г. Современные технологии позволяют реализовать ДАСИ с КСС простыми средствами на базе отечественных микросхем. Двумерный анализ-синтез изображений³ является единственным алгоритмом, использующим простейшие аппаратные средства, подобные ранее успешно испытанным микросхемам помехоустойчивого и криптографического кодирования⁷. В НПК "Технологический центр МИЭТ" уже освоен выпуск БМК серий 5529 и 5521 с КМОП-технологиями 0,25 мкм и 0,18 мкм. Есть опыт совместных работ с МИЭТ. Максимальный объем этих БМК – 1500 тыс. УВ – в 5 раз превышает объем, нужный для реализации ДАСИ со сверточным сжатием. Необходимые МБИС с КМОП-технологиями с ПН до 0,13 мкм могут изготавливать "Ангстрем" и "Микрон" (Зеленоград). Томский НИИ полупроводниковых приборов для диапазона 3,1–5,1 ГГц разработал комплект интегральных микросхем для ВРС и технических средств охраны с частотами выше 30 ГГц по арсенид-галлиевой технологии с проектной нормой (ПН) 0,5 мкм.

Выводы

Известный более 30 лет двумерный анализ-синтез изображений (ДАСИ) с инерционным и сверточным сжатием обеспечивает сжатие сигнала изображения в 20 раз – до скорости 3,5 Мбит/с и улучшают качество ТВИ. Дальнейшее увеличение сжатия ТВИ в 30 раз и более возможно с улучшенными инерционным и сверточным сжатием. Вероятно также, что векторное предсказание совместно с ДАСИ позволят увеличить сжатие и упростить его аппаратуру, но это требует исследований. Восстановленное ДАСИ после сжатия ТВИ имеет качество более высокое, чем у исходного ТВИ, что невозможно для других способов. Аппаратная реализация ДАСИ со сверточным сжатием на микросхемах более чем в 1000 раз проще способов сжатия систем MPEG-4 и HEVC по стандартам H.264 и H.265.

___________________________________________
¹ Брауде-Золотарев Ю.М. Сжатие телевизионного сигнала, повышающее качество изображения // Системы безопасности № 5, 2014.
² Shannon, C.E. A Mathematical Theory of Communication, 424-445, BSTJ v. 27, 1948. Переводы "Математическая теория связи" в книге Шеннон К. "Работы по теории информации и кибернетике", М., ИЛ, 1963 и "Скорость создания сообщений для непрерывного источника" в книге "Теория передачи электрических сигналов при наличии помех". ИЛ, 1953.
³ Брауде-Золотарев Ю.М. Способ анализа и синтеза телевизионного изображения. АС № 120534, БИ № 10, 1959 по заявке от 22.11.1957.
⁴ Брауде-Золотарев Ю.М. Способ сокращения объема телевизионного сигнала. № 145620, БИ № 6, 1962, Кл.21а, 34. Заявка от 6.04.1961, № 72521426. Опубликовано 01.01.1962.
⁵ Брауде-Золотарев Ю.М., Золотарев В.В. Оптимизированный пороговый алгоритм и сжатие источника // Труды НИИР, 1979, № 2, с. 10–13.
⁶ Брауде-Золотарев Ю.М., Брауде-Золотарев М.Ю., Каблучкова А. А. и др. Микросхема помехоустойчивого кодирования канала // Электросвязь, 2002, № 10.
⁷ Брауде-Золотарев Ю.М. О наилучших алгоритмах помехоустойчивого кодирования //Беспроводные технологии, 2013, № 2.

Опубликовано: Журнал "Системы безопасности" #1, 2015
Посещений: 9474

Автор

Юрий Брауде-Золотарев

Независимый эксперт

Всего статей: 2

В рубрику "Наука" | К списку рубрик | К списку авторов | К списку публикаций

Сжатие телевизионного сигнала: более простое и с лучшим качеством, чем у стандартных MPEG-4 и NEVC

Сжатие телевизионного сигнала: более простое и с лучшим качеством, чем у стандартных MPEG-4 и NEVC

Сжатие кадра при ДАСИ

Сложность ДАСИ кадра

Сложность инерционного сжатия при ДАСИ

Сложность сверточного сжатия при ДАСИ

Сравнение аппаратуры сжатия ТВИ на микросхемах

Реализация аппаратуры сжатия ТВИ на микросхемах

Выводы

Юрий Брауде-Золотарев

Мы в соцсетях