В рубрику "Наука" | К списку рубрик | К списку авторов | К списку публикаций
Рассмотрим ДАСИ того же стандарта, что и в публикации в журнале "Системы безопасности" № 5/2014, принятого позже в Европе как стандарт 576i (625/50) с полосой ТВИ около 5 МГц. Кадр содержит 625 строк – 576 активных и 49 служебных; около 700 элементов в активных строках. Всего – около 400 тыс. элементов на кадре. Исходный сигнал ТВИ требует 128 уровней квантования (УК) и 7 разрядов квантования – около 2,8 Мбит на кадре. В журнале "Системы безопасности" № 5/2014 показаны возможности сжатия кадра на базе ДАСИ в 10–20 раз. Для всех низкочастотных двумерных фильтров (НДФ) ДАСИ достаточны 16 УК – 4 бита квантования, так как ложные контуры квантования отфильтровывает синтез.
Рассмотрим три НДФ, удобные для реализации на микросхемах. Для всех апертур НДФ выберем квадрат 3х3 с общим размером 9 элементов, весами строк (1, 1, 1), (1, 1, 1), (1, 1, 1) и общим весом 9. Эффективные диаметры апертур (ЭДА) НДФ-1, НДФ-2 и НДФ-3 увеличены последовательно в 2 раза – до 2, 4, 8 элементов. Отсчеты этих НДФ на кадре располагаем с шагами (2, 4, 8), одинаковыми по элементам вдоль строки и строкам (по вертикали) соответственно. Это снижает у них количество отсчетов на кадре соответственно в 4, 16, 64 раза. Строки и столбцы соседних апертур НДФ при этом совпадают, что обеспечивает равномерное покрытие растра. На кадре с 400 тыс. элементов количество отсчетов у этих НДФ – 100, 25, 6,25 тыс.
Полосовые двумерные фильтры (ПДФ) формирует разность апертур – границ ПДФ. Они имеют участки "положительной и отрицательной прозрачности" с нулевым общим весом и поэтому выделяют, как и в ранее рассмотренном случае1, только контуры переходов яркости. Квадратная апертура каждого ПДФ соответствует разности центрального элемента с весом 9 и квадратной апертуры НДФ – его границы. Веса ее строк (1, 1, 1), (1, 8, 1), (1, 1, 1). У всех периферийных элементов вес единиц отрицательный. Положительный вес центрального элемента 8 обеспечивает у апертур всех ПДФ нулевой общий вес.
Апертуры с ЭД 1, 2, 4, 8 элементов образуют три ПДФ с границами (1–2), (2–4), (4–8) элементов и НДФ-3 с ЭДА 8 элементов. Каждый ПДФ выделяет только контуры ТВИ с размером, соответствующим его меньшей границе (1, 2, 4 элементов). Выберем, как и ранее1, для сигнала ПДФ-1 два уровня квантования (УК) – 1 бит, для ПДФ-2 – 4 УК (2 бита), для ПДФ-3 – 8 УК (3 бита) и для НДФ-3 – 16 УК (4 бита). Количество отсчетов на кадре с 400 тыс. элементов у этих ПДФ – 400, 100, 25 тыс. элементов и у НДФ-3 – 6,25 тыс. элементов. Объем сигналов на кадре у них – 400, 200, 75 и 25 Кбит, общий объем – 700 Кбит. Такой ДАСИ сжал кадр в 4 раза и при этом улучшил качество ТВИ.
Обработка информации на двоичных регистрах сдвига (ДРС) проще обработки в узлах памяти. Для формирования НДФ-2 и ПДФ-1 нужны две строчные ДРС на 1 бит, каждая на 700 отсчетов – 1400 отсчетов (1,4 Кбит). Для следующих НДФ и ПДФ из-за прерывистой развертки с шагами 2, 4, 8 элементов вдоль строки нужны ДРС на 700, 350, 175 элементов с количеством бит – 2, 3, 4 соответственно. У них сложность 1,4, 1,050 и 0,7 Кбит, а общая сложность всех ДРС анализа кадра – около 3,15 Кбит (1,4 + 1,05 + 0,7).
При синтезе необходимо совместить сигналы всех ПДФ и НДФ-3. Cигналы НДФ-3 и ПДФ-3 задержки не требуют. Сигнал ПДФ-2 требует 4 строки задержки на 700 элементов с 2 битами – 1,4 Кбит. Сигнал ПДФ-1 требует 8 строк задержки на 700 элементов с 1 бит – 5,6 Кбит. Для их суммирования нужны сумматоры и вспомогательные цепи общей сложностью около 3–4 Кбит. Общая сложность ДАСИ кадра со сжатием ТВИ в 4 раза – около 14 Кбит. При пяти условных вентилях (УВ) на каждый разряд ДРС для реализации на микросхемах этого ДАСИ нужны около 70 тыс. УВ.
Инерционное сжатие (ИС) использует медленное прослеживание контуров и подобие смежных кадров. В статье, опубликованной в журнале "Системы безопасности" № 5/2014, отмечена незаметность смещений компонент ДАСИ на 6 кадров (0,24 с). Были заметны расфокусированные на 8 элементов компоненты НДФ-3 только при сменах сюжета и при очень быстром движении, что, однако, не ухудшало качества ТВИ. Это доказало возможность прореживания и предсказания компонент следующих кадров по предыдущим со сжатием до 8 раз также для сигналов ПДФ. Исследования ИС с таким сжатием не были завершены из-за недостатка средств. Использовали сжатие компонент ДАСИ кадра в 2, 4, 4, 4 раза и получили на кадре 200, 50, 18,75 и 6,25 Кбит соответственно, а всего – 275 Кбит1. Было получено сжатие в 10 раз при высоком качестве ТВИ. Сложность этого этапа сжатия – около 60 Кбит, что при реализации ИС на микросхемах близко к 300 тыс. УВ.
В журнале "Системы безопасности" № 5/2014 упомянут MPEG-4 – система ИС, где кадры разделены на опорные и предсказываемые. Она допускает снижение качества ТВИ и использует огромную память – до 32 предыдущих кадров. Это доказывает возможность выбора ИС с интервалами компонент ДАСИ значительно меньшими, чем в MPEG-4, но в 2 раза большими, чем в предыдущей публикации1, – 4 кадра для ПДФ-1 и 8 кадров для других. Объем сигнала кадра при этом ИС будет снижен до 137,5 Кбит. Сложность такого ИС возрастет до 120 Кбит (600 тыс. УВ). Кадр будет сжат в 20 раз, но сохранит улучшение качества ТВИ. Общая сложность ДРС сжатия кадра с таким ИС (14 + 120) – около 134 Кбит (0,67 млн УВ). Инерционное сжатие снижает возможности дальнейшего сверточного сжатия, уменьшая статистическую избыточность.
Сокращение статистической избыточности сигнала кадра без инерционного сжатия было предложено еще в 1961 г.4 и реализовано программно в 1979 г.5. Необходимые "характеристические сдвиги"5 задавали отводы двоичных регистров сдвига (РС) анализатора синдрома (АС) сверточного кодека помехозащиты с малой плотностью проверок на четность (МППЧ – Low Density Parity Check – LDPC) со свойством "не более одного совпадения позиций ненулевых членов". Эти сдвиги задавали генераторные полиномы (ГП) кода, подбираемые вручную. Исследования КСС были проведены программно для кодовой скорости R=4/55. Двоичные символы контурного сигнала ПДФ-1 эти ГП преобразовывали в 4 последовательности, которые поступали на 4 входа АС, где их обрабатывали в четырех ГП подобно обработке четырех ветвей информационного сигнала при формировании проверочной последовательности. Было получено сжатие сигнала ПДФ-1 в 4 раза. При синтезе из них восстанавливали исходный контурный сигнал. Возникающие на хаотических позициях темные точки ошибок "интерференции" были незаметны. Испытать более высокие КСС компонент ПДФ-1 (до 10 раз) и КСС ПДФ-2 (до 8–15 раз) не удалось из-за трудностей поиска нужных ГП. Такая возможность возникла позже для ГП на базе таблиц совершенных разностных множеств (СРМ), использованных в кодеках МППЧ6, 7. В них были реализованы АС на микросхемах – стационарный ГП на СРМ-553 (Н1515ХМ7-158) для космического челнока "Буран" и нестационарный ГП на СРМ-133 (5503ХМ1-006) c изменяемыми характеристическими сдвигами от кадра к кадру для космического канала беспилотника6. Преимущества нестационарных ГП существенны и для микросхем КСС, так как сигналы смежных ПДФ и НДФ сильно коррелированны. Нестационарные ГП улучшают подавление интерференционных помех.
Для сжатия сигналов ПДФ-1 в 4 раза и других ПДФ и НДФ-3 в 8 раз нужны КСС с общей длиной ДРС вместе с вспомогательными цепями около 50 Кбит – 250 тыс. УВ. Сложность у КСС в 2,7 раза меньше, чем у второго ИС. Общий объем сигнала кадра КСС снижает до 137,5 Кбит, что соответствует такому же, как у ИС, сжатию сигнала ТВИ в 20 раз – скорости около 3,5 Мбит/с при высоком качестве ТВИ. Общая сложность сжатия кадра (14 Кбит) вместе с КСС (50 Кбит) – около 64 Кбит (320 тыс. УВ).
Стандартизованные (H.264 и H.265) системы сжатия объема телевизионного сигнала дают малое сжатие ТВИ монохромного стандарта 576i (625/50) – в 2 раза у H.264 (Moving Picture Experts Group – MPEG-4) и в 4 раза – у H.265 (High Efficiency Video Coding – HEVC) при сохранении или незначительном снижении качества ТВИ. На рынке до сих пор преобладает H.264, но быстро идет переход к H.265. Важная особенность этих систем – переход от программной реализации к аппаратной на микросхемах, но они очень сложны. Для MPEG-4 (Ericsson SVP 5500) нужна память на 2 Гбит. Для HEVC с двухъядерным процессором Qualcomm Snapdragon S4, показанном 29.02.2012 г. и реализованном на микросхемах с технологиями 45 и 28 нм типа System on a Chip – SoC (система на кристалле), нужна память 32 Гбит.
В кодере HEVC первый кадр ТВИ кодируют внутрикадровым предсказанием отсчета внутри кадра по соседним отсчетам. В следующих кадрах работает межкадровое предсказание, в котором по отсчетам опорного кадра и вектора движения, использующего подобие смежных кадров, оценивают текущие отсчеты каждого блока. Это предсказание много сложнее НДФ и ПДФ, используемых в ДАСИ. Кодер и декодер создают идентичные межкадровые предсказания, компенсируя движение с помощью векторов движения и данных выбранного режима, которые передают дополнительно. Возможно, что векторное предсказание в сочетании с сигналами НДФ и ПДФ позволит сжать кадр ДАСИ проще, чем описанные выше инерционное и сверточное сжатие. Но такое сжатие еще не исследовано и здесь не рассмотрено. Сложность сжатия кадра в 20 раз при ДАСИ со сверточным сжатием около 60 Кбит. Оно улучшает качество ТВИ и проще стандартов H.264 и H.265 более чем в 1000 раз.
Постановление Правительства РФ № 809 от 26.11.07 "Развитие электронной компонентной базы и радиоэлектроники на 2008–2015 гг." требует разработок на микросхемах аппаратуры, конкурентной на мировом уровне. Оно предусматривает реализацию технологии 45 нм в 2015 г. Современные технологии позволяют реализовать ДАСИ с КСС простыми средствами на базе отечественных микросхем. Двумерный анализ-синтез изображений3 является единственным алгоритмом, использующим простейшие аппаратные средства, подобные ранее успешно испытанным микросхемам помехоустойчивого и криптографического кодирования7. В НПК "Технологический центр МИЭТ" уже освоен выпуск БМК серий 5529 и 5521 с КМОП-технологиями 0,25 мкм и 0,18 мкм. Есть опыт совместных работ с МИЭТ. Максимальный объем этих БМК – 1500 тыс. УВ – в 5 раз превышает объем, нужный для реализации ДАСИ со сверточным сжатием. Необходимые МБИС с КМОП-технологиями с ПН до 0,13 мкм могут изготавливать "Ангстрем" и "Микрон" (Зеленоград). Томский НИИ полупроводниковых приборов для диапазона 3,1–5,1 ГГц разработал комплект интегральных микросхем для ВРС и технических средств охраны с частотами выше 30 ГГц по арсенид-галлиевой технологии с проектной нормой (ПН) 0,5 мкм.
Известный более 30 лет двумерный анализ-синтез изображений (ДАСИ) с инерционным и сверточным сжатием обеспечивает сжатие сигнала изображения в 20 раз – до скорости 3,5 Мбит/с и улучшают качество ТВИ. Дальнейшее увеличение сжатия ТВИ в 30 раз и более возможно с улучшенными инерционным и сверточным сжатием. Вероятно также, что векторное предсказание совместно с ДАСИ позволят увеличить сжатие и упростить его аппаратуру, но это требует исследований. Восстановленное ДАСИ после сжатия ТВИ имеет качество более высокое, чем у исходного ТВИ, что невозможно для других способов. Аппаратная реализация ДАСИ со сверточным сжатием на микросхемах более чем в 1000 раз проще способов сжатия систем MPEG-4 и HEVC по стандартам H.264 и H.265.
Опубликовано: Журнал "Системы безопасности" #1, 2015
Посещений: 9474
Автор
| |||
В рубрику "Наука" | К списку рубрик | К списку авторов | К списку публикаций