В последние несколько лет все чаще аналоговый видеосигнал с видеокамер наблюдения оцифровывается в целях архивирования и передачи. В настоящей статье приведен обзор доступных в настоящее время способов оцифровки и сжатия данных и сравниваются преимущества и недостатки их использования в системах охранного телевидения (CCTV).
Цифровой видеосигнал обладает многими преимуществами перед аналоговыми видеосигналами: цифровые видеосигналы можно обрабатывать с помощью компьютеров или сигнальных процессоров и транслировать посредством цифровых сетей. Кроме того, передача по уже существующим (телефонным) линиям и запись без потерь на жесткие диски являются дополнительными преимуществами цифровых видеосигналов. Поскольку оцифрованный видеосигнал соответствует стандарту CCIR 601, однако имеет очень высокую скорость передачи данных — 216 Мбит/с, необходимо использовать соответствующие методы сжатия данных, чтобы их обработка и передача нашли практическое применение.
Алгоритмы сжатия, разработанные для различных приложений на международном уровне, были испытаны и стандартизованы различными организациями. Различные методики являются единственной альтернативой достоверной оценке, так как они были разработаны в различных целях и, таим образом, лучше всего подходят для решения определенных задач. В целом спектр существующих стандартизованных методов сжатия видео покрывает практически все приложения. Поэтому методика, которая используется для технологий обеспечения безопасности, также должна быть основана на международных стандартах — за исключением специфических задач. Некоторые из этих алгоритмов сжатия допускают определенные вариации в пределах стандарта, позволяющие оптимальным образом адаптироваться к требованиям технологии обеспечения безопасности.
Большинство распространенных методов сжатия видео основаны на статистическом подобии смежных пикселей. Изображение обычно поблочно преобразуется в пространство частот с помощью дискретного косинус-преобразования — DTC (Discrete Cosine Transformation). Используются психовизуальные свойства человеческого зрения. При кодировании видео можно также воспользоваться строгой временной корреляцией последовательности кадров, т.е. отображаемые объекты обычно неподвижны или перемещаются в более или менее постоянном порядке. Если различие между изображениями рассчитывается с оценочным учетом движения, необходимо передавать только изменения от кадра к кадру.
Видеокамеры, используемые в технологиях обеспечения безопасности, имеют обычное разрешение 512x576 активных пикселей, а при повышенном разрешении — обычно 752x582 активных пикселей. В соответствии со стандартом CCIR 601, 720x576 пикселей оцифровываются с информацией цвета YUV 4:2:2. Это эквивалентно качеству S-VHS с аналоговой полосой частот приблизительно от 6 до 7 Мгц. Т.к. для многих задач достаточно качества VHS, был определен стандартный формат изображений CIF (Common Intermediate Format — общий промежуточный формат) с разрешением 352x288 пикселей для сигнала яркости Y и 176x144 пикселей — для сигналов цветности U и V. Использование разрешения CIF значительно сокращает объем данных, в то же время обеспечивая адекватное качество изображения.
JPEG
Стандарт JPEG был разработан группой Joint Photographic Expert Group (входящей в состав ISO) для эффективного хранения отдельных кадров. С коэффициентом сжатия от 10 до 20 можно сохранять отдельные кадры без видимой потери качества. При больших значениях коэффициента сжатия — до 40, отчетливо заметны артефакты квантования. Разрешающая способность как таковая стандартом не регламентируется. На базе стандартных форматов и с целью достижения оптимального компромисса между качеством и требованиям к пространству для хранения разрешение CIF 352x288 пикселей стало обычным и в технологиях обеспечения безопасности.
M-JPEG
Последовательность видео состоит из множества отдельных кадров. Путем многократного применения метода JPEG, описанного выше, к кадрам последовательности видео, можно сократить объем данных сигналов камеры. Этот метод называется Motion JPEG, или просто M-JPEG. Таким образом, это не новая самостоятельная методика. Поскольку соотношение между отдельными кадрами в M-JPEG в расчет не принимается, этот метод дает лишь относительно низкие коэффициенты сжатия по сравнению с методами H.320/H.261 или MPEG, описанными ниже. Однако, M-JPEG широко распространен в технологиях обеспечения безопасности, особенно для архивирования видеозаписей, что обусловлено простотой доступа к отдельным кадрам и относительно низкой стоимостью необходимого оборудования. Одна из проблем заключается в том, что метод M-JPEG не является международным стандартом, и в JPEG не предусмотрен стандарт передачи. Поэтому рекомендации различных производителей несовместимы. Как вариант, различие между последовательными кадрами часто также кодируется методом JPEG, чтобы достичь дальнейшего сокращения объема данных. Этот метод различия кадров также не стандартизирован, поэтому декодер того же производителя требует дополнительного декодирования.
H.320/H.261
Стандарт H.320 рекомендован Международным телекоммуникационным союзом ITU-T (Inter-national Telecommunication Union) и некоторое время назад был окончательно разработан. H.320 состоит из набора подстандартов, которые рассматривают отдельные части сложных систем. Например, H.261 описывает кодирование видео, а H.221 рассматривает мультиплексирование звука, видео, данных и информации управления. Рекомендации H.320 главным образом относятся к системам видеоконференций и видеотелефонов и оптимизированы для передач посредством цифровых сетей с комплексными услугами (ISDN — Integrated Services Digital Network). При 128 кбит/с (2 канала ISDN B) можно достичь хорошего качества изображения при очень хорошей частоте обновления изображения. Благодаря широкой полосе пропускания от 64 до 1920 кбит/с можно воспользоваться большинством других средств передачи (LAN, WAN). В частности, поскольку H.320 был разработан для двустороннего общения людей, данный стандарт хорошо подходит для передач в реальном времени для технологий обеспечения безопасности. При коммуникациях «человек-человек» важно, что задержка составляет десятые доли секунды, поскольку иначе общение не комфортно. Эта ориентация на кратковременную задержку удобна для технологий обеспечения безопасности, например, если действие предпринимается по результатам дистанционного видеоконтроля или даже только при дистанционном управлении камерами. Еще одна важная возможность, которую можно реализовать в соответствии со стандартом H.320, — это возможность выбора качества изображения. Пользователь может выбирать между оптимизацией по разрешению или по динамике изображения, останавливаясь на оптимальном соотношении. H.261 обычно передает изображения с разрешением CIF (352x288), описанным выше, однако может передавать их с учетверенным разрешением QCIF (176x144). В Приложении D к стандарту описан также режим высокого разрешения — 704x576 пикселей. H.320 не ограничивается кодированием изображения, он устанавливает стандарты и всех остальных компонентов системы передачи. Большим преимуществом H.320 является, таким образом, его совместимость с терминальными устройствами разных производителей. Например, видеофон ISDN одного производителя может осуществлять аудиовизуальные коммуникации с системой видеоконференций ISDN или с передатчиком видео ISDN другого производителя, если оба устройства поддерживают стандарт H.320.
H.263
H.263 — это дальнейшее развитие метода H.261, специально оптимизированное для низких скоростей передачи данных — ниже 64 кбит/с в рамках стандарта H.324, например, для связи с помощью модема и аналоговых телефонных линий. H.320 предусматривает использование H.263 как альтернативу H.261, если оба терминала поддерживают этот стандарт. Использование H.263, особенно для передачи по мобильной радиосети GSM (9600 бит/с) или по аналоговой телефонной линии, повышает качество изображения и частоту его обновления. При более высоких скоростях передачи данных качество сравнимо с H.261.
MPEG-1
MPEG (Moving Pictures Expert Group) — это стандарт, разработанный экспертной группой ISO. MPEG был впервые представлен как MPEG-1 для хранения видеозаписей на CD-ROM и был рассчитан на качество уровня VHS. MPEG-1 определяет формат изображений SIF (352x288 пикселей) и типичную скорость передачи данных 1,5 Мбит/с. Структура метода подобна H.320. Однако, поскольку он был ориентирован на хранение видеосигналов, задержки не учитывались. Напротив, для поддержки возможностей устройств видеозаписи, например, ускоренного продвижения в прямом и обратном направлении, в потоке данных распределялись кадры I-frame (одиночные кадры с JPEG кодированием), обеспечивающие равномерный доступ ко всей записи. Сокращение эффективности при этом обычно компенсируется путем формирования двух кадров с двунаправленной интерполяцией (B-кадры) на кодированный разностный кадр (P-кадр). Поскольку запись не имеет прямого отношения к реальному времени, этот прием не имеет последствий. Однако в системах реального времени несвязанные соотношения вызывают задержки из-за того, что следующее кодированное изображение должно передаваться прежде, чем будет возможно начать интерполяцию выбранного изображения. Если не руководствоваться требованиями к хранению различных изображений, пульт дистанционного управления камеры не может работать по этой методике. Если MPEG используется без B-кадров и отдельных I-кадров, он практически идентичен H.320.
MPEG-2
Расширение стандарта MPEG-1, MPEG-2, было разработано специально для цифрового телевидения. MPEG-2 имеет доступ к чередованию строк, используемому в стандартных телевизионных сигналах. Кроме того, MPEG-2 предусматривает большое количество уровней качества и вариантов выбора, именуемых профилями и уровнями, которые позволяют осуществлять передачу видео на профессиональном уровне. Определена скорость передачи данных до 15 Мбит/с.
MPEG-4
Сейчас MPEG-4 стал стандартным методом компрессии в системах видеонаблюдения. Он используется устройствами приема / передачи IP систем видеонаблюдения Bosch. MPEG-4 изначально разрабатывался для кодирования видео при чрезвычайно низких скоростях передачи данных (<<64 кбит/с). Однако первые результаты оказались не очень убедительными даже в сравнении с H.324, и все внимание обратилось на средства взаимодействия с содержанием изображения и описание сцен, составленных из естественного и сгенерированного компьютером содержимого. MPEG-4 определяет набор средств, позволяющих описать любой ограниченный участок изображения и должен представлять интерес для задач редактирования изображений и видео.
Wavelet
Как и JPEG, метод вейвлет-преобразований был также предназначен для кодирования отдельных кадров. Методом JPEG изображение сначала делится на блоки размером 8x8, которые затем кодируются по отдельности. Однако метод вейвлет предусматривает также фильтрацию всего изображения с целью разделения его на различные уровни разрешения. Таким образом, изображение последовательно разделяется на высокочастотные и низкочастотные компоненты (пирамида разрешения), что также важно для человеческого восприятия. Волны различной формы, именуемые «вейвлетами», используются для фильтрации, и их коэффициенты описывают содержание изображения. Преимущество вейвлет-преобразования, как минимум в теории, — более компактное описание в сравнении с JPEG. Более того, артефакты, которые неизбежны при высокой степени сжатия, обычно ощущаются более приемлемо при использовании вейвлетов: при сильном сжатии кодированные вейвлетами изображения становятся менее четкими, и края изображения смазываются фильтром (размываются), тогда как для JPEG возникает раздражающий эффект «блокировки» в результате независимого кодирования блоков изображения. На практике методы вейвлетов и JPEG не проявляют значительных различий в качестве, несмотря на заявления об обратном, сделанные в рекламных целях. Большое количество возможностей, основанных на вейвлетах, препятствуют стандартизации, поэтому никакой совместимости между разными кодерами и декодерами нет.
Фрактальное сжатие изображений
Как и JPEG, этот метод сжатия не лишен потерь и основан на фрактальной геометрии. Основой метода является рассмотрение естественных объектов как «подобным самим себе» и подчиняющимся требования фрактальной геометрии, в которой грубые структуры выглядят точно так же, как и тонике структуры, т.е. повторяют их. Задачей кодирования является отыскание таких совпадений в цифровых изображениях и описание таких фракталов с дальнейшим эффективным повторением. Сжатие таким методом крайне замедлено ввиду сложности анализа и не было стандартизовано.