CCTV. Библия видеонаблюдения. Цифровые и сетевые технологии - Владо Дамьяновски
Шрифт:
Интервал:
Закладка:
Когда мы хотим достичь максимально возможного качества с максимально возможной скоростью записи в цифровых видеорегистраторах, лучше всего подходит межкадровое сжатие, поскольку оно эксплуатирует межкадровую избыточность видеопотока. Впрочем, для достижения максимальной эффективности требуется продолжительный по времени видеосигнал от одной телекамеры. Другим достоинством алгоритмов сжатия видеоизображения является то, что поддержка записи звука в них включена изначально. Алгоритмы с межкадровым сжатием используют предсказание движения (не путать с детектированием движения), что делает движение более плавным при воспроизведении. Кстати, именно поэтому такие алгоритмы и не используются при записи с мультиплексированием.
Более того, если в цифровом видеорегистраторе есть несколько видеовходов и межкадровое сжатие, то скорее всего по каждому входу он записывает на жесткий диск независимые видеопотоки.
Еще одна важная особенность, напрямую связанная с межкадровым сжатием, заключается в появлении задержки (отставания), которая хорошо заметна в таких стандартах сжатия, как MPEG-1 и MPEG-2. Это непосредственно связано с принципами, реализованными в межкадровом сжатии, где избыточность видеосигнала сокращается при сравнении кодируемого кадра с предшествующим и последующим, что требует буферизации и вызывает задержку при кодировании и декодировании. Этот эффект более всего заметен в стандарте MPEG-2, где высокое качество изображения достигается при высокой скорости передачи данных (обычно более 4 Мбит/с), что вызывает задержку от половины до одной секунды. В вещательном телевидении или при просмотре фильма на DVD такая задержка видеосигнала не будет существенной, но она может стать серьезной проблемой в видеонаблюдении, когда нужно управлять поворотной камерой, сигнал которой кодируется для передачи по сети. Впрочем, снизив скорость передачи данных и уменьшив размер структуры GOP (group of pictures), можно добиться приемлемой задержки в 200 миллисекунд и даже меньше с незначительным ухудшением качества изображения.
Рис. 9.4. Один и тот же фотоснимок с различным разрешением: 50x50, 100x100 и 200x200 пикселов
Стандарты сжатия видеоизображения, которые используют низкую скорость передачи данных и предназначены для видеоконференций (то есть предусматривают двустороннюю передачу видеопотоков), такие, как Н.263 и MPEG-4 имеют значительно меньшую задержку, хотя качество изображения тоже снижается.
За последнее десятилетие технологии обработки и сжатия изображения эволюционировали очень быстро и значительно. Хотя в большинстве случаев MPEG-2 доминирует в индустрии вещательного телевидения и DVD, не исключено, что новые и более эффективные стандарты сжатия со временем его вытеснят. К момену написания этой книги самым новым и наиболее перспективным стандартом сжатия видеоизображеия считался Н.264 (на базе MPEG-4 v.10, также известный как кодек AVC, advanced video codec), a самым новым и перспективным стандартом сжатия изображения был JPEG-2000 (на базе Wavelet-сжатия). Впрочем, будущее покажет, так ли это на самом деле.
Теперь перечислим стандарты сжатия, которые используются или могут быть использованы в ближайшeм будущем в видеонаблюдении. Более подробно мы их рассмотрим далее в этой главе.
— JPEG и Motion-JPEG (сжатие изображения)
— JPEG-2000 /Wavelet и Motion JPEG-2000 (сжатие изображения)
— MPEG-1 (сжатие видеоизображения, используется скорость передачи данных 1–3 Мбит/с)
— MPEG-2 (сжатие видеоизображения, используется скорость передачи данных 1-30 Мбит/с)
— MPEG-4 (сжатие видеоизображения, используется еще меньшая скорость передачи данных 9.6 кбит/с-1.5 Мбит/с)
— MPEG-7 (новая концепция, имеющая функции интеллектуального поиска объектов)
— MPEG-21 (самая новая концепция, обещающая большую степень интеграции возможностей семейства MPEG)
— Н.261 (сжатие видеоизображения, один из первых и самых старых стандартов, предназначен для видеоконференций, использует скорости передачи, кратные 64 кбит/c, характерные для ISDN)
— Н.263 (улучшенный Н.261, использует еще меньшие скорости передачи данных)
— Н.264/AVC (новый и прогрессивный стандарт сжатия видеоизображения с широкой областью применения)
— Другие (собственные и гибридные реализации)
Рис. 9.5. Аналого-цифровое преобразование начинается с дискретизации и квантования аналогового видеосигнала
Существуют и другие, гибридные виды сжатия, которые сочетают особенности сжатия изображения и сжатия видеоизображения. Например, сжатие типа Motion Wavelet или Multi-Layer JPEG и другие собственные разработки компаний-производителей.
Преимущества аппаратной компрессии очевидны: скорость сжатия постоянна и не зависит от загруженности центрального процессора другими задачами (передача по сети, резервное копирование данных и т. д.).
Впрочем, общеизвестно, что программная компрессия позволяет легко и быстро модифицировать устройства записи и добавлять новые функции, так как она зависит только от программного кода, который можно легко обновить.
ITU-601: Объединяя NTSC и PAL
Прежде чем перейти к обработке или хранению сигнала в цифровом формате, осуществляется его аналого-цифровое преобразование. Оно может производиться в сетевой телекамере или в цифровом видеорегистраторе. На этом этапе происходит дискретизация и квантование аналогового сигнала (преобразование в дискретную форму). Частота дискретизации и количество уровней квантования зависят от качества и быстродействия электроники и определяют разрешение (качество) оцифрованного изображения и частоту регенерации цифровой кадровой памяти. В данной связи необходимо понимать, что, несмотря на большой выбор вариантов дискретизации и квантования при аналого-цифровом преобразовании, был разработан телевизионный стандарт оцифровки и большая часть продукции, используемой в видеонаблюдении, соответствует ему.
Рекомендация ITU-R BT.601 определяет оцифровку аналогового видеосигнала, состоящего из яркостной компоненты Y красной цветоразностной компоненты и синей цветоразностной компоненты, с базовой частотой дискретизации 3.375 МГц, которая будет общей как для PAL, так и для NTSC. Яркостная компонента оцифровывается с четырехкратной базовой частотой дискретизации (то есть 3.375 х 4 = 13.5 МГц), а цветоразностные компоненты оцифровываются с двукратным увеличением базовой частоты дискретизации (то есть 6.75 МГц). Таким образом, этот формат оцифровки известен как 4:2:2. Существуют и другие форматы оцифровки, такие, как 4:1:1 и 4:4:4, но формат 4:2:2 является одним из наиболее распространенных в видеонаблюдении.
Если мы сейчас вспомним количество строк в кадре и количество кадров в секунду для стандарта, то, перемножив 625 строк в кадре на 25 кадров в секунду, получим 15625 строк в секунду. Теперь частоту дискретизации 13.5 МГц (то есть 13500000 раз в секунду) разделим на полученное значение, что даст нам 864 отсчета для каждой строки. Таково качество дискретизации видеосигнала PAL согласно рекомендациям ITU-601C частотой дискретизации 13.5 МГц. Поскольку длительность строки PAL составляет 64 мкс, то 864 отсчета, которые приходятся на строку, разбивают этот период времени на очень малые интервалы (см. рис. 9.6).
Рис. 9.6. Частота дискретизации, рекомендованная ITU-601
Следует отметить, что 864 отсчета в строке включают в себя и импульсы синхронизации.
Для стандарта NTSC с 525 строками и частотой обновления 59.94 Гц (именно 59.94, а не 60) мы получаем 525 х 29.97 Гц = 15734.25 строк в секунду. Разделив 13.5 МГц на 15734.25 Гц, получим 858 отсчетов на одну строку, которые опять будут включать в себя импульсы синхронизации.
Рис. 9.7. Дискретизация сигнала
Итак, подводя итоги, еще раз отметим, что, согласно рекомендации ITU-601, для дискретизации яркостного сигнала в стандарте PAL используется 864 отсчета на одну строку, а в стандарте NTSC — 858 отсчетов на строку. В обоих случаях используется частота 13.5 МГц.
Из изложенных выше фактов следует очень важный вывод: ITU-R BT.601 представляет собой первую международную рекомендацию, которая пытается объединить в рамках общей цифровой концепции дискретизации два несовместимых аналоговых композитных телевизионных стандарта (NTSC с 525/59.94 и PAL с 625/50). Основным достижением этой рекомендации стал выбор общей частоты дискретизации 13.5 МГц, которая одинакова для обоих стандартов.
Из 864 отсчетов для PAL и 858 отсчетов для NTSC в обоих случаях на активные строки без синхроимпульсов приходится по 720 отсчетов. Это максимальное горизонтальное разрешение видеосигнала, оцифрованного согласно рекомендации ITU-601. Термин «разрешение» здесь используется в более широком значении, чем в аналоговом телевидении, где разрешение выражено в ТВ-линиях, но об этом мы поговорим подробнее далее.