Поиск по сайту:

Смотри также:

Статья «Стандарты MPEG»

Относительно малая пропускная способность эфирных телевизионных каналов и сравнительно небольшие объемы памяти носителей цифровых сигналов накладывают существенные ограничения на распространение высококачественной видеоинформации. Для решения этой проблемы применяют "сжатие" видеосигналов - специальную кодировку, уменьшающую объемы цифровой информации без заметного ухудшения качества воспроизводимых изображений. Наибольшее распространение в настоящее время получили стандарты кодировки с общим названием MPEG.

Применяемый способ эффективной кодировки цифровых видеосигналов заключается в удалении пространственной и временной избыточности, присущих видео изображениям, и уменьшении тем самым занимаемого видеосигналами объема. За немного наукообразным определением понятия "сжатие" видеосигналов (изображений) стоит относительно простая, на первый взгляд, операция: выявление в видеосигнале повторяющихся фрагментов и избыточной информации и соответствующая их обработка.

Самый простой пример. Если в течение некоторого интервала времени видеосигнал не изменяется, то его достаточно передать или записать только один раз, т. е. сфотографировать, дополнив небольшим по объему пояснением: "Запомнить картинку и повторить указанное число раз". Экономия объема записываемой или передаваемой цифровой информации очевидна.

Следующий шаг - обработка изменяющихся изображений. Здесь задача посложнее, но тоже решаемая. Два соседних (по времени) изображения (кадра видеосигналов) можно сравнить и вместо второго передать не весь кадр, а только, то что изменилось в нем в сравнении с первым. Очевидно, что информация об изменениях в изображении (видеосигнале)занимает меньший объем, чем информация о полном кадре. Для не очень быстроизменяющихся изображений эффект получится весьма заметным. А такие сюжеты преобладают в большинстве видеофильмов: радикальные изменения в соседних кадрах происходят лишь при смене сюжета. К этому можно добавить еще и возможность синтеза кадров с промежуточными состояниями сюжета (сто из области компьютерной графики), а это еще расширяет возможности сжатия видеосигналов.

Простота здесь, конечно, кажущаяся. Практическая реализация сжатия видеосигналов идет через сложнейшую математику, специализированные сверхбольшие интегральные микросхемы и др. Но пользователей это не касается - они лишь пожинают плоды многолетней упорной работы специалистов многих стран мира.

Название MPEG происходит от наименования рабочей группы, созданной Международной организацией стандартизации совместно с Международной электротехнической комиссией для разработки стандартов сжатия видеосигналов - Moving Pictures Experts Group ("Группа экспертов по движущимся изображениям").

До появления первого стандарта, разработанного этой группой, - MPEG-1 - в международной практике для сжатия видеосигналов применяли стандарты H.261 и JPEG. Первый из них был разработан для телекоммуникационных систем и используется в основном для видеотелефонов, организации телеконференций и т.п. Стандарт JPEG получил название от другой Рабочей группы - Joint Photographic Experts Group ("Объединенная группа экспертов по фотографиям"). Хотя этот стандарт относится к кодированию неподвижных изображений, примененные в нем решения были очень важны для разработки стандарта MPEG-1, так как показали пути удаления из видеосигнала избыточной пространственной информации без заметной потери качества. Стандарт JPEG широко внедрен в компьютерной технике, цифровых фотокамерах, а также используется в Интернет.

Стандарт MPEG-1 был создан для записи на компакт-диски видеофильмов длительностью 74 минут (с сопутствующим звуковым сигналом) при скорости передачи данных до 1,5 Мбит\с. В этом стандарте для удаления избыточности одновременно обрабатывается десять соседних кадров. Стандарт MPEG-1 позволяет достичь сжатия цифровой видеоинформации в 100..150 раз.

Следующим продуктом группы MPEG стал стандарт MPEG-2, который уже создавался для универсального применения - для телекоммуникаций, вещания и хранения информации на различных носителях. Он поддерживает скорости передачи до 4 Мбит\с. Обеспечиваемое этим стандартом качество воспроизводимого изображения позволяет использовать его даже в телевидении высокой четкости. Стандарт MPEG-2 уже принят для цифрового телевизионного вещания (DVB - Digital Video Broadcasting) и универсальных видеодисков (DVD - Digital Versatilt Disc).

Одна из особенностей этого стандарта - динамичное изменение скорости передачи информации. Это позволяет обеспечить постоянное высокое качество изображения при относительно небольшой средней скорости передачи данных. При постоянной скорости их передачи ее надо либо избыточно увеличивать и, следователь, уменьшать эффект сжатия, либо выбирать не очень высокой и мириться с потерей качества при быстрой смене сюжета.

Сейчас группа MPEG занята разработкой стандарта MPEG-4, который определен "как интеллектуальное сжатие информации" и предназначен для использования в телекоммуникационных системах (в первую очередь, в подвижных и носимых). Он будет поддерживать скорости передачи данных до 64 Кбайт\с.

Хотя основные задачи MPEG лежат в области сжатия видеоинформации, разработчики уделяют большое внимание и сжатию аудио сигналов. И это естественно, поскольку в большинстве случаев изображение и звук неразделимы. Так, стандарты MPEG- Audio и MPEG-2 Audio приняты для записи видеофильмов на DVD дисках, которые идут на смену компакт-дискам.

Стандарт MPEG-1 Audio был создан практически одновременно с MPEG-2 и позволяет "пристраивать" биты звуковой стерео информации в видеоданные. При этом скорость их передачи лежит в пределах 128...384 кбайт\с (2 канала). Этот стандарт широко используют при записи видеофильмов на компакт-диски, а также для цифрового звукового вещания в Европе и Канаде.

Стандарт MPEG-2 Audio - "компаньон" стандарта MPEG-2. Он совместим с MPEG-1 Audio, но имеет ряд функциональных дополнений, необходимых для высококачественного звукового и телевидения высокой четкости.

Еще один стандарт, разработан группой MPEG, - MPEG-2 Digital Surround. Он работает с аудиосигналом Digital Surround формата 5.1, который имеет три фронтальных канала, два полноценных тыловых канала, и "сабвуфер" (его называют "каналом 0.1", откуда и появилось обозначение 5,1)

Всем понятно, что технология телевидения, основанная на развертке изображения на 625 и 525 строк и сформировавшаяся более пяти десятилетий назад, никак не могла конкурировать с качеством изображения в кино, которому соответствует телевизионная четкость от двух до четырех тысяч строк. Только такое разложение позволяет использовать для телевизионных систем большие экраны. Очевидное решение проблемы - еще большее увеличение числа строк и переход к цифровому телевидению высокой четкости.

Однако цифровое телевидение выдвигает и новые требования. Существующие каналы телевизионного вещания, например, могут обеспечить пропускную способность лишь около 32 Мбит/с, тогда как для передачи стандартного видеоизображения в цифровом виде требует более 210 Мбит/с. Переход же к формату 16:9 и ТВВЧ (телевидение высокой четкости) приводит к необходимости передачи информации более 1,2 Гбит/с. Следовательно, наземная сеть ТВВЧ требует специальной обработки видеосигнала для передачи по тем же каналам: коэффициент сжатия должен быть доведен до нескольких десятков, причем при обработке в реальном времени.

Работы по созданию ТВВЧ ведутся в ряде стран. Координирует их 11-я (телевизионное вещание) Исследовательская комиссия (ИК) сектора МСЭ-Р (ITU-R) Международного союза электросвязи, которую с начала 70-х годов возглавляет известный специалист М. И. Кривошеев. На 17-й Пленарной ассамблее МККР в Дюссельдорфе (1990 г.) была принята Рекомендация 709 "значение базовых параметров стандарта ТВЧ для студий и международного обмена". Ее основные положения следующие: формат кадра 16:9, 1920 отсчетов на строку; поток данных - 0,8...1,2 Гбит/с (в перспективе - до 2...3 Гбит/с) и т. д. Закреплено практическое использование двух стандартов (строк/полей/формат сигналов) - 1125/60/2:1 и 1250/50/2:1.

В 1992 году принято Приложение 11 к Рекомендации 709 по ТВЧ "Методы сокращения цифрового потока".

В апреле 1997 года на собрании 11-й ИК в Женеве удалось принять общий формат изображения ТВВЧ (число отсчетов по вертикали и горизонтали/формат сигналов)1920х1080/2:1 с частотой выборки 74,25 МГц. Предусмотрено сохранение существующих наземных частотных каналов (концепция 6-7-8). Новая рекомендация примирила два соперничающих стандарта: ATSC (США) и DVB-Т (Европа). Теперь они классифицируются как система "А" (модуляция 8-VSB - восьмиуровневая амплитудная с частично подавленной боковой полосой) и "В" (модуляция COFDM) соответственно. Приняты три системы многопрограммного телевидения, основанные на стандартах MPEG-2.

Однако до этих решений путь был не легким - от аналоговых широкополосных спутниковых систем к цифровым узкополосным.

Японская фирма NHK еще в 1964 году приступила к работе над ТВВЧ. В результате появилась первая в мире действующая цифро-аналоговая система MUSE (1125 строк, 60 полей, чересстрочная развертка) - это сокращение от multiple sub-Nyquist sampling encoding (кодирование с многократной субдискретизацией). С 1989 года в Японии началось регулярное спутниковое телевещание, которое сейчас достигает девяти часов в день. Долгое время использование системы Hi-Vision - так еще называют японский проект ТВВЧ - ограничивалось лишь спутниковым вещанием. Оно расширилось только после появления проигрывателей компакт-дисков. Ограничения в применении этой системы связаны с шириной спектра сигнала (27 или 24 МГц) и его интерференцией с сигналами действующего телевидения.

Хотя система MUSE постоянно совершенствуется (разработана система NarrowMUSE для наземного вещания с полосой частот 6 МГц), она по прежнему имеет значительную интерференцию с сигналами NTSC.

Второй известный проект ТВВЧ, воплощенный в действующий, - европейская система HD-MAC (high-definition multiplexed analog cjmponents - телевидение высокой четкости с временным уплотнением аналоговых компонентных сигналов). Первый вариант системы был разработан в 1982 году английской фирмой IBA.

Проект европейского ТВВЧ стал внедряться в связи с угрозой захвата японскими фирмами рынка спутникового вещания. Была даже принята директива европейского союза, в которой предписывалось к 1995 г. вместо системы PAL вести трансляцию по системе HD-MAC. Но так как в директиве конкретно указывался интервал частот 11,7...12,5 ГГЦ, осталась возможность использовать любой стандарт на более низких частотах. В условиях недостатка и дороговизны новых приемником вещательные компании воспользовались этим и погубили новую систему (сейчас только несколько спутниковых каналов применяют систему MAC).

Однако первым ударом по системе HD-MAC стала конвенция, принятая на Международной конференции в Амстердаме в ибле 1992 г., где группа скандинавских фирм продемонстрировала цифровое ТВВЧ - HD-Divine.

Система HD-Divine (буквальный перевод -"божественный ТВВЧ", а на самом деле это - сокращение от Digital Video Narrow-band Emission - цифровое узкополосное вещание) была разработана группой фирм и вещательных компаний: Teracom, Swedisn Television, Telia Reseach, Norwegian Telecom, Telecom Denmark, Digital Vision, Sentif.

Для уменьшения потока информации в системе применимо кодирование видеосигнала в несколько этапов. Сначала выполняется компенсация движения с использованием методов дискретно-импульсной кодовой модуляции. Вектор двжения формируется относительно предыдущего изображения для прямоугольников 4х2 элемента. Далее применяют кодирование переменной длины. Наконец, дискретно-косинусное преобразование (DCT - ДКП) над блоком 8х8 элементов завершает процедуру. Более подробно об этом рассказано ниже.

Сигналы HD-Divine передают в полосе частот стандартного телевизионного радиоканала шириной 8 МГц с использованием COFDM (кодирование ортогональное частотное с разделением несущих). Каждая из 448 несущих моделируется способом 16-QAM (квадратурная модуляция с 16-ю значащими позициями амплитуды и фазы), шаг несущих - 15 625 Гц. Такой способ зарекомендовал себя с наилучшей стороны в условиях сложной эфирной обстановки Европы и сильных замираний. Спектр COFD близок к прямоугольному, что повышает помехоустойчивость и эффективность использования частотного канала.

Демонстрация система HD-Divine уничтожила последнюю надежду на поддержку цифро-аналоговой системы HD-MAC.

Следует отметить, что еще до 90-х годов технология полностью цифрового телевидения считалась делом далекого будущего. Однако в 1990 г. фирма GIC (General Instrument Corp.) продемонстрировала образец такой системы ТВВЧ (HDTV). Спустя три года Федеральная Комиссия Связи США, рассмотрев четыре проекта HDTV, рекомендовала объединить усилия и выработать единый стандарт цифрового ТВВЧ.

Формат развертки	Область применения
720х1280, П, 60 кадров/с	Спортивные передачи, мультипликация, графика, записи NTSC, реклама
720х1280, П, 24 или 30 кадров/с	Сложные сцены фильмов, графика, мультипликация.
1080х1920, Ч, 30кадров/с	Сцены, снятые камерой с чересстрочной разверткой.
1080х1920, П, 24 или 30 кадров/с	Фильмы с наивысшей пространственной четкостью.

"Великий Альянс" собрал семь мировых лидеров: AT&T, GIC, MTI, Philips, David Sornof Reseach Center, Thomson, Zenith. В октябре 1994 г. были приняты решения по ключевым подсистемам: пакетированная система передачи данных, стандарт Dolby AC-3 для звука, технология компрессирования видеосигнала MPEG-2, набор форматов развертки изображения, которые перечислены в таблице (П - прогрессивная и Ч - чересстрочная развертки).

Главное технологическое достижение, позволившие создать новый цифровой стандарт ТВВЧ, обеспечила группа MPEG (Moving Picture Experts Group - Группа экспертов кино; встречаются и другие переводы, например: Институт техники движущихся изображений, Экспертная группа подвижного изображения) - международная организация, цель работы которой - выработка стандартов сжатия видеосигнала. Эта группа разработала стандарты MPEG-2, которые позволяют при сжатии спектра цифрового видеосигнала получить неизменно высокое качество от входа до выхода системы, значительное увеличение пропускной способности канала передачи, повышение функциональных возможностей системы, улучшение надежностных показателей аппаратуры.

Видеосигнал компенсируется более чем в 60 раз, что предоставляет возможность передавать по существующим телевизионным каналам сигнал цифрового ТВВЧ или 6-10 программ обычного телевидения, а так же большое количество другой информации. Обеспечивается и совместимость с компьютерной техникой, так как использованы аналогичные алгоритмы.

Разработанная система цифрового ТВВЧ имеет такой уровень готовности, что в США планируется к 2006 г. полностью отказаться от аналогового телевидения.

Стандарты MPEG-2 основаны на адаптивной обработке (согласованной с источником сигнала), уменьшении временной и пространственной избыточности, особенностях человеческого зрения и повышенной эффективности кодирования.

Структурная схема варианта кодера MPEG-2 показана на рисунке. Процесс адаптивной обработки начинается в препроцессоре. Цветовые сигналы R, G, B преобразуются в яркостный и цветоразностные сигналы. При этом появляется возможность использовать их высокую корреляцию. Далее цветоразностные сигналы проходят фильтр НЧ и прореживаются с фактором два по вертикали и горизонтали, что уменьшает поток информации в два раза, так как цветовое разрешение человеческого зрения существенно меньше, чем черно-белое.

Временную избыточность уменьшает блок оценки движения. Сигналы нового кадра, поступающие с препроцессора, сравниваются с хранимым в памяти кодера по макроблокам с размерами 16х16 элементов. Когда определяется подходящий макроблок, вырабатывается вектор, описывающий направление и дистанцию его движения. Информация о векторах и сведения из памяти поступают в предсказатель. В нем формируется видеосигнал предсказанной картинки, которая сравнивается в вычитателе с оригинальным кадром для получения сигнала разностного изображения.

Процесс уменьшения пространственной избыточности начинается с преобразования сигнала из временной в частотную область. Для этого выполняется ДКП над блоками 8х8 элементов разностной картинки. Результат ДКП - частотный спектр каждого блока. В отличие от полного телевизионного сигнала он существенно неравномерен. Чем меньше мелких деталей в блоке, тем меньше уровень высокочастотных компонент. С целью сжатия информации их отбрасывают. Более того, из-за малых размеров блока и наличия в реальных изображениях большого числа однотонных участков часто определенное значение имеет только компонента постоянного тока. Известно, что при типовом изображении 95% энергии приходится на низкочастотные составляющие, их-то и нужно передавать.

С выхода преобразователя ДКП информация поступает на квантователь, где происходит ее округление и весовая обработка в соответствии с заложенной матрицей. После такой операции частотные составляющие с малой энергией исчезают. Точность квантования можно изменять, т. е. Регулировать объем передаваемой информации (поэтому и наличие нескольких вариантов стандарта MPEG-2).

После квантования сигналы проходят в кодер, который повышает эффективность передачи информации. С такой целью используют несколько приемов. Во-первых, коэффициенты блока ДКП считываются в определенном порядке: от низких к высоким частотам. Причем часто получаются длинные последовательности нулевых уровней.

Во-вторых, для сжатия применяют код переменной длины. ОН как раз эффективен при большом числе повторяющихся знаков, так как в таком коде они передаются так: сначала указывают один нужный знак, а затем число его повторов.

В-третьих, используют не избыточные коды, основанные на статистике сообщений: символы, частота появления которых выше, кодируют меньшим числом двоичных знаков. В стандартах MPEG-2 применен код Хаффмена.

На выходе кодера поток битов имеет непостоянную скорость. Для его согласования с емкостью канала передачи включен буфер. В зависимости от его заполненности вырабатывается сигнал управления точностью квантования и, следовательно, поддерживается постоянная скорость передачи цифрового потока.

Для формирования сигнала точной предсказанной картинки необходимо в памяти кодера иметь копию передаваемого изображения с учетом всех искажений, возникающих при кодировании. Поэтому в кодер введена петля компенсации движения, состоящая из деквантователя, блока обратного ДКП (ОДКП) и сумматора. Фактически эта часть устройства представляет собой кодер.

В описанном алгоритме для предсказания сигнала текущего (настоящего) изображения применены сигналы предыдущего (прошлого) кадра, поступающие с видеоисточника. НО в некоторых случаях лучше использовать сигналы кадра, следующего за предсказуемым (будущего), или обоих (прошлого и будущего). Примером может служить ситуация мгновенной смены картинки, например, при переключении на другую камеру. При этом настоящий кадр лучше коррелирован с будущим, чем с прошлым.

В стандарте MPEG-2 определены три типа кадров: первый - совершенно новая картинка, называемая I-кадром (от intra - внутреннее); второй - изображение, предсказанное по прошлому кадру и называемое Р-кадром (от predicted - предсказанный) и третий - картинка, предсказанная по прошлому и будущему кадрам, называемая В-кадром (от bidirectional - двунаправленный). Однако использование В-кадра требует дополнительной памяти на кадр в приемнике. Сложность системы по третьему типу предсказания приводит к изменению последовательности передаваемых кадров: прежде чем передать В-кадр, необходимо передать как прошлый, так и будущий.

Рассмотренная система предсказания, применяемая для прогрессивной развертке изображения, изменяется при переходе на чересстрочную. Два передаваемых одно за другим поля соответствую различным моментам времени. При быстрой смене изображения они могут сильно отличаться. Поэтому предусмотрен ражим компенсации движения по полям. Кроме того, имеется основной дуальный режим только для видеосигналов с чересстрочной разверткой, когда В-кадр на используется. В этом режиме векторы движения, определенные в одном поле, работают и во втором.

Система компенсации движения требует обновления изображения, так как при первом включении телевизора, переключении на другой канал и потере сигнала кадр, хранимый в памяти декодера, отличается от передаваемого. Поэтому необходимо периодически передавать не разностную, а новую картинку. Предусмотрены два способа обновления. При использовании I-кадров периодически вместо коэффициентов ДКП разностной картинки передает реальные коэффициенты ДКП нового кадра. В способе прогрессивного обновления коэффициенты ДКП группы блоков новой картинки периодически передают на место коэффициентов того же макроблока разностной картинки.

Цифровое телевидение предполагает и идеальное звуковое сопровождение. Его обеспечивает цифровая система компрессирования Dolby AC-3. С 1991 г. ее применяют в киноаппаратуре. Шесть каналов звукового сопровождения (левый и правый тыл, левый и правый фронт, центр, низкие частоты - такую схему обозначают "канал 5.1") кодируют в поток информации. При частоте дискретизации 48 кГц и 18 битах на отсчет необходима пропускная способность канала для передачи не компрессированного звука достигает 48000х18х6=5,18 Мбит/с. По протоколу для передачи звука предусмотрен канал с пропускной способностью 384 кбит/с. Следовательно, требуемый коэффициент сжатия равен 13. Он обеспечивается спектральным анализом звуковых сигналов и удалением частотных компонент, не слышимых человеком.

Достоинством такой системы следует назвать неизменность уровня сигнала при переходе с канала на канал или от одного фрагмента к другому. Для аналогового телевидения характерны скачки громкости звука в таких ситуациях. По качеству новая система превосходит современное вещательное телевидение и стандарт VHS-Hi-Fi.

Система HDTV по своим возможностям во многом обязана пакетированной технологии передачи данных различных служб. Помимо видео- и звукового сигналов можно передавать любую дополнительную информацию, сообщения об услугах и т. д. Стандарт MPEG-2 предусматривает использование пакетов длиной 188 байт. Первые четыре байта составляют заголовок, содержащий сведения о синхронизации, типе информации, защите и др. Каждый пакет содержит информацию одного типа, например видеосигнал. Поэтому ее легко изменять. Пакетная передача хороша для наземного вещания, где высок уровень шумов и возможная потеря информации. Фиксированная длина пакета позволяет выявить блоки, не восстановленные устройством коррекции ошибок. Декодер при этом маскирует выпавшие интервалы.

Для передачи в эфир в сигнал вносят некоторые изменения. Байт синхронизации заменяют новым. Информация, поступающая с кодера, подвергается псевдослучайному скремблированию (шифрованию) для получения равномерного спектра сигнала. Дело в том, что при передачи неизменной информации возрастает интерференция сигналов HDTV с сигналами существующего телевидения. Сигнал же с равномерным спектром менее заметен. Последняя его обработка - добавление к 188 байтам информации 16 байтов кода Рида-Соломона для коррекции ошибок, вносимых каналом передачи.

Конечно, цифровое ТВВЧ не идеально. Компрессия приводит к потере части информации, но многочисленные эксперименты показали, что это практически незаметно. Качество же изображения получается очень высоким. Эффективность компрессирования позволяет применять новый стандарт, как для спутникового, так и для наземного вещания, кабельных сетей и видеозаписи без изменений в сложившемся распределении частотного диапазона. Переходить к нему можно с продолжением параллельного использования имеющейся аппаратуры.

В настоящее время положительно решен вопрос и об универсальном мировом стандарте цифрового телевизионного вещания. Идет широкое внедрение технологий на базе стандартов MPEG-2.