Какие этапы кодирования видеоинформации вам известны. Какие этапы кодирования видеоинформации вам известны?

Третий — RuTube, который предлагает видео на русском языке. По сути, это русская версия глобального YouTube. Он очень популярен в Российской Федерации. Среди его недостатков — нестабильная работа.

Просто о видеокодировании

Мы занимаемся технологиями кодирования видео с 1995 года, и сегодня мы хотели бы дать вам основы: краткий исторический обзор, основные этапы и алгоритмы кодирования в стандартах AVC/H.264 и HEVC/H.265.

Трудно представить, что существует область человеческой деятельности, которая так или иначе не была бы пронизана цифровым видео. Мы видим его по телевизору, на мобильных устройствах, на настольных компьютерах, мы сами снимаем его на цифровые камеры, мы находим его на улице, в магазинах, в больницах, в школах и университетах, на промышленных объектах всех видов. Слова и термины, непосредственно связанные с цифровым представлением видеоинформации, становятся все более привычными в нашей жизни. Время от времени в этой области возникают вопросы. Каковы различия и что делают различные устройства или программы, которые мы используем для кодирования/декодирования цифровых видеоданных? Какие из этих устройств/программ лучше или хуже и в каком отношении? Что означают бесконечные термины MPEG2, H.264/AVC, VP9, H.265/HEVC и т.д.? Давайте попробуем разобраться в этой теме.

Совсем краткая историческая справка

Первый общепризнанный стандарт сжатия видеоданных, MPEG2, был окончательно принят в 1996 году, после чего цифровое спутниковое вещание получило бурное развитие. Следующим стандартом стал MPEG4 Part 10 (H.264/AVC), который обеспечивает вдвое большее сжатие видео. Он был принят в 2003 году и дал толчок развитию систем DVB-T/C, интернет-телевидения и разнообразных услуг по обмену видео и видеосвязи. С 2010 по 2013 год международная Объединенная группа сотрудничества по кодированию видео (JCT-VC) упорно трудилась над созданием следующего стандарта сжатия видео, который разработчики назвали High Efficient Video Coding (HEVC) и который предусматривал следующее удвоение сжатия цифрового видео. Данный стандарт был принят в 2013 году. В том же году был принят стандарт VP9, разработанный компанией Google, который должен был догнать HEVC по степени сжатия видео.

Алгоритмы сжатия видео основаны на нескольких простых идеях. Если вы берете определенный сегмент изображения (называемый макроблоком в MPEG2 и AVC), вполне вероятно, что рядом или в соседних изображениях есть такой же сегмент. Таким образом, чтобы передать информацию о картинке в текущем сегменте, достаточно передать только отличие от ранее закодированного аналогичного сегмента. Процесс поиска похожих областей между ранее закодированными изображениями называется предсказанием. Набор значений разности, определяющих разницу между текущим патчем и найденным предсказанием, называется остатком. Различают два основных типа прогнозов. В первом случае значения предсказания представляют собой набор линейных комбинаций пикселей, смежных слева и сверху текущего участка изображения. Такое предсказание называется пространственным предсказанием (внутрипространственным предсказанием). Во втором предсказании используются линейные комбинации пикселей похожих сегментов изображения из ранее закодированных изображений (эти изображения называются опорными). Для извлечения изображения текущего сегмента, закодированного временным предсказанием, нам нужна информация не только об остатке, но и о количестве изображений, в которых находится похожий сегмент, и о координатах этого сегмента.

Остатки, полученные в результате предсказания, содержат меньше информации, чем исходное изображение, и требуют меньше битов для передачи изображения. Чтобы улучшить сжатие видео, системы кодирования видео используют один из видов спектрального преобразования. Обычно это косинусное преобразование Фурье. Такое преобразование позволяет выделить основные колебания в оставшемся двумерном остаточном сигнале. Это извлечение осуществляется на следующем этапе кодирования — квантификации. Последовательность квантованных спектральных коэффициентов содержит небольшое количество больших главных значений. Остальные значения с большой вероятностью равны нулю. В результате количество информации, содержащейся в квантованных спектральных коэффициентах, во много раз меньше, чем в исходном изображении.

На следующем этапе кодирования полученный набор квантованных спектральных коэффициентов подвергается энтропийному кодированию вместе с информацией, необходимой для предсказания декодирования. Это предполагает согласование наиболее распространенных значений в кодируемом потоке данных с самым коротким кодовым словом с наименьшим количеством битов. Наилучшую степень сжатия на этом этапе обеспечивают алгоритмы числового кодирования, которые в основном используются в современных системах сжатия видео.

Стандарт AVC

В стандарте AVC основным строительным блоком изображения является макроблок — квадратная область размером 16×16 пикселей (рис. 1). При поиске наилучшего варианта предсказания кодер может выбрать один из нескольких вариантов сегментации для каждого макроблока. Для пространственного внутрипространственного предсказания есть три варианта: предсказание для всего блока, разделение макроблока на четыре квадратных блока 8×8 или 16 блоков 4×4 пикселя, и предсказание для каждого из этих блоков независимо. Количество возможных вариаций разделения макроблоков при временном предсказании гораздо больше (рис. 1), что обеспечивает возможность подгонки размера и положения предсказанных блоков к положению и форме краев движущихся объектов на видеоизображении.

Рисунок 1: Макроблоки в AVC и возможные подразделы в Inter-prediction.

В AVC для пространственного предсказания используются значения пикселей из столбца слева от предсказываемого блока и из строки непосредственно над ним (рис. 2). Для блоков 4×4 и 8×8 предусмотрено 9 методов предсказания. В режиме предсказания, называемом DC, все вычисленные пиксели имеют одно значение, которое соответствует среднему арифметическому «соседних пикселей», отмеченных толстой линией на рис. 2. В других режимах выполняется «угловое» предсказание. В этом случае «соседние пиксели» размещаются внутри предсказанного блока в направлениях, показанных на рисунке 2. Если при движении в определенном направлении прогнозируемый пиксель «попадает» между «соседними пикселями», для прогнозирования используется интерполированное значение. Для блоков размером 16×16 пикселей существует 4 метода предсказания. Одним из них является уже обсуждавшееся предсказание постоянного тока. Два других соответствуют «угловым» методам, с направлениями предсказания 0 и 1. В четвертом методе, планарном предсказании, предсказанные значения пикселей определяются уравнением плоскости. Угловые коэффициенты уравнения определяются значениями «соседних пикселей».

Рисунок 2. Режимы «смежных пикселей» и предсказания в зависимости от угла в AVC.

Предсказание времени в AVC может быть реализовано в одном из двух вариантов. Каждый из этих вариантов определяет тип макроблока (P или B). Блоки предсказания P используют значения из области ранее закодированного изображения (эталонного) в качестве предсказания значений пикселей. Опорные изображения не удаляются из буфера декодированных изображений (DPB) в оперативной памяти до тех пор, пока они необходимы для перекрестного предсказания. Справочный список формируется из каталогов этих изображений в ДПБ. Кодер сообщает декодеру номер опорного изображения в списке и смещение области, используемой для предсказания, относительно позиции предсказываемого блока (это смещение называется «вектором движения»). Смещение может быть определено с точностью до ¼ пикселя. Если предсказание выполнено с нечисловым смещением, выполняется интерполяция.

Следующим этапом кодирования после предсказания значений кодированного блока и вычисления остаточного разностного сигнала является спектральное преобразование. AVC предлагает несколько вариантов ортогонального преобразования остаточного сигнала. При сквозном предсказании всего макроблока 16×16 остаточный сигнал делится на блоки 4×4 пикселя, каждый из которых подвергается целочисленному аналогу дискретного косинусного преобразования Фурье 4×4 в двух измерениях. Полученные спектральные компоненты, соответствующие нулевой частоте (DC) в каждом блоке, затем подвергаются дополнительному ортогональному преобразованию Уолша-Адамара. При временной интерполяции оставшийся остаточный сигнал делится на блоки размером 4 × 4 пикселя или 8 × 8 пикселей. Затем каждый из этих блоков подвергается двумерному 4 × 4 или 8 × 8 косинусному преобразованию Фурье (точнее, его интегральному эквиваленту).

Основные понятия о базах данных. Какие базы данных называются реляционными?

Будем знакомы! Обучаю школьников и студентов информационным технологиям

Здравствуйте все, меня зовут Александр Георгиевич. Я преподаватель информатики, математики, баз данных, алгоритмов и программирования в Москве.

Я понимаю, что вы очень заняты и профессиональны, но все же рекомендую вам ознакомиться с текстовыми оценками моих клиентов, которые проходили обучение под моим пристальным руководством. Все они достигли своих целей, а некоторые даже превзошли собственные ожидания.

В течение нескольких лет я веду собственный канал на видеоплатформе YouTube, где регулярно размещаю мультимедийные ролики с решениями информационных и математических задач. Присоединяйтесь к сообществу тысяч людей, к которому я присоединяюсь, чтобы стать более успешным в компьютерной сфере.

Специально для своих потенциальных клиентов я разработал мощную многофакторную систему фильтрации стоимости своих услуг. Даже самый разборчивый потребитель может определиться с ценовым планом в течение разумного количества времени.

В этом посте я расскажу о том, что такое кодирование видеоинформации, объясню основные алгоритмы, используемые для кодирования видеоинформации, а также дам краткий обзор современного видеохостинга, которым ежедневно пользуются несколько миллионов человек по всему миру.

Мои частные уроки проходят в разных территориальных форматах. Даже если вы живете не в Москве, я не вижу абсолютно никаких проблем с нашими эффективными курсами. Выберите нужный вам формат!

Позвоните мне на мобильный, задайте свои вопросы и запишитесь на первый пробный урок. Я довольно известный и востребованный преподаватель информационных технологий и ИКТ, а количество мест для студентов ограничено. Спешите записаться на индивидуальный урок сейчас, так как завтра мест может не остаться!

Общие сведения о видеоинформации

Видеоинформация — это относительно новый вид информации, который с каждым днем все больше и больше проникает во все сферы человеческой деятельности. Согласно официальной статистике, каждый пятый житель России ежедневно получает видеоинформацию либо по телевизору, либо через компьютер.

Видеоинформацию можно понимать так:

Фильм

Видеоклип

Телевизионная программа

Любой видеоконтент можно разделить на две части: Аудио и графика.

Первый вопрос, который вы, вероятно, задаете себе: какое отношение графическая информация имеет к видео? Вы должны знать следующий факт: Дискретная технология используется для создания эффекта движения на экране, что позволяет быстро сменять статичные изображения.

Научные исследования показали, что если за одну секунду сменяется около 15 статичных изображений, похожих друг на друга, человеческий глаз воспринимает эти изменения как аналоговые, то есть непрерывные. На этом эффекте основано все современное видео.

Поскольку видеоинформация состоит из звуковых и графических элементов, для обработки видеоматериала также требуется очень мощный персональный компьютер. Под обработкой видеоматериала я подразумеваю процесс оцифровки, т.е. кодирования видеоинформации.

После кодирования видеоинформация находится в двоичной форме, а, как вы знаете, процессор ПК может работать только с информацией в двоичной форме. Двоичный код — это последовательность битов, состоящая из 0 и 1.

Алгоритм кодирования видеоинформации

Итак, представим, что в нашем распоряжении имеется некоторая видеоинформация. Возьмем в качестве примера видео, опубликованное на популярном сайте видеохостинга YouTube.

Как уже упоминалось ранее, любая видеоинформация может быть дифференцирована, т.е. разделена на два основных компонента: Аудио и графика. Соответственно, функция для кодирования видеоинформации будет представлять собой комбинацию функций для кодирования аудио- и графической информации.

Как мы уже узнали, видео состоит из быстрой последовательности в основном одинаковых статичных изображений, называемых кадрами. Однако сегодня этот процесс стандартизирован, и все поставщики видеоконтента придерживаются этих стандартов.

Я не буду перечислять все существующие стандарты частоты кадров, а лишь упомяну два важных эталона в этой области:

В процессе киносъемок используют частоту смены кадров, равную 25 раз в секунду. Подобным стандартом пользуются при производстве телепрограмм, телешоу, телерепортажей.
В процессе создания широкоформатного видеоконтента прибегают к частоте смены кадров, равной 30 раз в секунду.

Первый — это разложение аналогового видеосигнала на два пути: звуковой и графический. Ради эксперимента предположим, что частота кадров составляет 25 раз в секунду. Это означает, что одна секунда видеопотока состоит из 25 быстро меняющихся статичных изображений.

Ссылки на публикации, описывающие алгоритмы кодирования аудио- и графической информации, приведены выше. То есть, отдельного алгоритма кодирования видеоинформации как такового не существует, а есть симбиоз алгоритмов кодирования аудио и графики по отдельности.

После оцифровки аудио- и видеоданных на выходе получается двоичный код, понятный процессору персонального компьютера. Этот двоичный формат используется для хранения видеоинформации на электронных носителях.

Если мы хотим воспроизвести видеоконтент на компьютере или другом устройстве, мы должны выполнить функцию поиска информации, то есть преобразовать информацию, записанную в двоичном коде, в формат, понятный человеку.

Единственное, на что я хотел бы обратить ваше внимание: когда мы смотрим видеоинформацию, мы одновременно видим «картинку» и слышим звук.

Процессор персонального компьютера выполняет эти функции в разных потоках для достижения синхронного воспроизведения аудио и графики. Это соответствует тому, что два сигнала, аудио и графика, вместе образуют видеопоток.

Урок 17 Представление нечисловой информации в компьютере

Когда говорят о видеозаписи, прежде всего имеют в виду движущееся изображение на экране телевизора или монитора.

Визуальное изображение преобразуется видеокамерой в последовательность электрических сигналов. Эти сигналы содержат информацию о яркости и цветовом тоне отдельных частей изображения. Они хранятся на носителе информации в виде изменений намагниченности видеоленты (аналоговая форма) или в виде последовательности закодированных комбинаций электрических импульсов (цифровая форма).

Процесс преобразования непрерывного сигнала в серию кодовых слов называется аналого-цифровым преобразованием. Это сложный процесс, состоящий из следующих элементов:

— выборка, при которой непрерывный сигнал заменяется последовательностью мгновенных значений через равные промежутки времени; — квантование, при котором значение каждого эталона заменяется округленным значением ближайшего уровня; — кодирование, при котором каждому значению уровней квантования, полученному на предыдущем этапе, присваиваются порядковые номера в двоичной форме.

Видеоинформация может храниться в форматах файлов AVI и MPEG.

AVI (Audio Video Interleave) — это формат несжатого видео. Это самый ресурсоемкий формат с наименьшей потерей данных.

MPEG (Moving Picture Expert Group) — формат для сжатия аудио и видео файлов для загрузки или отправки, например, через Интернет. Разработан экспертной группой по движущимся изображениям (MPEG) для разработки стандартов кодирования и сжатия видео- и аудиоданных.

Информационные процессы. Что такое информационные процессы?

Средства и технологии обработки видеоинформации

Для того чтобы хранить и обрабатывать видео на компьютере, оно должно быть закодировано специальным образом. Однако аудиокодирование видеоинформации ничем не отличается от аудиокодирования, описанного в предыдущей теме. Изображение в видео состоит из отдельных кадров, которые меняются с определенной частотой. Изображение кодируется как обычное растровое изображение, т.е. разбивается на несколько пикселей. Кодируя отдельные изображения и объединяя их, можно описать все видео.

Видеоданные характеризуются частотой кадров и разрешением экрана. Скорость воспроизведения видео составляет 30 или 25 кадров в секунду, в зависимости от стандарта видео. Наиболее известными из этих стандартов являются SECAM, который был введен в России и Франции, PAL, который используется в Европе, и NTSC, который используется в Северной Америке и Японии. Разрешение составляет 768 x 484 точек для NTSC и 768 x 576 точек для PAL и SECAM. Не все пиксели используются для хранения видеоинформации. Например, при типичном разрешении 768 x 576 пикселей на экране телевизора отображается только 704 x 540 пикселей. Поэтому, когда видеоинформация хранится на компьютере или цифровой видеокамере, размер изображения может отличаться от размера изображения на телевизоре.

Кодирование цветного видео основано на хорошо известной модели RGB. Телевидение, с другой стороны, использует другую модель для представления цвета изображения, а именно модель YUV. В этой модели цвет кодируется яркостью Y и двумя цветоразностными компонентами U и V, которые определяют значение цвета. Разностный компонент формируется путем вычитания красного и зеленого цветов из компонента яркости. Как правило, для каждого цветового компонента используется один байт, т.е. для представления одного цвета используется в общей сложности три байта информации. Сигналы яркости и цвета имеют одинаковое количество независимых значений. Эта модель называется 4:4:4:4:4.

Экспериментально установлено, что человеческий глаз менее чувствителен к изменениям цвета, чем к изменениям яркости. Вы можете вдвое уменьшить количество цветовых оттенков без заметной потери качества изображения. Эта модель называется 4:2:2 и приемлема для телевидения. Для потребительского видео приемлемо еще большее снижение цветовой размерности до 4:2:0.

Если каждый кадр представить в виде отдельного изображения указанного выше размера, то видеоизображение займет очень большой объем, например, одна секунда записи в системе PAL займет 25 Мб, а одна минута — 1,5 Гб. Поэтому на практике используются различные алгоритмы сжатия для уменьшения скорости и объема потока видеоданных. При сжатии без потерь наиболее эффективные алгоритмы позволяют уменьшить поток информации максимум вдвое. Сжатие с потерями используется для значительного уменьшения объема видеоданных.

Одним из наиболее известных алгоритмов с потерями является MotionJPEG или MJPEG. Префикс Motion указывает на то, что алгоритм JPEG используется для сжатия нескольких изображений, а не только одного. При кодировании видео MJPEG эквивалентен качеству VHS со скоростью передачи около 2 Мбит/с, а S-VHS — 4 Мбит/с.

Алгоритм MJPEG эволюционировал в алгоритм DV, который обеспечивает лучшее качество при той же скорости передачи данных. Это связано с тем, что алгоритм DV использует более гибкую схему сжатия, основанную на адаптивном выборе степени сжатия для различных видеоизображений и различных частей одного и того же изображения. Для сегментов изображения с малым количеством информации, таких как края изображения, сжатие увеличивается, а для блоков с большим количеством мелких деталей сжатие уменьшается.

Видеооборудование и программы

Обычный компьютер не подходит для ввода и обработки видео. Поэтому необходимо установить дополнительное оборудование. Это оборудование может варьироваться в зависимости от задач, которые вы хотите выполнить. Кроме того, сам компьютер должен отвечать определенным требованиям.

Для записи и редактирования видео нет особых требований к компьютеру, если он оснащен звуковой картой и имеет жесткий диск достаточной емкости и скорости. Имейте в виду, что один час высококачественного видео требует около 20 Гбайт дискового пространства. Результат работы программы редактирования видео выглядит следующим образом

В аналоговых видеокамерах изображение хранится на магнитной ленте на видеокассете. При записи на магнитную ленту изображение сохраняется на ленте путем преобразования его в магнитные импульсы. Во время воспроизведения магнитные импульсы преобразуются обратно в изображение. Аналоговые видеокамеры называются аналоговыми, потому что записываемая магнитная информация максимально приближена к оригиналу (аналог). Существуют различные стандарты для аналоговой видеозаписи: VHS, S-VHS, VHS-compact, Video-8, Hi-8 и другие. Они различаются по записываемым сигналам, формату и размеру видеокассеты. Аналоговые камеры могут иметь встроенные функции редактирования видео.

Аналоговая видеокамера

Чтобы импортировать фильмы, снятые аналоговой видеокамерой, в компьютер, необходима плата оцифровки и видеоввода. Эта плата подключает аналоговую видеокамеру или видеомагнитофон к компьютеру. Наиболее важными характеристиками этих карт являются максимальное разрешение изображения (обычно 768×576 пикселей), скорость оцифровки (25 или 30 кадров в секунду), пропускная способность (до 8-10 Мбайт/с) и возможность оцифровки сопровождающей музыки. Результатом работы этих карт является файл на компьютерном диске, содержащий снятое изображение.

Существуют также устройства видеозахвата, которые выпускаются как отдельные устройства и подключаются к компьютеру через шину USB. Однако пропускная способность шины USB недостаточна для передачи несжатого видео на компьютер. Поэтому все эти устройства используют сжатие с потерями.

Популярными аналоговыми видеоустройствами являются ТВ-тюнеры, которые объединяют ТВ-тюнер и карту видеоввода в одном компьютере. ТВ-тюнер позволяет смотреть телевизионные программы или видео на экране компьютера во весь экран или в окне. Приемник работает как обычный телевизор, за исключением того, что он использует экран вашего компьютера в качестве монитора. Это устройство представляет собой карту расширения, которая устанавливается в компьютер и содержит ряд соединений. Телевизионный приемник имеет антенный вход для подключения телевизионной антенны и композитный видеовход для подключения источников домашнего видеосигнала, таких как видеокамера, видеомагнитофон или проигрыватель видеодисков. Некоторые модели ресиверов могут также принимать радиосигналы, что позволяет слушать радиостанции через компьютер. После установки платы приемника компьютер становится теле- и радиоприемником.

Десять лет спустя. Стандарт HEVC: что нового?

Новый стандарт H.265/HEVC является дальнейшим развитием методов и алгоритмов сжатия видео, содержащихся в стандарте H.264/AVC. Давайте вкратце рассмотрим самые важные различия.

Эквивалентом макроблока в HEVC является блок кодирования (CU). Внутри каждой ТС выбираются регионы для расчета прогноза — единицы прогнозирования (ЕП). Каждый CU также определяет границы, в пределах которых выбираются области для вычисления дискретного ортогонального преобразования из остаточного сигнала. Главной отличительной особенностью HEVC является то, что сегментация видеоизображения на CUs является адаптивной, что делает возможным соответствие границ CUs границам объектов изображения (рис. 3). Такая адаптивность приводит к чрезвычайно высокому качеству прогнозирования и, следовательно, низкому значению остаточного сигнала. Неоспоримым преимуществом такого адаптивного подхода к сегментации кадров является также чрезвычайно компактное описание структуры сегментации. Максимально и минимально возможные размеры CU задаются для всей видеопоследовательности (например, 64×64 — максимально возможный CU, 8×8 — минимально возможный CU). Весь кадр слева направо и сверху вниз покрыт максимально возможным CU. Конечно, такое покрытие не требует передачи информации. Если требуется разделение внутри ТС, это обозначается флагом одиночного разделения. Если этот флаг имеет значение 1, то данная CU будет разбита на 4 CU (при максимальном размере CU 64×64, после разбиения мы получим 4 CU размером 32×32 каждая). Для каждого из полученных CU по очереди может быть передано значение флага разделения, равное 0 или 1. В последнем случае эта ТС снова разбивается на 4 меньшие ТС. Процесс продолжается рекурсивно до тех пор, пока флаг разбиения всех полученных CU не станет равным 0 или пока не будет достигнут минимально возможный размер CU. Таким образом, вложенные CU образуют четырехчленное дерево (Coding Tree Units, CTU).

Компьютерный вирус. Что такое компьютерный вирус?

Рисунок 3. Разделение видеоизображения на CUs является адаптивным.

Как упоминалось ранее, регионы в каждом CU выбираются для расчета предсказания — блок предсказания (PU). Во время пространственного предсказания область CU может быть идентична PU (режим 2Nx2N) или разделена на 4 квадратных PU половинного размера (режим NxN, доступен только для CU минимального размера). Во время прогнозирования времени возможны 8 вариантов разделения каждого CU на PU (рис. 3).

Рисунок 4. Возможное разделение блока кодирования на блок предсказания с пространственным (intra) и временным (inter) предсказанием CU.

Идея пространственного предсказания в HEVC такая же, как и в AVC. Блок PU использует линейные комбинации значений «соседних» пикселей слева и выше блока в качестве прогнозируемых значений выборки. Однако диапазон методов пространственного предсказания в HEVC стал гораздо шире. В дополнение к методам Planar (аналог Plane в AVC) и DC, каждый ПУ может предсказывать следующее

Существует два основных различия между предсказанием времени в HEVC и AVC. Во-первых, HEVC использует лучшие фильтры интерполяции (с большей частотной характеристикой) при вычислении опорных кадров с нецелыми смещениями. Второе различие касается способа представления информации об опорном диапазоне, которая необходима декодеру для предсказания. HEVC вводит «режим слияния», в котором различные PU, имеющие одинаковые смещения опорного диапазона, объединяются. Информация о векторе движения для всего объединенного диапазона передается один раз в одном потоке, что значительно сокращает объем передаваемой информации.

А что в результате?

На рисунках 4-7 показаны результаты многократного кодирования видео. На рисунке 4-7 показаны результаты кодирования нескольких видеопоследовательностей высокой четкости с помощью двух кодеров. Один из кодеков выполняет сжатие видеоданных в стандарте H.265/HEVC (на всех диаграммах результаты этого кодека помечены HM), в то время как второй кодек выполняет сжатие H.264/AVC.

Рис. 5. Результаты кодирования видеопоследовательности Aspen (1920×1080 30 кадров в секунду).

Рис. 6. Результаты кодирования видеопоследовательности BlueSky (1920×1080 25 кадров в секунду)

Рис. 7. Результаты кодирования видеопоследовательности PeopleOnStreet (1920×1080 30 кадров в секунду)

Рис. 8. Результаты кодирования движущейся видеопоследовательности (1920×1080 30 кадров в секунду).

Кодирование осуществлялось с различными значениями шага квантования спектральных коэффициентов и, соответственно, с различной степенью искажения видеоизображения. Результаты представлены в координатах Битрейт (Мбит/с) — PSNR (дБ). Значение PSNR является мерой степени искажения. В среднем можно сказать, что диапазон PSNR ниже 36 дБ соответствует высокой степени искажения, т.е. низкому качеству видеоизображения. Диапазон от 36 до 40 дБ соответствует среднему качеству. Значения PSNR выше 40 дБ указывают на высокое качество видео. Вы можете приблизительно оценить степень сжатия, предлагаемую системами кодирования. В диапазоне среднего качества скорость передачи данных, обеспечиваемая кодером HEVC, примерно в 1,5 раза ниже, чем выходная скорость передачи данных кодера AVC. Скорость передачи несжатого видео можно легко определить как количество пикселей в каждом видеокадре (1920 x 1080), умноженное на количество битов, необходимых для представления каждого пикселя (8+2+2=12) и количество кадров в секунду (30). Результат составляет приблизительно 750 Мбит/с. Диаграммы показывают, что кодек AVC обеспечивает скорость передачи данных около 10-12 Мбит/с в среднем диапазоне качества. Таким образом, сжатие видео происходит примерно в 60-75 раз. Как уже упоминалось, коэффициент сжатия в 1,5 раза выше при использовании кодека HEVC.

Профилактика синдрома «профессионального выгорания» у педагогов

Дополнительная скидка: 10% (только до 9 декабря)

К этой скидке мы можем добавить скидку для вашего учебного заведения (в зависимости от того, сколько ваших коллег участвовали в курсах «Инфорурок»).

В настоящее время 54 670 учреждений имеют право на дополнительные накопительные скидки (от 2% до 25%). Чтобы узнать, какая скидка распространяется на всех сотрудников вашего учреждения, войдите в личный кабинет Инфорурок.

«Подготовка и проведение презентации в PowerPoint»

1 слайд Кодирование видеоинформации

Анаит Казарян Анаит Рафиковская Учитель информатики в школе № 156 Калининского района Санкт-Петербурга.

2 слайд Видеоинформация — это последовательность изображений, выводимых на экран с определенной частотой (кадров в секунду), которая настолько высока, что смена изображений на экране незаметна.

3 Прозрачность Кодирование видео — это кодирование нескольких растровых изображений, при котором должно быть обеспечено одновременное кодирование звука и меняющихся изображений. Наиболее часто используемым методом кодирования аудио является оцифровка изображения с частотой 48 кГц. Изображение состоит из отдельных растровых изображений, которые меняются с частотой не менее 25 кадров в секунду, так что человеческий глаз воспринимает меняющиеся изображения как непрерывное движение.

4 Прозрачность Объем видеоинформации I = K i F t I — объем видеоинформации (в битах) K — размер изображения (в пикселях) i — глубина цвета (в битах) F — частота кадров (кадров в секунду) t — время отображения видеоинформации (в секундах).

Емкость видеоинформации — это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи видеоинформации.

5 Слайд Задача 1 Рассчитайте объем памяти (в килобайтах), необходимый для просмотра одноминутного фильма на мониторе с пространственным разрешением 800600 пикселей и цветовой палитрой 65536, когда изображение меняется 16 раз в секунду. N = 65536 F = 16 кадров в секунду K = 800 600 t = 1 мин = 60 с

I -? Ответ: 900 000 кБ. N = 2i i = 16 бит I = K i F t I = 800*600*16*16*60 бит = = 7 372 800 000 бит = 921 600 000 байт = 900 000 КБ

6 Слайд Задача 2 Рассчитайте, сколько информации (в гигабайтах) содержит 2-часовой цветной фильм, если один кадр содержит 1 Мб информации, а 36 кадров сменяются каждые 1 секунду. I1 = 1 Мб F = 36 кадров/секунду t = 2 часа = 7200 секунд

Краткое описание документа:

В презентации описано кодирование видеоинформации, которое сводится к кодированию изменяющихся изображений и звуков, при условии, что изображение и звук должны воспроизводиться одновременно.

В документе описаны наиболее важные форматы видеофайлов, включая сжатие, используемое на практике для уменьшения объема данных при кодировании видео.

Рабочие листы и материалы для учителей и воспитателей

Более 4 200 учебных материалов для школьного и домашнего обучения

Действие до 15 декабря

Опытные онлайн-репетиторы
Подготовка к ЕГЭ и ОГЭ
По всем школьным предметам 1-11 класс