Резюме

Въведение

H.264 стандартен метод за контрол на скоростта на кода

Стандартът H.264 е най-новият стандарт за видео кодиране. Той не само има високо съотношение на видео компресия, но също така има силен афинитет към мрежата и може да се адаптира към предаването на различни мрежови среди. Функцията на H.264 е разделена на два слоя: слой за кодиране на видео (VCL) и слой за абстракция на мрежата (NAL). Йерархичната структура на H.264 е показана на фиг. 1. Тази глава се фокусира върху h. 264 метод за управление на скоростта, в същото време в първата глава, въз основа на качеството на оценката на канала, видео кодирането H.264 и промяната на безжичния канал, в съответствие с оценката на качеството на канала от да се коригира битрейт на видео кодиране, направи кодирания видео поток може да се адаптира към промени в канала, така че да се подобри качеството на предаване на поточно видео. Контролът на битрейт е ефективен метод за подобряване на адаптивността на мрежата за видео компресирани данни. Понастоящем има много изследвания за методите за контрол на битрейта на H.264. Тази статия ги разделя на управление на битрейт въз основа на алгоритъм за кодиране и контрол на битрейт на база състояние на мрежата от гледна точка на това дали да се използва информация за състоянието на мрежата.

метод

Й.264 йерархична структура

Лагранжев алгоритъм разглежда множеството С = (С1, . Ск) на примерни стойности на К източник на информация, където Ск може да бъде вектор или скалар. Всяка пробна стойност Ск може да се кодира, като се избере някакъв режим на кодиране Азк = (Аз1, . Азк) в зададения режим на кодиране Ок = (Ок1, . ОkN). Следователно, съответстващ на множеството Сот примерните стойности има съответния набор Аз = (Аз1, . Азк) на кодиращите модели. Като се има предвид ограничената скорост на предаване R° С, режимът на кодиране, избран за дадена извадка от последователност, трябва да сведе до минимум изкривяванията след кодирането, както е показано във формула (1).

Във формула (1), д(С, Аз) и R(С, Аз) съответно представляват степента на изкривяване и битрейт на изходния битов поток. Сред тях битовият поток се кодира и квантува с помощта на режима на кодиране Аз за извеждане на пробата С.

В практическите приложения обикновено се използва следната формула за избор на режим на кодиране.

λ в уравнение (2) е параметър на Лагранж. За проба С и избрания от него режим на кодиране Аз, режимът на кодиране е оптимален при линейна комбинация от битрейт и степен на изкривяване J(С, Аз| λ) (Лагранжева функция на разходите) е най-малката.

Разглеждане на проба Ск, може да се счита, че скоростта на предаване и степента на изкривяване след кодирането са свързани само със съответния режим на кодиранеАзк, така че следните две формули са верни:

Следователно, докато за всяка проба е избран оптималният режим на кодиране СкС отделно, минималната стойност на J(С, Аз| λ) могат лесно да бъдат получени, за да се реализира съответният контрол на кодирането.

Въз основа на състоянието на контрола на скоростта на мрежовия код е кодирането на данните според важната степен е разделено на различни видове кадри, в зависимост от състоянието приема различна стратегия за мрежово предаване, този метод има много реализации, включителноБ.curfor за наличната честотна лента, RTTказа закъснението за двупосочно пътуване, PЗагубаказа скоростта на загуба на пакети, ке постоянна, в зависимост от отговора в приемащия край.

Литература [10] предлага тази скорост на загуба на пакети PЗагуба и скорост на възпроизвеждане на медиен поток Rток в приемащия край са използвани за прогнозиране на скоростта на предаване Rбъдещето в следващия момент в края на изпращането и в сравнение с текущата скорост на възпроизвеждане Rистория в края на изпращането, така че да се прецени качеството на канала и след това да се коригира QP стойността на кодера, както следва (QP показва параметрите на кодиране):

Колкото по-висока е QP стойността, толкова по-ниска е точността на кодиране, толкова по-размазано е изображението и е по-малък изходният битрейт; Напротив, колкото по-малка е QP стойността, толкова по-ясно е изображението и толкова по-висока е изходната битрейт. Този метод е широко проучен и прилаган поради своята простота и лесна реализация. Стратегията за контрол на скоростта на кода в тази статия също се прилага чрез коригиране на QP стойността.

Контрол на скоростта на кода H.264, базиран на дизайн на кръстосани слоеве

Процес на адаптиране на скоростта на междуслойния код и контрол на грешките

Диаграмата на декодиране на потока от видео данни

Стратегията за управление на битрейт в тази статия се реализира чрез получаване на наличната честотна лента на канала във времето и след това динамично регулиране на параметъра за кодиране H.264 (QP). Стандартът H.264 осигурява общо 52 QP стойности от 0 до 51 за процеса на кодиране. Когато QP е 0, това представлява най-сложното квантуване, а изходният битрейт е над 10Mbps. Когато максималната стойност на QP е 51, тя представлява най-грубото квантуване и изходният битрейт може да бъде под 100Kbps. За всяко 6 увеличение на QP, размерът на стъпката на квантуване се удвоява. На практика подходящият QP може да бъде избран гъвкаво според състоянието на канала. Конкретната схема за контрол на битрейта е както следва:

след установяване на връзката, изпращащият край започва да събира оригиналните видео данни и да ги компресира (използвайки QP стойността по подразбиране на кодера, която е 23 в този документ) и изпраща. Това, което трябва да се спомене тук, е, че IDR кадърът на първоначалния кадър на видео последователност не извършва контрол на скоростта на кода, тъй като приема вътрешнокадрово кодиране, което оказва влияние върху последващата реконструкция на изображението. След това се извиква функцията за придобиване на скорост на мрежова карта, за да се получи скоростта на предаване на мрежовата карта RPHY, и първоначалната стойност на ° СС = КRRPHY и КR е зададено на 0,5.

сканирайте скоростта на предаване на мрежовата карта RPHY след като се изпрати всеки кадър от данни, и актуализирайте QP стойността по следния метод

Ако (RBitout + V + ° СС)

В противен случай ако (RBitout > ° СС + V)

Където, RBitout е скоростта на изходния код на кодера H.264, който може да бъде получен директно от енкодера; V се определя като граница на честотната лента и стойността в тази статия е 0,5mbps. Неговата функция е да предотврати промяната на QP стойността твърде рязко и да доведе до намаляване на качеството на изображението. Тук долната граница на QP е зададена на 23 вместо минималната стойност 0, тъй като доброто качество на видеото може да се получи, когато QP е 23. Не е необходимо да се търси сляпо по-малката QP стойност и промяната на QP стойността също е твърде голям, което също ще предизвика силното трептене на размера на изходния поток и ще повлияе на ефекта на предаване.

настройте приемника да изпраща RR пакет на всеки 10 s. Подателят получава пакета RR и извлича степента на загуба на пакети P. Настройте стойността на КR както следва

Ако (P > Pа)

В противен случай ако (P $$ _R = _R \ ast \ ляво (1+ \ alpha \ дясно) $$

Където Pа и Pб са прагът на скоростта на загуба на пакети и α е константата за настройка на КR. В тази статия се вземат съответно 5%, 0,5% и 0,1. Използвайки този алгоритъм, когато мрежовата среда е относително стабилна и скоростта на предаване на основната мрежова карта е приблизително постоянна, информацията за обратна връзка от RTCP може автоматично да се коригира КR до стабилна стойност, така че скоростта на загуба на мрежови пакети да се поддържа на относително ниско ниво. Когато каналът се промени за кратко време, скоростта на физическия слой се променя съответно и изходната битова скорост ще бъде автоматично увеличена или намалена, за да се адаптира към промяната на канала. Когато мрежовата среда се промени, като например промени в конкурентния бизнес поток, RTCP обратната връзка може автоматично да се коригира КR. Следователно, тази многослойна стратегия за контрол на битрейта ефективно отчита краткосрочните промени в канала и дългосрочните промени в мрежовата среда.

Стратегия за капсулиране на RTP пакети, базирана на дизайн на кръстосани слоеве

VCL е отговорен главно за ефективен кодек и декодиране на цифрово видео, осигурявайки видео кодиращ поток с високо качество, високо съотношение на компресия, стабилност, класификация и други характеристики [5]. NAL е отговорен главно за правилното картографиране на видео кодирани данни, генерирани от слой за кодиране на видео, в различни предавателни мрежи. За да се предаде битовият видеопоток на кодиране, генериран от VCL, в определена мрежа, NAL капсулира кодиращия поток на VCL за тази мрежа и нейния протокол за предаване. По този начин H.264 може гъвкаво да възприема различни методи за капсулиране за различни предавателни мрежи и да подобрява адаптивността на мрежата. Всяка NAL единица се състои от зареждане на сурова байтова последователност (RBSP) и набор от информация за заглавки на NAL, съответстваща на видео кодирани данни. Структурата на NAL единичните последователности е показана на фиг. 3.

NAL единична последователност

За да направи данните, кодирани в H.264, по-удобни за мрежово предаване, най-новият стандарт RFC3984 дефинира три формата на натоварване за капсулиране на H.264 RTP, а именно единичен пакет от NAL, пакет за агрегиране и блок за парчета. При мрежовото предаване е необходимо само да се зададат кодираните данни H.264 в различни типове натоварване в съответствие с действителните изисквания на приложението и тогава главата на пакета RTP може да се използва за мрежово предаване.

За извличане на SVC слой е използван MGS метод за извличане на времеви слой. За CIF видео последователност SVC слоят се преобразува в четири DASH слоя. За 720p видео, картографирайте до 5 DASH слоя. Генерираните DASH операционни точки удовлетворяват средното разпределение на скоростта от най-ниското до най-високото ниво. Приет е метод, базиран на приоритетни доставки на медии (PMD), описан в литературата [1]. Буферът за всеки потребител е 20 s, а времето за предварително извличане на буфера е 6 s. В симулацията всички потребители на DASH искат едновременно видео. В LTE RTT на безжичната мрежа за достъп, ядрения пул и мрежовата страна е 50-60 ms. Предвид забавянето на Интернет, RTT от край до край в симулацията е 100 ms. TCP може ефективно да намали честите загуби на пакети и има добра производителност в безжичната мрежа.

Сравнихме алгоритъма DFSRA с добре познатите алгоритми за увеличаване на производителността на системата, анкетиране и пропорционално справедливо планиране. Междувременно е реализиран алгоритъмът за алчност на полезността в литературата [8], където се използва следната полезна функция:

Това е изпъкнала функция на скоростта, къдетоа1, а2, а3 е статична стойност. Параметрите на видео и компресия са различни, така че тези стойности са различни.

Резултати от симулация и анализ

Симулирахме предложения алгоритъм на симулационния инструмент Quainet. Симулира се сценарий, при който множество клиенти на DASH изискват динамични адаптивни йерархични видео потоци в LTE клетка. Използвани са съответно CIF видео последователност с химична скорост (конфигурация 1) и 720p hd видео с висока скорост (конфигурация 2).

Настройка на симулацията

Софтуерът H.264JSVM се използва за кодиране на CIF видео „Новини“ и „Форман“. Разполагат се адаптивно предсказване на слой макро блок и CABAC кодиране. Видеоклипът съдържа 300 кадъра, ИЗПОЛЗВА първите 240 кадъра и повтаря видеоклипа 10 пъти. Видео „Foreman“ е дълга видеопоредица, която ИЗПОЛЗВА първите 2400 кадъра при честота на кадрите 25 кадъра в секунда. GoP е настроен на 16. Всеки видео сегмент съдържа 3 GoP. Параметрите за квантуване на основния слой и слоя за подобрение бяха избрани съответно 40 и 28. Стойността на теглото на MGS е зададена съответно на A. Подобрителният слой е кодиран в 4 MGS слоя и 5 времеви слоя и съдържа общо 20 MGS слоя. Видеото е кодирано от референтния софтуер H.264 в симулацията. Характеристиките на компресия на видеото са показани в таблица 1.

Индексът за оценка

Следният QoE индекс се използва за оценка на ефекта на предаване. Висока ефективност: PSNR се използва за оценка на качеството и високата ефективност на видеото. Стабилност на възпроизвеждане: използвайте следните индикатори за измерване на стабилността на възпроизвеждането.

Сред тях втората част е индексът на нестабилност, а \ (_i ^ \) е най-високото ниво на приемане на i чип. Функцията на теглото се случва ϖ(д) = Аз - д повече наказание за скорошни промени в лихвения процент. Ниво на буфер: Клиентите на DASH трябва да изтеглят достатъчно данни, за да избегнат прекъсване. Но също така избягвайте да губите мрежова честотна лента, като изтегляте твърде много данни. Непрекъснатост на играта: основната пиеса отчита броя на парчетата, надвишаващи крайния срок за игра и продължителността на всяко спиране на играта. Вероятността за прекъсване се определя като броят на прекъсванията, разделен на общото време на игра. Честност: справедливостта се измерва чрез разликата в PSNR на различните потребители, които гледат един и същ видеоклип.

Резултати от симулация и анализ

На първо място, предложеният метод за картографиране от SVC към DASH е симулиран. Съответният метод от SVC слой до DASH слой се нарича метод на картографиране, който също може да се разглежда като специален случай на предлагане на метод на картографиране. В симулацията всички потребители се намират на разстояние от 250 до 350 м от базовата станция. Тази част от симулацията ИЗПОЛЗВА алгоритъма за планиране на PF по подразбиране. Предложеният метод може да намали режийните заглавки на съобщението с 50%. За CIF видео, предложеният метод може да увеличи пропускателната способност с поне 50%, а HD видеото с поне 240 kbps. Тъй като броят на потребителите намалява, растежът ще бъде повече. В конфигурация 1 броят на потребителите е 12; в конфигурация 2 броят на потребителите е 22 (вж. фиг. 4). Когато 7 T е по-малък, може да се постигне по-добро качество на възпроизвеждане, но стабилността е лоша. Можете също така да видите, че колкото по-голяма е смъртта, толкова по-голям е буферът. Това е така, защото DPBS иска бъдещи остри блокове с данни, когато счита, че текущата заявка е нестабилна.

Балансът между ефективност и стабилност