{"id":110787,"date":"2011-08-09T00:00:00","date_gmt":"2011-08-09T00:00:00","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/parallel-video-decoding\/"},"modified":"2011-08-09T00:00:00","modified_gmt":"2011-08-09T00:00:00","slug":"parallel-video-decoding","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/tecnologia-de-los-ordenadores\/parallel-video-decoding\/","title":{"rendered":"Parallel video decoding"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Mauricio Alvarez Mesa <\/strong><\/h2>\n<p>El v\u00eddeo digital es una tecnolog\u00eda popular utilizada en una gran variedad de aplicaciones. La calidad de v\u00eddeo, expresada en la resoluci\u00f3n espacial y temporal, ha ido aumentando constantemente en los \u00faltimos a\u00f1os. Con el fin de reducir la tasa de bits requerida para su almacenamiento y transmisi\u00f3n, se ha desarrollado una nueva generaci\u00f3n de codificadores y decodificadores (c\u00f3decs) de v\u00eddeo. El c\u00f3dec est\u00e1ndar de v\u00eddeo m\u00e1s reciente, conocido como h.264\/avc, incluye herramientas sofisticadas de compresi\u00f3n que requieren m\u00e1s recursos de computaci\u00f3n que los c\u00f3decs de v\u00eddeo anteriores. El efecto combinado del v\u00eddeo de alta calidad y las herramientas de compresi\u00f3n avanzada incluidas en el h.264\/avc han llevado a un aumento significativo de los requerimientos computacionales de la decodificaci\u00f3n de v\u00eddeo.  el objetivo principal de esta tesis es proporcionar el rendimiento necesario para la decodificaci\u00f3n en tiempo real de v\u00eddeo de alta calidad. Nuestra soluci\u00f3n ha sido la explotaci\u00f3n simult\u00e1nea de m\u00faltiples niveles de paralelismo. Por un lado, se realizaron modificaciones en el decodificador de v\u00eddeo con el fin de extraer m\u00faltiples niveles de paralelismo. Y, por otro lado, se modificaron las arquitecturas de prop\u00f3sito general para mejorar la explotaci\u00f3n del tipo paralelismo que est\u00e1 presente en las aplicaciones de v\u00eddeo.  primero hicimos un an\u00e1lisis de la escalabilidad de dos extensiones de instrucci\u00f3n simple con m\u00faltiples datos (simd por sus siglas en ingl\u00e9s): una de una dimensi\u00f3n (1d) y otra matricial de dos dimensiones (2d). Se demostr\u00f3 que al escalar la extensi\u00f3n 2d se obtiene un mayor rendimiento con una menor complejidad que al escalar la extensi\u00f3n 1d.  luego se realiz\u00f3 una caracterizaci\u00f3n de la decodificaci\u00f3n de h.264\/avc en aplicaciones de alta definici\u00f3n (hd) donde se identificaron los n\u00facleos principales. Debido a la falta de un punto de referencia (benchmark) adecuado para la decodificaci\u00f3n de v\u00eddeo hd, desarrollamos uno propio, llamado hd-videobench el cual incluye aplicaciones completas de codificaci\u00f3n y decodificaci\u00f3n de v\u00eddeo junto con una serie de secuencias de v\u00eddeo en hd.  despu\u00e9s optimizamos los n\u00facleos m\u00e1s importantes del decodificador h.264\/avc usando instrucciones simd. Sin embargo, los resultados no alcanzaron el m\u00e1ximo rendimiento posible debido al efecto negativo de la desalineaci\u00f3n de los datos en memoria. Como soluci\u00f3n, evaluamos el hardware y el software necesarios para realizar accesos no alineados. Este soporte produjo mejoras significativas de rendimiento en la aplicaci\u00f3n.  aparte se realiz\u00f3 una investigaci\u00f3n sobre c\u00f3mo extraer paralelismo de nivel de tarea. Se encontr\u00f3 que ninguno de los mecanismos existentes pod\u00eda escalar para sistemas masivamente paralelos. Como alternativa, desarrollamos un nuevo algoritmo que fue capaz de encontrar miles de tareas independientes al explotar paralelismo de nivel de macrobloque.  luego implementamos una versi\u00f3n paralela del decodificador de h.264 en una m\u00e1quina de memoria compartida distribuida (dsm por sus siglas en ingl\u00e9s). Sin embargo esta implementaci\u00f3n no alcanz\u00f3 el m\u00e1ximo rendimiento posible debido al impacto negativo de las operaciones de sincronizaci\u00f3n y al efecto del n\u00facleo de decodificaci\u00f3n de entrop\u00eda.  con el fin de eliminar estos cuellos de botella se evalu\u00f3 la paralelizaci\u00f3n al nivel de imagen de la fase de decodificaci\u00f3n de entrop\u00eda combinada con la paralelizaci\u00f3n al nivel de macrobloque de los dem\u00e1s n\u00facleos. La sobrecarga de las operaciones de sincronizaci\u00f3n se elimin\u00f3 casi por completo mediante el uso de operaciones aceleradas por hardware.  con todas las mejoras presentadas se permiti\u00f3 la decodificaci\u00f3n, en tiempo real, de v\u00eddeo de alta definici\u00f3n y alta tasa de im\u00e1genes por segundo. Como resultado global se cre\u00f3 una soluci\u00f3n escalable capaz de usar el n\u00famero creciente procesadores en las arquitecturas multin\u00facleo.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Parallel video decoding<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Parallel video decoding <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Mauricio Alvarez Mesa <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Polit\u00e9cnica de catalunya<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 08\/09\/2011<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Alejandro Ram\u00edrez Bellido<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: eduard Ayguad\u00e9 parra <\/li>\n<li>dimitris s. Nikolopoulos (vocal)<\/li>\n<li>ben Juurlink (vocal)<\/li>\n<li>roberto Georgi (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Mauricio Alvarez Mesa El v\u00eddeo digital es una tecnolog\u00eda popular utilizada en una gran variedad de aplicaciones. [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[4810,44209,15596,2535],"tags":[57152,221030,221029,15960,221028,200158],"class_list":["post-110787","post","type-post","status-publish","format-standard","hentry","category-arquitectura-de-ordenadores","category-ordenadores-digitales","category-politecnica-de-catalunya","category-tecnologia-de-los-ordenadores","tag-alejandro-ramirez-bellido","tag-ben-juurlink","tag-dimitris-s-nikolopoulos","tag-eduard-ayguade-parra","tag-mauricio-alvarez-mesa","tag-roberto-georgi"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/110787","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=110787"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/110787\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=110787"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=110787"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=110787"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}