{"id":113241,"date":"2018-03-11T10:40:35","date_gmt":"2018-03-11T10:40:35","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/programming-model-and-run-time-optimizations-for-the-cell-b-e\/"},"modified":"2018-03-11T10:40:35","modified_gmt":"2018-03-11T10:40:35","slug":"programming-model-and-run-time-optimizations-for-the-cell-b-e","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/arquitectura-de-ordenadores\/programming-model-and-run-time-optimizations-for-the-cell-b-e\/","title":{"rendered":"Programming model and run-time optimizations for the cell\/b.e."},"content":{"rendered":"<h2>Tesis doctoral de <strong> Pieter Bellens <\/strong><\/h2>\n<p>El modelo de programaci\u00f3n starss aboga por una forma impl\u00edcita de paralelismo, caracterizada por el an\u00e1lisis de dependencias de datos en tiempo de ejecuci\u00f3n. Describimos cellss como una implementaci\u00f3n de starss para el cell broadband engine (cell \/b.E.), Enfoc\u00e1ndonos en el dise\u00f1o escalable y distribuido de las bibliotecas y en el desarrollo de aplicaciones. En la segunda categor\u00eda, documentamos exhaustivamente el desarollo de la fft y del integral histogram en cellss.   Cellss utiliza un bundle scheduler, localizado en la biblioteca ppe y compensa su simplicidad mediante t\u00e9cnicas en las spes que explotan la localidad temporal en tiempo de ejecuci\u00f3n. Particularmente, smart stage-out y software caching disminuyen la necesidad de ancho de banda y al mismo tiempo aumentan potencialmente el rendimiento general de una aplicaci\u00f3n. En general nuestra implementaci\u00f3n de starss complementa t\u00e9cnicas livianas en el ppe mediante optimizaciones distribuidas en las spes, las cuales se adaptan de forma oportunista al programa y el estado del sistema. Este dise\u00f1o encuentra el justo equilibrio entre calidad y eficiencia o bien reduce gastos generales.     Demostramos que el bundle scheduler puede extenderse para mejorar la localidad temporal de programas en cellss. No obstante, en un hardware actual este incremento no puede alcanzarse de forma eficiente y los gastos generales asociados al locality scheduler propuesto afectan contrariamente el makespan de una aplicaci\u00f3n. Formas exitosas de explotar la localidad temporal y aumentar el rendimiento deben ser distribuidas y\/o reducir los gastos generales en la biblioteca en el ppe.   Bypassing distribuye en tiempo de ejecuci\u00f3n la gesti\u00f3n de objetos a trav\u00e9s del empleo de spes y transporta directamente objetos entre spes, sin necesidad de pasar a trav\u00e9s de la memoria principal y sin arbitraje por parte de ppe. Esta t\u00e9cnica distribuye completamente el software cache o unifica el espacio ls, obteniendo as\u00ed un mayor porcentaje de reutilizaci\u00f3n de objetos y una mejor localidad temporal. Cada spe utiliza el hardware de acceso at\u00f3mico del cell\/b.E. Para localizar, duplicar y compartir objetos en el sistema con otros spes. Bypassing permite run-time liveness analysis en cellss, lo cual reduce alternativamente la necesidad de banda ancha de los spes. En particular, lazy stage-out intenta mantener un objeto en el espacio ls hasta que pueda ser determinado que ya no est\u00e9 vivo y la transferencia dma asociada pueda evitarse. Just-in-time renaming extiende el esquema de renaming original de starss y  intenta reducir el n\u00famero y tiempo de vida de los renamings, y por consiguiente, la huella de la memoria.   De igual modo, el bundle scheduler se beneficia de un dise\u00f1o m\u00e1s distribuido en el cual spes seleccionan tareas del constdg, una aproximaci\u00f3n conservadora del task dependence graph (tdg). Nuestra implementaci\u00f3n de scheduling distribuida y especulativa delega parte de la l\u00f3gica a la biblioteca spe con el fin de reducir los gastos generales de scheduling en el tiempo de ejecuci\u00f3n en el ppe. Por consiguiente, podemos rebalancear o redistribuir los componentes de la biblioteca ppe entre los threads y as\u00ed alcanzar una significativa mejor\u00eda general en el rendimiento.  A pesar de que la implementaci\u00f3n de ideas expuestas se limita a cellss, \u00e9stas son lo suficientemente globales como para trasladarlas a otras arquitecturas o modelos de programaci\u00f3n paralelos. Passing, jit renaming, lazy stage-out y speculative distributed scheduling se basan en conceptos como la tdg, comunicaci\u00f3n asincr\u00f3nica, memoria local distribuida y tareas. Estos conceptos no son  espec\u00edficos a cellss pero impregnan la pr\u00e1ctica moderna.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Programming model and run-time optimizations for the cell\/b.e.<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Programming model and run-time optimizations for the cell\/b.e. <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Pieter Bellens <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Polit\u00e9cnica de catalunya<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 27\/09\/2012<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Rosa Mar\u00eda Badia Sala<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: enrique salvador Quintana orti <\/li>\n<li>mark Bull (vocal)<\/li>\n<li>  (vocal)<\/li>\n<li>  (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Pieter Bellens El modelo de programaci\u00f3n starss aboga por una forma impl\u00edcita de paralelismo, caracterizada por el [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[4810,6474,15596],"tags":[64969,136440,224979,145634],"class_list":["post-113241","post","type-post","status-publish","format-standard","hentry","category-arquitectura-de-ordenadores","category-lenguajes-de-programacion","category-politecnica-de-catalunya","tag-enrique-salvador-quintana-orti","tag-mark-bull","tag-pieter-bellens","tag-rosa-maria-badia-sala"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/113241","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=113241"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/113241\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=113241"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=113241"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=113241"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}