{"id":114588,"date":"2018-03-11T10:42:42","date_gmt":"2018-03-11T10:42:42","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/evaluating-techniques-for-parallelization-tuning-in-mpi-ompss-and-mpi-ompss\/"},"modified":"2018-03-11T10:42:42","modified_gmt":"2018-03-11T10:42:42","slug":"evaluating-techniques-for-parallelization-tuning-in-mpi-ompss-and-mpi-ompss","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/ciencia-de-los-ordenadores\/evaluating-techniques-for-parallelization-tuning-in-mpi-ompss-and-mpi-ompss\/","title":{"rendered":"Evaluating techniques for parallelization tuning in mpi, ompss and mpi\/ompss"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Vladimir Subotic <\/strong><\/h2>\n<p>La programaci\u00f3n paralela consiste en dividir un problema de computaci\u00f3n entre m\u00faltiples unidades de procesamiento y definir como interact\u00faan (comunicaci\u00f3n y sincronizaci\u00f3n) para garantizar un resultado correcto. El rendimiento de un programa paralelo normalmente est\u00e1 muy lejos de ser \u00f3ptimo: el desequilibrio de la carga computacional y la excesiva interacci\u00f3n entre las unidades de procesamiento a menudo causa ciclos perdidos, reduciendo la eficiencia de la computaci\u00f3n paralela.  en esta tesis proponemos t\u00e9cnicas orientadas a explotar mejor el paralelismo en aplicaciones paralelas, poniendo \u00e9nfasis en t\u00e9cnicas que incrementan el asincronismo. En teor\u00eda, estas t\u00e9cnicas prometen m\u00faltiples beneficios. Primero, tendr\u00edan que mitigar el retraso de la comunicaci\u00f3n y la sincronizaci\u00f3n, y por lo tanto incrementar el rendimiento global. Adem\u00e1s, la calibraci\u00f3n de la paralelizaci\u00f3n tendr\u00eda que exponer un paralelismo adicional, incrementando la escalabilidad de la ejecuci\u00f3n. Finalmente, un incremente en el asincronismo proveer\u00eda una tolerancia mayor a redes de comunicaci\u00f3n lentas y ruido externo.  en la primera parte de la tesis, estudiamos el potencial para la calibraci\u00f3n del paralelismo a trav\u00e9s de mpi. En concreto, exploramos t\u00e9cnicas autom\u00e1ticas para solapar la comunicaci\u00f3n con la computaci\u00f3n. Proponemos una t\u00e9cnica de mensajer\u00eda especulativa que incrementa el solapamiento y no requiere cambios en la aplicaci\u00f3n mpi original. Nuestra t\u00e9cnica identifica autom\u00e1ticamente la actividad mpi de la aplicaci\u00f3n y la reinterpreta usando solicitudes mpi no bloqueantes situadas \u00f3ptimamente. Demostramos que esta t\u00e9cnica maximiza el solapamiento y, en consecuencia, acelera la ejecuci\u00f3n y permite una mayor tolerancia a las reducciones de ancho de banda. A\u00fan as\u00ed, en el caso de cargas de trabajo cient\u00edfico realistas, mostramos que el potencial de solapamiento est\u00e1 significativamente limitado por el patr\u00f3n seg\u00fan el cual cada proceso mpi opera localmente en el paso de mensajes.  en la segunda parte de esta tesis, exploramos el potencial para calibrar el paralelismo h\u00edbrido mpi\/ompss. Intentamos obtener una comprensi\u00f3n mejor del paralelismo de aplicaciones h\u00edbridas mpi\/ompss para evaluar de qu\u00e9 manera se ejecutar\u00edan en futuras m\u00e1quinas. Exploramos como las aplicaciones mpi\/ompss pueden escalar en una m\u00e1quina paralela con centenares de n\u00facleos por nodo. Adem\u00e1s, investigamos c\u00f3mo este paralelismo de cada nodo se reflejar\u00eda en las restricciones de la red de comunicaci\u00f3n. En especia, nos concentramos en identificar secciones cr\u00edticas de c\u00f3digo en mpi\/ompss. Hemos concebido una t\u00e9cnica que r\u00e1pidamente eval\u00faa, para una aplicaci\u00f3n mpi\/ompss dada y la m\u00e1quina objetivo seleccionada, qu\u00e9 secci\u00f3n de c\u00f3digo tendr\u00eda que ser optimizada para obtener la mayor ganancia de rendimiento.  tambi\u00e9n estudiamos t\u00e9cnicas para explorar r\u00e1pidamente el paralelismo potencial de ompss inherente en las aplicaciones. Proporcionamos mecanismos para evaluar f\u00e1cilmente el paralelismo potencial de cualquier descomposici\u00f3n en tareas. Adem\u00e1s, describimos una aproximaci\u00f3n iterativa para buscar una descomposici\u00f3n en tareas que mostrar\u00e1 el suficiente paralelismo en la m\u00e1quina objetivo dada. Para finalizar, exploramos el potencial para automatizar la aproximaci\u00f3n iterativa.  en el trabajo expuesto en esta tesis hemos dise\u00f1ado herramientas que pueden ser \u00fatiles para otros investigadores de este campo. La m\u00e1s avanzada es tareador, una herramienta para ayudar a migrar aplicaciones al modelo de programaci\u00f3n mpi\/ompss. Tareador proporciona una interfaz simple para proponer una descomposici\u00f3n del c\u00f3digo en tareas ompss.  tareador tambi\u00e9n calcula din\u00e1micamente las dependencias de datos entre las tareas anotadas, y autom\u00e1ticamente estima el potencial de paralelizaci\u00f3n ompss. Por \u00faltimo, tareador da indicaciones adicionales sobre como completar el proceso de migraci\u00f3n a ompss. Tareador ya se ha mostrado \u00fatil al ser incluido en las clases de programaci\u00f3n de la upc.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Evaluating techniques for parallelization tuning in mpi, ompss and mpi\/ompss<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Evaluating techniques for parallelization tuning in mpi, ompss and mpi\/ompss <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Vladimir Subotic <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Polit\u00e9cnica de catalunya<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 26\/07\/2013<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Jes\u00fas Jos\u00e9 Labarta Mancho<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: bernd Mohr <\/li>\n<li>german Rodriguez herrera (vocal)<\/li>\n<li>  (vocal)<\/li>\n<li>  (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Vladimir Subotic La programaci\u00f3n paralela consiste en dividir un problema de computaci\u00f3n entre m\u00faltiples unidades de procesamiento [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[1890,15596],"tags":[227078,227079,2679,227077],"class_list":["post-114588","post","type-post","status-publish","format-standard","hentry","category-ciencia-de-los-ordenadores","category-politecnica-de-catalunya","tag-bernd-mohr","tag-german-rodriguez-herrera","tag-jesus-jose-labarta-mancho","tag-vladimir-subotic"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/114588","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=114588"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/114588\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=114588"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=114588"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=114588"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}