{"id":118185,"date":"2018-03-11T10:48:07","date_gmt":"2018-03-11T10:48:07","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/desarrollo-de-solvers-cfd-ha%c2%adbridos-en-plataformas-heterogeneas\/"},"modified":"2018-03-11T10:48:07","modified_gmt":"2018-03-11T10:48:07","slug":"desarrollo-de-solvers-cfd-ha%c2%adbridos-en-plataformas-heterogeneas","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/complutense-de-madrid\/desarrollo-de-solvers-cfd-ha%c2%adbridos-en-plataformas-heterogeneas\/","title":{"rendered":"Desarrollo de solvers cfd h\u00edbridos en plataformas heterog\u00e9neas"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Pedro Valero Lara <\/strong><\/h2>\n<p>La comunidad de din\u00e1mica de fluidos computacional (cfd) siempre ha explorado  nuevas formas para aprovechar las plataformas de computaci\u00f3n de alto  rendimiento en su continua b\u00fasqueda de simulaciones m\u00e1s r\u00e1pidas y precisas.  Durante los \u00faltimos a\u00f1os, la irrupci\u00f3n de las arquitecturas heterog\u00e9neas ha  sido una de las tendencias m\u00e1s importantes en este campo y se han creado nuevos desaf\u00edos y oportunidades para optimizar el rendimiento de los  solvers considerados estado del arte. En este trabajo hemos explorado  algunas de estas nuevas oportunidades.    nuestros solvers objetivo se enmarcan en el dominio de los flujos  incompresibles. A pesar de los significativos avances que han logrado las  metodolog\u00edas m\u00e1s avanzadas en este campo, un aspecto que sigue necesitando de  m\u00e1s investigaci\u00f3n es la aceleraci\u00f3n de los solvers incompresibles, en  particular cuando se manejan problemas de gran dimensi\u00f3n con geometr\u00edas  complejas. El coste computacional de este tipo  de solvers est\u00e1 dominado frecuentemente por la soluci\u00f3n de la ecuaci\u00f3n  de poisson para la determinaci\u00f3n de la presi\u00f3n. Nuestra primera contribuci\u00f3n en  esta tesis ha explorado la aceleraci\u00f3n en sistemas heterog\u00e9neos de los  denominados m\u00e9todos r\u00e1pidos para la soluci\u00f3n de esta ecuaci\u00f3n. Primero  investigamos el rendimiento de diferentes algoritmos en procesadores multicore  y en gpus por separado y posteriormente estudiamos la ejecuci\u00f3n conjunta en  ambos tipos de procesadores. Como era previsible, en los procesadores multicore  las aproximaciones de grano grueso proporcionan los mejores resultados,  mientras que en gpus es mejor utilizar alternativas de grano fino basadas en  estrategias de reducci\u00f3n c\u00edclica extendidas. Nuestra principal contribuci\u00f3n de esta parte de la tesis ha sido el dise\u00f1o de una aproximaci\u00f3n heterog\u00e9nea que es  capaz de combinar ambas estrategias y beneficiarse del solapamiento entre cpus  y gpus.    desafortunadamente, el rendimiento global que estos solvers r\u00e1pidos  no satisface los objetivos que nos hab\u00edamos establecido. Es por ello  que en la segunda parte de esta tesis hemos tratado de superar esa limitaci\u00f3n  intr\u00ednseca de los solvers basados en navier stokes estudiando como  alternativa el m\u00e9todo de lattice-boltzmann (lbm). El dise\u00f1o de implementaciones  paralelas de lbm se ha estudiado de forma extensiva y han mostrado que puede alcanzar grandes rendimientos en aceleradores  del tipo gpu.  Sin embargo, las simulaciones que pretendemos realizar presentan geometr\u00edas complejas y no basta con solvers lbm puros. Una  aproximaci\u00f3n prometedora para tratar estos problemas es la combinaci\u00f3n de lbm  con el m\u00e9todo de las fronteras immersas (ib: immersed boundaries).  En primer lugar hemos comprobado  como implementaciones directas de ambos m\u00e9todos (lbm e ib) por separado no  escalan bien, ya que la correcci\u00f3n ib degrada de forma notable el rendimiento  global. Nuestra principal contribuci\u00f3n ha sido el dise\u00f1o de una implementaci\u00f3n  h\u00edbrida que permite solapar la ejecuci\u00f3n de ambos m\u00e9todos (lbm e ib) en plataformas heterog\u00e9neas, ocultando de forma efectiva las penalizaciones  introducidas por ib. De hecho, el solvers h\u00edbrido es capaz de ocultar  totalmente la penalizaci\u00f3n causada por la correcci\u00f3n ib.     la principal idea de este trabajo ha consistido en la restructuraci\u00f3n de los c\u00f3digos para permitir una  mejor coordinaci\u00f3n entre el procesador host y el  acelerador, permitiendo el solapamiento de sus ejecuciones. Con dicho  solapamiento hemos sido capaces de ocular el coste de las transferencias de  datos entre el host y el acelerador y las penalizaci\u00f3n causada por  cuellos de botella secuenciales, es decir, hemos usado el procesado host como una acelerador de fases secuenciales del c\u00f3digo<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Desarrollo de solvers cfd h\u00edbridos en plataformas heterog\u00e9neas<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Desarrollo de solvers cfd h\u00edbridos en plataformas heterog\u00e9neas <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Pedro Valero Lara <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Complutense de Madrid<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 19\/10\/2015<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Manuel Prieto Matias<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: Luis Pi\u00f1uel moreno <\/li>\n<li>abel Francisco Paz gallardo (vocal)<\/li>\n<li>Miguel C\u00e1rdenas montes (vocal)<\/li>\n<li>johan Jansson (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Pedro Valero Lara La comunidad de din\u00e1mica de fluidos computacional (cfd) siempre ha explorado nuevas formas para [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[4810,986,18041],"tags":[14014,232468,72452,125069,232467,232466],"class_list":["post-118185","post","type-post","status-publish","format-standard","hentry","category-arquitectura-de-ordenadores","category-complutense-de-madrid","category-flujos-de-fluidos","tag-abel-francisco-paz-gallardo","tag-johan-jansson","tag-luis-pinuel-moreno","tag-manuel-prieto-matias","tag-miguel-cardenas-montes","tag-pedro-valero-lara"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/118185","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=118185"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/118185\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=118185"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=118185"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=118185"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}