{"id":22370,"date":"2003-01-04T00:00:00","date_gmt":"2003-01-04T00:00:00","guid":{"rendered":"https:\/\/www.deberes.net\/tesis\/sin-categoria\/aprendizaje-por-refuerzo-en-espacios-de-estados-continuos\/"},"modified":"2003-01-04T00:00:00","modified_gmt":"2003-01-04T00:00:00","slug":"aprendizaje-por-refuerzo-en-espacios-de-estados-continuos","status":"publish","type":"post","link":"https:\/\/www.deberes.net\/tesis\/carlos-iii-de-madrid\/aprendizaje-por-refuerzo-en-espacios-de-estados-continuos\/","title":{"rendered":"Aprendizaje por refuerzo en espacios de estados continuos"},"content":{"rendered":"<h2>Tesis doctoral de <strong> Fernando Fernandez Rebollo <\/strong><\/h2>\n<p>El aprendizaje por refuerzo es un modelo de aprendizaje que permite implementar comportamientos inteligentes de forma autom\u00e1tica. La mayor parte de la teor\u00eda del aprendizaje por refuerzo tiene su fundamento en la programaci\u00f3n din\u00e1mica, y por tanto, en lo que se denominan funciones de valor. Sin embargo, la implementaci\u00f3n tradicional de estas funciones en forma tabular no es pr\u00e1ctica cuando el espacio de estados es muy grande, o incluso infinito. cuando se produce esta situaci\u00f3n, se deben aplicar m\u00e9todos de generalizaci\u00f3n que  permitan extrapolar la experiencia adquirida para un conjunto limitado de estados, a la totalidad del espacio. Existen dos aproximaciones b\u00e1sicas para resolver este problema. Por un lado, est\u00e1n aquellas t\u00e9cnicas que se basan en obtener una discretizaci\u00f3n adecuada del espacio de estados. Por otro lado, est\u00e1n los m\u00e9todos basados en implementar las funciones de valor con alg\u00fan m\u00e9todo supervisado de aproximaci\u00f3n de funciones, como, por ejemplo, una red de neuronas. En esta tesis doctoral se pretende desarrollar m\u00e9todos de aprendizaje por refuerzo que sean aplicables en dominios con espacios de estados continuos, partiendo de las dos aproximaciones planteadas anteriormente, fundiendo las ventajas de una y otra en un m\u00e9todo eficaz y eficiente que permita que el aprendizaje sea un proceso totalmente autom\u00e1tico.<\/p>\n<p>&nbsp;<\/p>\n<h3>Datos acad\u00e9micos de la tesis doctoral \u00ab<strong>Aprendizaje por refuerzo en espacios de estados continuos<\/strong>\u00ab<\/h3>\n<ul>\n<li><strong>T\u00edtulo de la tesis:<\/strong>\u00a0 Aprendizaje por refuerzo en espacios de estados continuos <\/li>\n<li><strong>Autor:<\/strong>\u00a0 Fernando Fernandez Rebollo <\/li>\n<li><strong>Universidad:<\/strong>\u00a0 Carlos III de Madrid<\/li>\n<li><strong>Fecha de lectura de la tesis:<\/strong>\u00a0 01\/04\/2003<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n<h3>Direcci\u00f3n y tribunal<\/h3>\n<ul>\n<li><strong>Director de la tesis<\/strong>\n<ul>\n<li>Daniel Borrajo Mill\u00e1n<\/li>\n<\/ul>\n<\/li>\n<li><strong>Tribunal<\/strong>\n<ul>\n<li>Presidente del tribunal: arturo Ribagorda garnacho <\/li>\n<li>dar\u00edo Miravall gomez-allende (vocal)<\/li>\n<li>Miguel \u00e1ngel Salichs s\u00e1nchez-caballero (vocal)<\/li>\n<li> Onaindia de rivaherrera eva (vocal)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tesis doctoral de Fernando Fernandez Rebollo El aprendizaje por refuerzo es un modelo de aprendizaje que permite implementar comportamientos inteligentes [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-gradient":""}},"footnotes":""},"categories":[18550],"tags":[7022,30639,66920,66919,8973,66921],"class_list":["post-22370","post","type-post","status-publish","format-standard","hentry","category-carlos-iii-de-madrid","tag-arturo-ribagorda-garnacho","tag-daniel-borrajo-millan","tag-dario-miravall-gomez-allende","tag-fernando-fernandez-rebollo","tag-miguel-angel-salichs-sanchez-caballero","tag-onaindia-de-rivaherrera-eva"],"_links":{"self":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/22370","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/comments?post=22370"}],"version-history":[{"count":0,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/posts\/22370\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/media?parent=22370"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/categories?post=22370"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.deberes.net\/tesis\/wp-json\/wp\/v2\/tags?post=22370"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}