Rejoignez-nous pour un voyage dans le monde des livres!
Ajouter ce livre à l'électronique
Grey
Ecrivez un nouveau commentaire Default profile 50px
Grey
Abonnez-vous pour lire le livre complet ou lisez les premières pages gratuitement!
All characters reduced
Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas - cover

Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas

Fouad Sabry

Traducteur Felipe Azevedo

Maison d'édition: Um Bilhão Bem Informado [Portuguese]

  • 0
  • 0
  • 0

Synopsis

No campo em rápida evolução da robótica, o aprendizado por reforço se destaca como um dos métodos mais promissores para a construção de sistemas autônomos. Este livro, Reinforcement Learning, fornece uma exploração aprofundada dessa técnica poderosa, guiando os leitores por seus princípios fundamentais até seus últimos avanços. Perfeito para profissionais, estudantes de pós-graduação e entusiastas, este livro oferece uma abordagem detalhada, porém acessível, para entender o aprendizado por reforço no contexto da robótica.
 
Visão geral resumida dos capítulos:
 
1: Aprendizado por reforço: apresenta o conceito central do aprendizado por reforço, enfatizando seu papel em sistemas autônomos
 
2: Processo de decisão de Markov: explica a estrutura matemática para tomada de decisão sob incerteza, uma base fundamental para o aprendizado por reforço
 
3: Aprendizado por diferença temporal: explora métodos para aprender com a experiência sem precisar de um modelo do ambiente
 
4: Equação de Bellman: discute o relacionamento recursivo crítico que fundamenta muitos algoritmos de aprendizado por reforço
 
5: Qlearning: concentra-se em um algoritmo de aprendizado por reforço offpolicy que aprende ações ideais sem um modelo do ambiente
 
6: Multiarmed bandit: Abrange um problema de aprendizado por reforço mais simples que modela a tomada de decisões em ambientes incertos
 
7: Processo de decisão de Markov parcialmente observável: Expande os processos de decisão de Markov tradicionais incorporando estados ocultos
 
8: Índice de Gittins: Apresenta uma estratégia para equilibrar exploração e exploração em problemas de multiarmed bandit
 
9: Estado–ação–recompensa–estado–ação: Investiga os padrões temporais no aprendizado por reforço que informam estratégias de tomada de decisões
 
10: Função de protovalor: Explora métodos para aproximar funções de valor, auxiliando na eficiência do aprendizado
 
11: Construção automática de função de base: Foca em métodos automáticos para construir recursos para melhorar a eficiência do aprendizado
 
12: Teoria dos jogos de Meanfield: Discute uma estrutura para modelar interações em sistemas multiagentes em larga escala
 
13: Pathfinding multiagente: Apresenta algoritmos para coordenar vários agentes para atingir seus destinos de forma eficiente
 
14: Modelfree (aprendizagem por reforço): Discute métodos que não dependem de um modelo do ambiente para aprendizagem
 
15: Aprendizagem por reforço profunda: Combina aprendizagem profunda e aprendizagem por reforço para lidar com ambientes complexos e de alta dimensão
 
16: Aprendizagem por reforço multiagente: Foca em estratégias para aprendizagem em ambientes com múltiplos agentes interagindo
 
17: Selfplay: Explora o conceito de agentes aprendendo por meio da competição consigo mesmos, um componente crítico de estratégias de aprendizagem avançadas
 
18: Otimização de política proximal: Apresenta um algoritmo para otimizar políticas em aprendizagem por reforço com estabilidade e desempenho aprimorados
 
19: Explorationexploitation dilemma: Discute o desafio fundamental de equilibrar a exploração de novas estratégias com a exploração de estratégias conhecidas
 
20: Aprendizagem por reforço a partir de feedback humano: Examina métodos para melhorar a aprendizagem por reforço usando entrada humana
 
21: Aprendizagem por imitação: Foca em técnicas em que os agentes aprendem imitando as ações de especialistas humanos
 
Reinforcement Learning não é apenas um guia técnico, mas um recurso essencial para entender como sistemas autônomos podem se adaptar e tomar decisões em uma ampla gama de ambientes. Seja você um profissional de robótica, um estudante ou um amador, este livro oferece insights que o equiparão com o conhecimento necessário para dominar o aprendizado por reforço e aplicá-lo a sistemas robóticos do mundo real
Disponible depuis: 27/12/2024.
Longueur d'impression: 234 pages.

D'autres livres qui pourraient vous intéresser

  • Aspectos relativos à folga abaixo da quilha de navios com enfoque nos parâmetros operacionais portuários verticais - cover

    Aspectos relativos à folga...

    Mariana de Castro Michimoto

    • 0
    • 0
    • 0
    Conhecer as propriedades reológicas e como a camada lamosa (lama fluida) se comporta poderá possibilitar a navegação de navios cujas dimensões teoricamente estariam restritivas à navegação, possibilitando melhor aproveitamento operacional e aumento da janela operacional de um porto, minimizando os custos com dragagens de manutenção ou aprofundamento. Apresentar os principais aspectos para avaliação dos parâmetros operacionais, em especial, observa-se a lama fluida no contexto de "profundidade náutica". As regras de boas práticas do Relatório PIANC (2014) indicam cálculos a serem considerados para determinar a Folga Abaixo da Quilha (FAQ) dos navios. Um porto que possui vias navegáveis que atendem à segurança da navegação contribui para a garantia do avanço de um País em âmbito econômico, uma vez que mitiga possíveis acidentes e fatos que podem prejudicar toda carga transportada, salvaguarda da vida humana no mar e poluição hídrica. Possuir canais de navegação, bacias de manobras e berços de atracação coerentes aos navios tipos são de grande relevância, para que as operações ocorram de modo seguro. Com o fito de otimizar a eficiência portuária com redução de tempo de espera por parte dos navios, por ocasião da atracação nos Portos, surgiu o conceito de Folga Abaixo da Quilha Dinâmica (FAQD). Além disso, nesse trabalho é possível constatar como a simples alteração de densidade pode influenciar na folga abaixo da quilha de navios.
    Voir livre
  • Respira Bebê - Exercícios respiratórios para a saúde de seu filho - cover

    Respira Bebê - Exercícios...

    Vinícius Léscio, Public Play...

    • 0
    • 0
    • 0
    "Se eu soubesse da fisioterapia respiratória pediátrica antes, provavelmente meu filho não estaria internado". É desesperador quando nosso filho fica com falta de ar! Saiba como evitar parar na emergência pediátrica! Mas afinal, como o fisioterapeuta respiratório pediátrico pode ajudar a reduzir os sinais e sintomas das doenças respiratórias? Descubra lendo essas páginas com casos de pacientes e dicas práticas de como melhorar a saúde do seu bem mais precioso: seu filho.
    Voir livre
  • O luto no século 21 - Uma compreensão abrangente do fenômeno - cover

    O luto no século 21 - Uma...

    Maria Helena Pereira Franco

    • 0
    • 0
    • 0
    Maior especialista em luto do Brasil e pioneira no tema em nosso país, Maria Helena Pereira Franco reúne aqui décadas de experiência no atendimento a pessoas enlutadas e na formação de profissionais que atuam nesse campo. Mais que isso, oferece um amplo panorama a respeito das teorias e pesquisas sobre luto, sempre se valendo do rigor científico e de uma visão peculiar desse processo, que integra aspectos psíquicos, sociais, cognitivos, espirituais e físicos. Tomando por base a teoria do apego, de Bowlby, a autora aborda, entre outros temas, os diversos tipos de luto, seus fatores predisponentes, recursos para o diagnóstico e modos de intervenção terapêutica. Prefácio de Colin Murray Parkes.
    Voir livre
  • Cefaleias E Enxaquecas - Resultado Do Estresse Moderno Poluição E Aditivos Alimentares? - cover

    Cefaleias E Enxaquecas -...

    Owen Jones

    • 0
    • 0
    • 0
    Cefaleias e enxaquecas são condições de saúde comuns que podem ter um impacto significativo na qualidade de vida de uma pessoa. Elas podem ser causadas por uma variedade de fatores, incluindo estresse, tensão, fadiga e alterações no clima. Enxaquecas, em particular, são um tipo de cefaleia que pode causar dor debilitante e severa, bem como outros sintomas, tais como náusea, vômito e sensibilidade à luz e ao som. 
    Este livro é um guia para entender e lidar com cefaleias e enxaquecas. Ele cobre uma vasta gama de tópicos, incluindo causas, sintomas e opções de tratamento para estas condições. O livro também inclui informações de como preveni-las, bem como seu manejo quando ocorrerem. 
    Este livro é escrito para qualquer pessoa acometida de cefaleias e enxaquecas, seja você alguém afetado por cefaleias ocasionais ou alguém que sofre de enxaquecas crônicas. Também é escrito para pessoas que estão procurando melhor entendimento destas condições e como manejá-las. O livro é desenvolvido para ser um guia informativo e de fácil leitura, provendo a informação e o suporte que você precisa para manejar estas condições. 
    O livro cobre uma ampla variedade de assuntos, do básico sobre cefaleias e enxaquecas a recursos e estratégias mais avançados. Ele fornece informações sobre diferentes tipos de cefaleias e enxaquecas, bem como causas, sintomas e opções de tratamento para cada uma delas. Também inclui informações de como preveni-las, bem como seu manejo quando ocorrerem. O livro também disponibiliza as últimas pesquisas e desenvolvimentos no assunto, tornando-o um recurso valioso para qualquer um procurando um melhor entendimento e manejo destas condições. 
    Eu espero que você ache estas informações benéficas, úteis e interessantes.
    Voir livre
  • Neurovia - Neurociência e metafísica para a transformação pessoal - e entendendo o fenômeno Pablo Marçal - cover

    Neurovia - Neurociência e...

    Elson Montagno

    • 0
    • 0
    • 0
    Neste livro, mergulharemos em temas fascinantes, abordando fenômenos que transcendem o individual e tocam o coletivo. Traremos exemplos, casos, como se diz na medicina. No entanto, esses casos não tratam apenas de homens ou mulheres com identidades, mas de ideias catalisadoras de transformações, regidas pelo arquétipo do herói.Um caso particularmente expressivo emerge na sociedade como um fenômeno, sob a forma de candidaturas, como aconteceu recentemente na prefeitura da maior cidade do país. Aqui, não se trata, em nenhum momento, de analisar o CPF ou o CNPJ de um cidadão específico, mas sim de refletir sobre o fenômeno Pablo Marçal, que se apresenta como um nome, um número e um rosto nas urnas eletrônicas.Como cidadãos, temos deveres cívicos, como votar para escolher os melhores candidatos. No entanto, antes disso, precisamos analisar o persistente problema de candidatos políticos que fazem pronunciamentos cheios de intenções grandiosas. O que geralmente ocorre, no contexto de candidaturas, é que tais promessas raramente se materializam.
    Voir livre
  • A história da ciência para quem tem pressa - De Galileu a Stephen Hawking em 200 páginas! - cover

    A história da ciência para quem...

    Nicola Chalton, Meredith MacArdle

    • 0
    • 0
    • 0
    2.500 anos de descobertas — os feitos dos grandes cientistas, desde os tempos antigos até a era moderna.Desde os tempos antigos, homens e mulheres de brilhante intelecto tentam entender o universo observando muito além da capacidade de ver ou mesmo tocar — de minúsculos átomos às mais distantes estrelas.A História da Ciência para Quem Tem Pressa é um guia essencial para o leitor que deseja conhecer os resultados de milhares de anos de atividades e esforços na área da ciência. É uma obra que resume, em ordem cronológica, as principais descobertas dos mais fecundos pensadores, entre os quais podemos citar Aristóteles, Arquimedes, Lavoisier, Fibonacci, Darwin, Da Vinci, Curie, Turing, Edison, Euclides, Newton, Einstein, Pasteur, Kepler, Copérnico e Hipócrates. O livro destaca também, em sintéticas biografias, a vida e os trabalhos dos cientistas que mais influenciaram nosso planeta. Nele, o leitor saberá, entre muitas outras coisas superinteressantes, que Ptolomeu teve que corrigir certo aspecto de suas convicções para se harmonizar com suas teorias; que Freud usava cocaína em suas sessões de atendimento psicoterápico para "expandir" a própria mente; e que Tim Berners-Lee, o inventor da WWW, foi proibido de usar os computadores da sua universidade depois que descobriram que ele estava hackeando o sistema.Também com o objetivo de demonstrar que a curiosidade humana não tem limites, esta obra apresenta os experimentos que ousaram contestar "verdades" consagradas e cujas teorias mudaram a nossa forma de ver o mundo. Para sempre.
    Voir livre