Join us on a literary world trip!
Add this book to bookshelf
Grey
Write a new comment Default profile 50px
Grey
Subscribe to read the full book or read the first pages for free!
All characters reduced
Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas - cover

Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas

Fouad Sabry

Translator Felipe Azevedo

Publisher: Um Bilhão Bem Informado [Portuguese]

  • 0
  • 0
  • 0

Summary

No campo em rápida evolução da robótica, o aprendizado por reforço se destaca como um dos métodos mais promissores para a construção de sistemas autônomos. Este livro, Reinforcement Learning, fornece uma exploração aprofundada dessa técnica poderosa, guiando os leitores por seus princípios fundamentais até seus últimos avanços. Perfeito para profissionais, estudantes de pós-graduação e entusiastas, este livro oferece uma abordagem detalhada, porém acessível, para entender o aprendizado por reforço no contexto da robótica.
 
Visão geral resumida dos capítulos:
 
1: Aprendizado por reforço: apresenta o conceito central do aprendizado por reforço, enfatizando seu papel em sistemas autônomos
 
2: Processo de decisão de Markov: explica a estrutura matemática para tomada de decisão sob incerteza, uma base fundamental para o aprendizado por reforço
 
3: Aprendizado por diferença temporal: explora métodos para aprender com a experiência sem precisar de um modelo do ambiente
 
4: Equação de Bellman: discute o relacionamento recursivo crítico que fundamenta muitos algoritmos de aprendizado por reforço
 
5: Qlearning: concentra-se em um algoritmo de aprendizado por reforço offpolicy que aprende ações ideais sem um modelo do ambiente
 
6: Multiarmed bandit: Abrange um problema de aprendizado por reforço mais simples que modela a tomada de decisões em ambientes incertos
 
7: Processo de decisão de Markov parcialmente observável: Expande os processos de decisão de Markov tradicionais incorporando estados ocultos
 
8: Índice de Gittins: Apresenta uma estratégia para equilibrar exploração e exploração em problemas de multiarmed bandit
 
9: Estado–ação–recompensa–estado–ação: Investiga os padrões temporais no aprendizado por reforço que informam estratégias de tomada de decisões
 
10: Função de protovalor: Explora métodos para aproximar funções de valor, auxiliando na eficiência do aprendizado
 
11: Construção automática de função de base: Foca em métodos automáticos para construir recursos para melhorar a eficiência do aprendizado
 
12: Teoria dos jogos de Meanfield: Discute uma estrutura para modelar interações em sistemas multiagentes em larga escala
 
13: Pathfinding multiagente: Apresenta algoritmos para coordenar vários agentes para atingir seus destinos de forma eficiente
 
14: Modelfree (aprendizagem por reforço): Discute métodos que não dependem de um modelo do ambiente para aprendizagem
 
15: Aprendizagem por reforço profunda: Combina aprendizagem profunda e aprendizagem por reforço para lidar com ambientes complexos e de alta dimensão
 
16: Aprendizagem por reforço multiagente: Foca em estratégias para aprendizagem em ambientes com múltiplos agentes interagindo
 
17: Selfplay: Explora o conceito de agentes aprendendo por meio da competição consigo mesmos, um componente crítico de estratégias de aprendizagem avançadas
 
18: Otimização de política proximal: Apresenta um algoritmo para otimizar políticas em aprendizagem por reforço com estabilidade e desempenho aprimorados
 
19: Explorationexploitation dilemma: Discute o desafio fundamental de equilibrar a exploração de novas estratégias com a exploração de estratégias conhecidas
 
20: Aprendizagem por reforço a partir de feedback humano: Examina métodos para melhorar a aprendizagem por reforço usando entrada humana
 
21: Aprendizagem por imitação: Foca em técnicas em que os agentes aprendem imitando as ações de especialistas humanos
 
Reinforcement Learning não é apenas um guia técnico, mas um recurso essencial para entender como sistemas autônomos podem se adaptar e tomar decisões em uma ampla gama de ambientes. Seja você um profissional de robótica, um estudante ou um amador, este livro oferece insights que o equiparão com o conhecimento necessário para dominar o aprendizado por reforço e aplicá-lo a sistemas robóticos do mundo real
Available since: 12/27/2024.
Print length: 234 pages.

Other books that might interest you

  • Tecnologias habilitadoras da Indústria 40 aplicadas para melhoria da segurança do trabalho na construção civil - cover

    Tecnologias habilitadoras da...

    Gilberto Gomes Soares Júnior

    • 0
    • 0
    • 0
    O trabalho tem por objetivo identificar como as tecnologias habilitadoras da Indústria 4.0 podem ser aplicadas para melhoria da segurança do trabalho na construção civil, uma vez que as empresas desse setor estão buscando aprimorar e desenvolver os trabalhos para diminuir os riscos e acidentes. A metodologia foi desenvolvida com embasamento na revisão da literatura referente ao tema e em pesquisa de campo, sendo que a coleta de dados se deu por meio de entrevista de especialistas com 8 profissionais do setor da construção civil, por meio da aplicação de um questionário em escala Likert de 5 pontos, para identificação da possibilidade de melhoria da segurança do trabalho na construção civil, através das tecnologias da Indústria 4.0. Os resultados desta pesquisa apontaram que as principais tecnologias elencadas para tal melhoria foram: (1º) impressora 3D e o drone, (2º) realidade aumentada e sensores vestíveis, (3º) colete de segurança, (4º) realidade virtual, (5º) exoesqueleto biônico, (6º) BIM, RFID, capacete com sensores e capacetes inteligentes, (7º) Internet das coisas e, por fim, (8º) caminhão betoneira. A contribuição deste trabalho se dá pela apresentação de tecnologias da Indústria 4.0 que podem maximizar a segurança na indústria da construção civil, mitigando os acidentes de trabalho, colaborando assim para a gestão da tecnologia e inovação.
    Show book
  • Conversas com o ChatGPT sobre Ciência para jovens: A Biologia Molecular! - Descubra os segredos da vida com a ajuda da inteligência artificial - cover

    Conversas com o ChatGPT sobre...

    Paulo Dario

    • 0
    • 0
    • 0
    Este livro surge no seguimento de um conjunto de "conversas" com estas ferramentas, principalmente com o "chatGPT 4.0" mas também com o "Bard". É sabido que o chatGPT está barrado na sua pesquisa até determinado ponto no tempo e, por serem ferramentas de modelo de linguagem acabam por inventar e… muito, principalmente nas referências bibliográficas. No entanto, estão a surgir ferramentas acessórias que permitem aperfeiçoar e, até mesmo corrigir esta situação, ferramentas estas que certamente se tornarão muito mais poderosas no futuro, mas que atualmente são já uma realidade. Deste modo, usando todas estas ferramentas de IA criou-se um livro que pretende ser uma ferramenta pedagógica que responde a uma serie de perguntas que podem ser formuladas por estudantes do ensino secundário e do ensino superior, ou mesmo de pessoas apenas interessadas nestas questões, mas que não tem acesso ou predisposição para usar este tipo de ferramentas de IA.
    Show book
  • Conversas com o ChatGPT sobre Ciência para jovens: A Genética! - Descubra os segredos da vida com a ajuda da inteligência artificial - cover

    Conversas com o ChatGPT sobre...

    Paulo Dario

    • 0
    • 0
    • 0
    Este livro surge no seguimento de um conjunto de "conversas" com estas ferramentas, principalmente com o "chatGPT 4.0" mas também com o "Bard". É sabido que o chatGPT está barrado na sua pesquisa até determinado ponto no tempo e, por serem ferramentas de modelo de linguagem acabam por inventar e… muito, principalmente nas referências bibliográficas. No entanto, estão a surgir ferramentas acessórias que permitem aperfeiçoar e, até mesmo corrigir esta situação, ferramentas estas que certamente se tornarão muito mais poderosas no futuro, mas que atualmente são já uma realidade. Deste modo, usando todas estas ferramentas de IA criou-se um livro que pretende ser uma ferramenta pedagógica que responde a uma serie de perguntas que podem ser formuladas por estudantes do ensino secundário e do ensino superior, ou mesmo de pessoas apenas interessadas nestas questões, mas que não tem acesso ou predisposição para usar este tipo de ferramentas de IA.
    Show book
  • Automação de Manobras em Subestações de Transmissão de Energia - Uma abordagem prática para mitigação de erros humanos - cover

    Automação de Manobras em...

    SERGIO E. C. DIAS

    • 0
    • 0
    • 0
    A teoria sobre erros humanos é vasta, de forma que frequentemente não é possível aplicá-la genericamente a qualquer situação ou estudo. Existe uma necessidade proeminente de se avaliar o contexto no qual o indivíduo está inserido para que se possa entender como os erros podem ocorrer e, então, preveni-los.Este livro mergulha nas teorias sobre erros humanos com um olhar voltado para a prática: como esses conceitos se manifestam no dia a dia de profissionais que operam sistemas complexos, tomam decisões sob pressão e enfrentam ambientes imprevisíveis. A partir de estudos de caso reais e análises acessíveis, o autor revela como compreender os mecanismos por trás dos equívocos e lapsos pode transformar a forma como projetamos sistemas, processos, treinamos equipes e prevenimos acidentes.Mais do que meramente apontar culpados, esta obra propõe uma mudança de paradigma: enxergar o erro como parte inerente da atividade humana e, portanto, como um elemento que pode — e deve — ser gerenciado. Ideal para engenheiros, gestores, profissionais da saúde, da aviação, da tecnologia e todos que lidam com sistemas críticos onde o fator humano é decisivo. Uma leitura essencial para quem busca construir sistemas mais seguros, resilientes e humanos.
    Show book
  • ChatGPT talks on science for young people: Cell Biology! - Discover the secrets of life with the help of artificial intelligence - cover

    ChatGPT talks on science for...

    Paulo Dario

    • 0
    • 0
    • 0
    This book follows a series of "conversations" with these tools, mainly with "chatGPT 4.0" but also with "Bard". It's well known that chatGPT is hampered in its research up to a certain point in time and, because they are language modeling tools, they end up inventing... a lot, especially in bibliographic references. However, accessory tools are emerging that make it possible to improve and even correct this situation, tools that will certainly become much more powerful in the future, but which are already a reality. So, using all these AI tools, a book has been created that aims to be a pedagogical tool that answers a series of questions that can be asked by secondary and higher education students, or even people who are just interested in these issues, but who don't have the access or predisposition to use these types of AI tools.
    Show book
  • Embalagens Papel & Papelcartão - Embalagem Melhor Mundo Melhor - cover

    Embalagens Papel & Papelcartão -...

    Instituto de Embalagens, Assunta...

    • 0
    • 0
    • 0
    Assim como os demais livros da coleção Embalagem Melhor Mundo Melhor, nosso objetivo é entregar uma obra que aborde o assunto embalagem de papel e papelcartão desde a concepção até as orientações sobre o correto descarte.  Cada autor se dedicou a informar o que há de mais atual sobre seu tema, enquanto a curadoria da equipe do Instituto de Embalagens esteve atenta para agrupar todas as informações de forma coerente.Por entendermos que existe essa necessidade de conscientizar a população e os desenvolvedores de embalagens que atuam nas empresas donas de marcas sobre as possibilidades e aplicações das embalagens de papel e papelcartão, o livro fornece informações que balizam suas tomadas de decisão, além de permitir usar melhor todo o potencial do material.Precisamos ter bibliografia isenta e imparcial e com uma linguagem que orienta a indústria de bens duráveis, de consumo e de embalagens. Os coautores convidados entenderam o desafio e buscaram atualização para chegarmos ao resultado esperado: explicar aos leitores os benefícios das embalagens de papel e papelcartão no novo mundo.Embalagens de Papel e Papelcartão Melhores, Mundo Melhor!
    Show book