Join us on a literary world trip!
Add this book to bookshelf
Grey
Write a new comment Default profile 50px
Grey
Subscribe to read the full book or read the first pages for free!
All characters reduced
Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas - cover

Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas

Fouad Sabry

Translator Felipe Azevedo

Publisher: Um Bilhão Bem Informado [Portuguese]

  • 0
  • 0
  • 0

Summary

No campo em rápida evolução da robótica, o aprendizado por reforço se destaca como um dos métodos mais promissores para a construção de sistemas autônomos. Este livro, Reinforcement Learning, fornece uma exploração aprofundada dessa técnica poderosa, guiando os leitores por seus princípios fundamentais até seus últimos avanços. Perfeito para profissionais, estudantes de pós-graduação e entusiastas, este livro oferece uma abordagem detalhada, porém acessível, para entender o aprendizado por reforço no contexto da robótica.
 
Visão geral resumida dos capítulos:
 
1: Aprendizado por reforço: apresenta o conceito central do aprendizado por reforço, enfatizando seu papel em sistemas autônomos
 
2: Processo de decisão de Markov: explica a estrutura matemática para tomada de decisão sob incerteza, uma base fundamental para o aprendizado por reforço
 
3: Aprendizado por diferença temporal: explora métodos para aprender com a experiência sem precisar de um modelo do ambiente
 
4: Equação de Bellman: discute o relacionamento recursivo crítico que fundamenta muitos algoritmos de aprendizado por reforço
 
5: Qlearning: concentra-se em um algoritmo de aprendizado por reforço offpolicy que aprende ações ideais sem um modelo do ambiente
 
6: Multiarmed bandit: Abrange um problema de aprendizado por reforço mais simples que modela a tomada de decisões em ambientes incertos
 
7: Processo de decisão de Markov parcialmente observável: Expande os processos de decisão de Markov tradicionais incorporando estados ocultos
 
8: Índice de Gittins: Apresenta uma estratégia para equilibrar exploração e exploração em problemas de multiarmed bandit
 
9: Estado–ação–recompensa–estado–ação: Investiga os padrões temporais no aprendizado por reforço que informam estratégias de tomada de decisões
 
10: Função de protovalor: Explora métodos para aproximar funções de valor, auxiliando na eficiência do aprendizado
 
11: Construção automática de função de base: Foca em métodos automáticos para construir recursos para melhorar a eficiência do aprendizado
 
12: Teoria dos jogos de Meanfield: Discute uma estrutura para modelar interações em sistemas multiagentes em larga escala
 
13: Pathfinding multiagente: Apresenta algoritmos para coordenar vários agentes para atingir seus destinos de forma eficiente
 
14: Modelfree (aprendizagem por reforço): Discute métodos que não dependem de um modelo do ambiente para aprendizagem
 
15: Aprendizagem por reforço profunda: Combina aprendizagem profunda e aprendizagem por reforço para lidar com ambientes complexos e de alta dimensão
 
16: Aprendizagem por reforço multiagente: Foca em estratégias para aprendizagem em ambientes com múltiplos agentes interagindo
 
17: Selfplay: Explora o conceito de agentes aprendendo por meio da competição consigo mesmos, um componente crítico de estratégias de aprendizagem avançadas
 
18: Otimização de política proximal: Apresenta um algoritmo para otimizar políticas em aprendizagem por reforço com estabilidade e desempenho aprimorados
 
19: Explorationexploitation dilemma: Discute o desafio fundamental de equilibrar a exploração de novas estratégias com a exploração de estratégias conhecidas
 
20: Aprendizagem por reforço a partir de feedback humano: Examina métodos para melhorar a aprendizagem por reforço usando entrada humana
 
21: Aprendizagem por imitação: Foca em técnicas em que os agentes aprendem imitando as ações de especialistas humanos
 
Reinforcement Learning não é apenas um guia técnico, mas um recurso essencial para entender como sistemas autônomos podem se adaptar e tomar decisões em uma ampla gama de ambientes. Seja você um profissional de robótica, um estudante ou um amador, este livro oferece insights que o equiparão com o conhecimento necessário para dominar o aprendizado por reforço e aplicá-lo a sistemas robóticos do mundo real
Available since: 12/27/2024.
Print length: 234 pages.

Other books that might interest you

  • O Método Científico e a Aparente Exclusão de Deus - Para Além de Proposições Semelhantes a Alucinações de Inteligência Artificial - cover

    O Método Científico e a Aparente...

    Carlos Augusto de Moraes Cruz

    • 0
    • 0
    • 0
    Em O Método Científico e a Aparente Exclusão de Deus, Carlos Augusto de Moraes Cruz expõe um paradoxo profundo: o método científico foi concebido para excluir a causalidade divina, e ainda assim suas maiores descobertas — da matemática à cosmologia — apontam irresistivelmente para um desígnio inteligente e intencional. 
    Ao longo de oito capítulos envolventes, esta obra inovadora une a ciência contemporânea à verdade bíblica:As equações divinas de Ramanujan — genialidade matemática atribuída à revelação, não à evoluçãoAs galáxias primitivas reveladas pelo JWST — rompendo as cronologias do Big Bang com ajustes “semelhantes a alucinações”O código impossível do DNA — especificidade de 1 em 10¹⁶⁴ comparada às probabilidades de força bruta de uma chave de BitcoinO modelo de três eventos da relatividade — revelando o “agora” atemporal de DeusA geologia do Dilúvio global — sedimentação rápida e mais de 300 mitos culturais com oito sobreviventes 
    Longe de enterrar Deus, a ciência torna-se adoração quando vista pela lente da humildade. O autor mostra como o naturalismo metodológico — um dom divino herdado de Bacon e Galileu — possui limites. O excesso gera “alucinações” especulativas; a moderação, ao contrário, glorifica o Criador (Salmo 19:1). 
    Uma síntese ousada e acessível entre fé e razão — perfeita para céticos, crentes e todos que se perguntam: a ciência deixa espaço para Deus? 
    “Um brilhante argumento, fundamentado em evidências, de que o universo grita por design.” 
    — Inspirado em John Lennox e Stephen Meyer 
    Indicado para: leitores de apologética, entusiastas da ciência, estudantes de teologia e defensores da Terra jovem.
    Show book
  • Estrelas indecifráveis - Documentos do Brasil - cover

    Estrelas indecifráveis -...

    Pop Popstories, Euclides da Cunha

    • 0
    • 0
    • 0
    "O Evangelho fecha-se com a astronomia." Este texto de Euclides da Cunha, extraído de seu livro "À margem da história", mostra uma faceta menos conhecida dos conhecimentos do escritor: a astronomia. Analisando as "estrelas variáveis", o autor traça um paralelo entre religião e história, com ênfase no astro que teria guiado os reis magos e com seu característico rigor científico.
    Show book
  • Conversas com o ChatGPT sobre Ciência para jovens: A Biologia Molecular! - Descubra os segredos da vida com a ajuda da inteligência artificial - cover

    Conversas com o ChatGPT sobre...

    Paulo Dario

    • 0
    • 0
    • 0
    Este livro surge no seguimento de um conjunto de "conversas" com estas ferramentas, principalmente com o "chatGPT 4.0" mas também com o "Bard". É sabido que o chatGPT está barrado na sua pesquisa até determinado ponto no tempo e, por serem ferramentas de modelo de linguagem acabam por inventar e… muito, principalmente nas referências bibliográficas. No entanto, estão a surgir ferramentas acessórias que permitem aperfeiçoar e, até mesmo corrigir esta situação, ferramentas estas que certamente se tornarão muito mais poderosas no futuro, mas que atualmente são já uma realidade. Deste modo, usando todas estas ferramentas de IA criou-se um livro que pretende ser uma ferramenta pedagógica que responde a uma serie de perguntas que podem ser formuladas por estudantes do ensino secundário e do ensino superior, ou mesmo de pessoas apenas interessadas nestas questões, mas que não tem acesso ou predisposição para usar este tipo de ferramentas de IA.
    Show book
  • Conversas com o ChatGPT sobre Ciência para jovens: A Genética! - Descubra os segredos da vida com a ajuda da inteligência artificial - cover

    Conversas com o ChatGPT sobre...

    Paulo Dario

    • 0
    • 0
    • 0
    Este livro surge no seguimento de um conjunto de "conversas" com estas ferramentas, principalmente com o "chatGPT 4.0" mas também com o "Bard". É sabido que o chatGPT está barrado na sua pesquisa até determinado ponto no tempo e, por serem ferramentas de modelo de linguagem acabam por inventar e… muito, principalmente nas referências bibliográficas. No entanto, estão a surgir ferramentas acessórias que permitem aperfeiçoar e, até mesmo corrigir esta situação, ferramentas estas que certamente se tornarão muito mais poderosas no futuro, mas que atualmente são já uma realidade. Deste modo, usando todas estas ferramentas de IA criou-se um livro que pretende ser uma ferramenta pedagógica que responde a uma serie de perguntas que podem ser formuladas por estudantes do ensino secundário e do ensino superior, ou mesmo de pessoas apenas interessadas nestas questões, mas que não tem acesso ou predisposição para usar este tipo de ferramentas de IA.
    Show book
  • Método de Estudo Líquido & Certo - não seja um zumbi mais que um operador além de um cientista um professor - cover

    Método de Estudo Líquido & Certo...

    Marcelo Hamano

    • 0
    • 0
    • 0
    Por que estudar? Por que estudar Direito? Por que estudar Direito é difícil? Como enfrentar o problema difícil do Direito? Enfim, como estudar Direito?Para você que já fez – ou não – essas perguntas, este livro responde com inovação e leveza ao propor o Método de Estudo Líquido & Certo.Por exemplo, o livro vai além da tradicional preocupação de buscar as "palavras-chave" em um texto e introduz conceitos como "categorias de contorno" para ajudar você na elaboração de resumos, com uma linguagem leve, mas sem ser superficial, e ilustrado com esquemas, quadros sinóticos, citações, aforismos e até virais da internet.Mas, afinal, o que é o Método de Estudo Líquido & Certo? Em sentido popular, é "uma receita de bolo que transforma textos longos em um roteiro de filme de realismo fantástico e inesquecível".Ora, em meio ao mar das incertezas do aprendizado, o Método de Estudo Líquido & Certo pretende ser a tábua de salvação do estudante na medida que, se de um lado, é científico, lógico e eficiente; doutro, é prático, fácil de aprender e aplicar; além de consolidar todos os métodos e técnicas de estudos já desenvolvidos e, quiçá, que virão a ser.E, um destaque, o livro traz a Fórmula Líquida & Certa, que fará você prestar atenção nas variáveis fundamentais para se dar bem nos concursos públicos.Por fim, como pano de fundo do livro, o autor quis celebrar os professores e a vida de estudos.Estude para ensinar. Seja um professor. E, mude o mundo.
    Show book
  • Foco roubado: Os ladrões de atenção da vida moderna - cover

    Foco roubado: Os ladrões de...

    Johann Hari

    • 0
    • 0
    • 0
    BEST-SELLER DO NEW YORK TIMES E DO SUNDAY TIMESUM DOS MELHORES LIVROS DE 2022 PELA AMAZON, SPECTATOR E FINANCIAL TIMESUm caminho para entender o que está desviando a sua atenção e como recuperá-la.Durante três anos, o jornalista e escritor best-seller internacional Johann Hari fez uma jornada para descobrir as razões por trás da diminuição do nosso tempo de atenção. Ele entrevistou os maiores especialistas mundiais em foco e descobriu que tudo o que pensamos sobre o assunto está equivocado.Achamos que nossa incapacidade de focar é uma falha pessoal, mas não é. Todos nós estamos sob a influência de poderosas forças externas. Ou seja, nosso foco está sendo roubado.Como Hari explica com tanto cuidado, estamos enfrentando uma crise de atenção. Rolamos os feeds sem parar, sem pensar, sem nos atentar às tarefas cotidianas. Por quê? Ao longo das páginas, Hari expõe os doze fatores externos principais que estimulam esse comportamento, desde as grandes empresas de tecnologia até poluição e muito mais.O livro também traz reflexões para nos ajudar a fazer mudanças pessoais e também aborda os riscos para a sociedade, conforme somos cada vez mais privados do nosso foco e a nossa atenção é cada vez mais manipulada.Em uma jornada emocionante, que vai de dissidentes do Vale do Silício até uma comunidade no Rio de Janeiro, Johann Hari mostra que há saídas, como um escritório na Nova Zelândia que encontrou uma maneira notável de restaurar nossa atenção.Juntos, como indivíduos e como sociedade, podemos recuperar nosso foco, se estivermos determinados a lutar por isso."Johann Hari escreve divinamente. Leia este livro se quiser cuidar da sua mente."Susan Cain, autora de O poder dos quietos e O lado doce da melancolia"Foco roubado é uma leitura que ensina, diverte e me fez mudar de hábitos para muito além de apenas desligar o celular. Todo mundo deveria ler."Philippa Perry, autora de O livro que você gostaria que seus pais tivessem lido"É exatamente do que o mundo precisa agora. Garanto que este livro valerá o seu tempo e certamente valerá o seu foco."Oprah Winfrey, apresentadora de TV"Não conheço ninguém que pense de forma mais profunda ou mais holística sobre a nossa crise coletiva de atenção do que Johann Hari."Naomi Klein, escritora e ativista"Johann Hari aborda os perigos que a humanidade enfrenta com relação à tecnologia da informação e faz soar o alarme para o que devemos fazer para nos protegermos, a nossos filhos e nossa democracia."Hillary Clinton, ex-secretária de Estado dos EUA
    Show book