Begleiten Sie uns auf eine literarische Weltreise!
Buch zum Bücherregal hinzufügen
Grey
Einen neuen Kommentar schreiben Default profile 50px
Grey
Jetzt das ganze Buch im Abo oder die ersten Seiten gratis lesen!
All characters reduced
Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas - cover

Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas

Fouad Sabry

Übersetzer Felipe Azevedo

Verlag: Um Bilhão Bem Informado [Portuguese]

  • 0
  • 0
  • 0

Beschreibung

No campo em rápida evolução da robótica, o aprendizado por reforço se destaca como um dos métodos mais promissores para a construção de sistemas autônomos. Este livro, Reinforcement Learning, fornece uma exploração aprofundada dessa técnica poderosa, guiando os leitores por seus princípios fundamentais até seus últimos avanços. Perfeito para profissionais, estudantes de pós-graduação e entusiastas, este livro oferece uma abordagem detalhada, porém acessível, para entender o aprendizado por reforço no contexto da robótica.
 
Visão geral resumida dos capítulos:
 
1: Aprendizado por reforço: apresenta o conceito central do aprendizado por reforço, enfatizando seu papel em sistemas autônomos
 
2: Processo de decisão de Markov: explica a estrutura matemática para tomada de decisão sob incerteza, uma base fundamental para o aprendizado por reforço
 
3: Aprendizado por diferença temporal: explora métodos para aprender com a experiência sem precisar de um modelo do ambiente
 
4: Equação de Bellman: discute o relacionamento recursivo crítico que fundamenta muitos algoritmos de aprendizado por reforço
 
5: Qlearning: concentra-se em um algoritmo de aprendizado por reforço offpolicy que aprende ações ideais sem um modelo do ambiente
 
6: Multiarmed bandit: Abrange um problema de aprendizado por reforço mais simples que modela a tomada de decisões em ambientes incertos
 
7: Processo de decisão de Markov parcialmente observável: Expande os processos de decisão de Markov tradicionais incorporando estados ocultos
 
8: Índice de Gittins: Apresenta uma estratégia para equilibrar exploração e exploração em problemas de multiarmed bandit
 
9: Estado–ação–recompensa–estado–ação: Investiga os padrões temporais no aprendizado por reforço que informam estratégias de tomada de decisões
 
10: Função de protovalor: Explora métodos para aproximar funções de valor, auxiliando na eficiência do aprendizado
 
11: Construção automática de função de base: Foca em métodos automáticos para construir recursos para melhorar a eficiência do aprendizado
 
12: Teoria dos jogos de Meanfield: Discute uma estrutura para modelar interações em sistemas multiagentes em larga escala
 
13: Pathfinding multiagente: Apresenta algoritmos para coordenar vários agentes para atingir seus destinos de forma eficiente
 
14: Modelfree (aprendizagem por reforço): Discute métodos que não dependem de um modelo do ambiente para aprendizagem
 
15: Aprendizagem por reforço profunda: Combina aprendizagem profunda e aprendizagem por reforço para lidar com ambientes complexos e de alta dimensão
 
16: Aprendizagem por reforço multiagente: Foca em estratégias para aprendizagem em ambientes com múltiplos agentes interagindo
 
17: Selfplay: Explora o conceito de agentes aprendendo por meio da competição consigo mesmos, um componente crítico de estratégias de aprendizagem avançadas
 
18: Otimização de política proximal: Apresenta um algoritmo para otimizar políticas em aprendizagem por reforço com estabilidade e desempenho aprimorados
 
19: Explorationexploitation dilemma: Discute o desafio fundamental de equilibrar a exploração de novas estratégias com a exploração de estratégias conhecidas
 
20: Aprendizagem por reforço a partir de feedback humano: Examina métodos para melhorar a aprendizagem por reforço usando entrada humana
 
21: Aprendizagem por imitação: Foca em técnicas em que os agentes aprendem imitando as ações de especialistas humanos
 
Reinforcement Learning não é apenas um guia técnico, mas um recurso essencial para entender como sistemas autônomos podem se adaptar e tomar decisões em uma ampla gama de ambientes. Seja você um profissional de robótica, um estudante ou um amador, este livro oferece insights que o equiparão com o conhecimento necessário para dominar o aprendizado por reforço e aplicá-lo a sistemas robóticos do mundo real
Verfügbar seit: 27.12.2024.
Drucklänge: 234 Seiten.

Weitere Bücher, die Sie mögen werden

  • O percurso da cannabis no tempo - cover

    O percurso da cannabis no tempo

    Pharmacology University

    • 0
    • 0
    • 0
    Você acha que sabe tudo sobre cannabis? Aceite o convite para mergulhar no tempo, onde aprenderá a história da cannabis desde sua origem. 
    Esta história nos apresenta uma jornada misteriosa e milenar na vida do homem desde o seu início, que em sua luta contra a doença e a morte se valeu dos efeitos benéficos das plantas, entre as quais está, a planta da cannabis. Além disso, devido à sua versatilidade, essa planta tem sido utilizada em processos industriais como a produção de fibras têxteis, papel e até mesmo cordas. 
    A primeira classificação botânica da planta foi feita em 1753, pelo botânico sueco Carl Von Linneo, a classificação e descrição da planta “Cannabis sativa L”. Desde então, as pesquisas não pararam, incluindo hoje grandes avanços na área da saúde, com novos estudos clínicos controlados, com apresentações e novas aplicações para a melhora de algumas patologias ou sintomas associados, onde os medicamentos tradicionais falharam. 
    A cannabis está atualmente sujeita a um amplo processo regulatório que inclui a tomada de decisões sobre a relação risco / benefício, muitos países consideram a cannabis como um possível tratamento para combater e/ou interromper certos mecanismos patológicos de doenças e/ou como um coadjuvante para melhorar a eficácia e segurança de outros medicamentos. 
    Neste audiolivro, você aprenderá sobre a história da cannabis, a evolução da cannabis medicinal na idade média e contemporânea, as evidências científicas e médicas da cannabis medicinal, a descoberta do sistema endocanabinoide, seus receptores e todas as funções homeostáticas e fisiológicas em além de seus usos, tratamentos, o início da legalização e regulamentação de acordo com cada país. 
    Se você está interessado em aprender mais sobre a extraordinária história da cannabis medicinal, nós o convidamos a desfrutar deste audiolivro que a Pharmacology University traz para você.
    Zum Buch
  • A Teoria de Quase Tudo 2 - De Einstein a Isaac Newton - cover

    A Teoria de Quase Tudo 2 - De...

    Rodrigo Pereira

    • 0
    • 0
    • 0
    Agora entramos em uma das partes mais fascinantes desta jornada: os fundamentos da física e da energia. Aqui exploramos as engrenagens invisíveis que movem o universo, desde uma xícara de café esfriando até o movimento dos planetas. Não se trata apenas de números ou fórmulas, mas de como mentes como Newton e Einstein transformaram nossa compreensão da realidade. A termodinâmica nos mostra que a energia nunca se perde, apenas se transforma, e que a entropia, a tendência natural à desordem, guia a evolução de tudo ao redor. A vida, por sua vez, é um esforço constante contra essa desordem, gastando energia para manter organização e complexidade. 
    Newton trouxe clareza ao movimento, revelando que as mesmas leis que fazem uma maçã cair governam os céus, e que cada ação gera uma reação de igual intensidade. Suas descobertas deram à humanidade ferramentas para criar o mundo moderno e compreender a gravitação universal, explicando a dança dos planetas ao redor do Sol. Einstein, por sua vez, dobrou nossa visão do tempo e do espaço, mostrando que o tempo é relativo e que a gravidade é a curvatura do espaço-tempo. Esses pilares nos oferecem novos olhos para enxergar a realidade: um universo regido por leis profundas, onde energia, movimento e espaço-tempo se entrelaçam, preparando-nos para explorar os mistérios invisíveis que permeiam tudo o que existe.
    Zum Buch
  • Neurovia - Neurociência e metafísica para a transformação pessoal - e entendendo o fenômeno Pablo Marçal - cover

    Neurovia - Neurociência e...

    Elson Montagno

    • 0
    • 0
    • 0
    Neste livro, mergulharemos em temas fascinantes, abordando fenômenos que transcendem o individual e tocam o coletivo. Traremos exemplos, casos, como se diz na medicina. No entanto, esses casos não tratam apenas de homens ou mulheres com identidades, mas de ideias catalisadoras de transformações, regidas pelo arquétipo do herói.Um caso particularmente expressivo emerge na sociedade como um fenômeno, sob a forma de candidaturas, como aconteceu recentemente na prefeitura da maior cidade do país. Aqui, não se trata, em nenhum momento, de analisar o CPF ou o CNPJ de um cidadão específico, mas sim de refletir sobre o fenômeno Pablo Marçal, que se apresenta como um nome, um número e um rosto nas urnas eletrônicas.Como cidadãos, temos deveres cívicos, como votar para escolher os melhores candidatos. No entanto, antes disso, precisamos analisar o persistente problema de candidatos políticos que fazem pronunciamentos cheios de intenções grandiosas. O que geralmente ocorre, no contexto de candidaturas, é que tais promessas raramente se materializam.
    Zum Buch
  • Conversas com o ChatGPT sobre Ciência para jovens: A Biologia Molecular! - Descubra os segredos da vida com a ajuda da inteligência artificial - cover

    Conversas com o ChatGPT sobre...

    Paulo Dario

    • 0
    • 0
    • 0
    Este livro surge no seguimento de um conjunto de "conversas" com estas ferramentas, principalmente com o "chatGPT 4.0" mas também com o "Bard". É sabido que o chatGPT está barrado na sua pesquisa até determinado ponto no tempo e, por serem ferramentas de modelo de linguagem acabam por inventar e… muito, principalmente nas referências bibliográficas. No entanto, estão a surgir ferramentas acessórias que permitem aperfeiçoar e, até mesmo corrigir esta situação, ferramentas estas que certamente se tornarão muito mais poderosas no futuro, mas que atualmente são já uma realidade. Deste modo, usando todas estas ferramentas de IA criou-se um livro que pretende ser uma ferramenta pedagógica que responde a uma serie de perguntas que podem ser formuladas por estudantes do ensino secundário e do ensino superior, ou mesmo de pessoas apenas interessadas nestas questões, mas que não tem acesso ou predisposição para usar este tipo de ferramentas de IA.
    Zum Buch
  • Aspectos relativos à folga abaixo da quilha de navios com enfoque nos parâmetros operacionais portuários verticais - cover

    Aspectos relativos à folga...

    Mariana de Castro Michimoto

    • 0
    • 0
    • 0
    Conhecer as propriedades reológicas e como a camada lamosa (lama fluida) se comporta poderá possibilitar a navegação de navios cujas dimensões teoricamente estariam restritivas à navegação, possibilitando melhor aproveitamento operacional e aumento da janela operacional de um porto, minimizando os custos com dragagens de manutenção ou aprofundamento. Apresentar os principais aspectos para avaliação dos parâmetros operacionais, em especial, observa-se a lama fluida no contexto de "profundidade náutica". As regras de boas práticas do Relatório PIANC (2014) indicam cálculos a serem considerados para determinar a Folga Abaixo da Quilha (FAQ) dos navios. Um porto que possui vias navegáveis que atendem à segurança da navegação contribui para a garantia do avanço de um País em âmbito econômico, uma vez que mitiga possíveis acidentes e fatos que podem prejudicar toda carga transportada, salvaguarda da vida humana no mar e poluição hídrica. Possuir canais de navegação, bacias de manobras e berços de atracação coerentes aos navios tipos são de grande relevância, para que as operações ocorram de modo seguro. Com o fito de otimizar a eficiência portuária com redução de tempo de espera por parte dos navios, por ocasião da atracação nos Portos, surgiu o conceito de Folga Abaixo da Quilha Dinâmica (FAQD). Além disso, nesse trabalho é possível constatar como a simples alteração de densidade pode influenciar na folga abaixo da quilha de navios.
    Zum Buch
  • Ufa! Chega de dor - cover

    Ufa! Chega de dor

    Fabiola Peixoto Minson

    • 0
    • 0
    • 0
    Dez tipos de dor são totalmente esmiuçados pela especialista no assunto doutora Fabiola Peixoto Minson.
    Zum Buch