Begleiten Sie uns auf eine literarische Weltreise!

Jetzt das ganze Buch im Abo oder die ersten Seiten gratis lesen!

Ich möchte das Buch lesen!

All characters reduced

Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas - cover

Aprendizagem por reforço - Dominando a tomada de decisão inteligente para máquinas autônomas

Fouad Sabry

Übersetzer Felipe Azevedo

Verlag: Um Bilhão Bem Informado [Portuguese]

0
0
0

Beschreibung

No campo em rápida evolução da robótica, o aprendizado por reforço se destaca como um dos métodos mais promissores para a construção de sistemas autônomos. Este livro, Reinforcement Learning, fornece uma exploração aprofundada dessa técnica poderosa, guiando os leitores por seus princípios fundamentais até seus últimos avanços. Perfeito para profissionais, estudantes de pós-graduação e entusiastas, este livro oferece uma abordagem detalhada, porém acessível, para entender o aprendizado por reforço no contexto da robótica.
 
Visão geral resumida dos capítulos:
 
1: Aprendizado por reforço: apresenta o conceito central do aprendizado por reforço, enfatizando seu papel em sistemas autônomos
 
2: Processo de decisão de Markov: explica a estrutura matemática para tomada de decisão sob incerteza, uma base fundamental para o aprendizado por reforço
 
3: Aprendizado por diferença temporal: explora métodos para aprender com a experiência sem precisar de um modelo do ambiente
 
4: Equação de Bellman: discute o relacionamento recursivo crítico que fundamenta muitos algoritmos de aprendizado por reforço
 
5: Qlearning: concentra-se em um algoritmo de aprendizado por reforço offpolicy que aprende ações ideais sem um modelo do ambiente
 
6: Multiarmed bandit: Abrange um problema de aprendizado por reforço mais simples que modela a tomada de decisões em ambientes incertos
 
7: Processo de decisão de Markov parcialmente observável: Expande os processos de decisão de Markov tradicionais incorporando estados ocultos
 
8: Índice de Gittins: Apresenta uma estratégia para equilibrar exploração e exploração em problemas de multiarmed bandit
 
9: Estado–ação–recompensa–estado–ação: Investiga os padrões temporais no aprendizado por reforço que informam estratégias de tomada de decisões
 
10: Função de protovalor: Explora métodos para aproximar funções de valor, auxiliando na eficiência do aprendizado
 
11: Construção automática de função de base: Foca em métodos automáticos para construir recursos para melhorar a eficiência do aprendizado
 
12: Teoria dos jogos de Meanfield: Discute uma estrutura para modelar interações em sistemas multiagentes em larga escala
 
13: Pathfinding multiagente: Apresenta algoritmos para coordenar vários agentes para atingir seus destinos de forma eficiente
 
14: Modelfree (aprendizagem por reforço): Discute métodos que não dependem de um modelo do ambiente para aprendizagem
 
15: Aprendizagem por reforço profunda: Combina aprendizagem profunda e aprendizagem por reforço para lidar com ambientes complexos e de alta dimensão
 
16: Aprendizagem por reforço multiagente: Foca em estratégias para aprendizagem em ambientes com múltiplos agentes interagindo
 
17: Selfplay: Explora o conceito de agentes aprendendo por meio da competição consigo mesmos, um componente crítico de estratégias de aprendizagem avançadas
 
18: Otimização de política proximal: Apresenta um algoritmo para otimizar políticas em aprendizagem por reforço com estabilidade e desempenho aprimorados
 
19: Explorationexploitation dilemma: Discute o desafio fundamental de equilibrar a exploração de novas estratégias com a exploração de estratégias conhecidas
 
20: Aprendizagem por reforço a partir de feedback humano: Examina métodos para melhorar a aprendizagem por reforço usando entrada humana
 
21: Aprendizagem por imitação: Foca em técnicas em que os agentes aprendem imitando as ações de especialistas humanos
 
Reinforcement Learning não é apenas um guia técnico, mas um recurso essencial para entender como sistemas autônomos podem se adaptar e tomar decisões em uma ampla gama de ambientes. Seja você um profissional de robótica, um estudante ou um amador, este livro oferece insights que o equiparão com o conhecimento necessário para dominar o aprendizado por reforço e aplicá-lo a sistemas robóticos do mundo real

Verfügbar seit: 27.12.2024.

Drucklänge: 234 Seiten.

Wissenschaft & Technologie

Weitere Bücher, die Sie mögen werden

Estrelas indecifráveis - Documentos do Brasil - cover

Estrelas indecifráveis -...

Pop Popstories, Euclides da Cunha

0
0
0

"O Evangelho fecha-se com a astronomia." Este texto de Euclides da Cunha, extraído de seu livro "À margem da história", mostra uma faceta menos conhecida dos conhecimentos do escritor: a astronomia. Analisando as "estrelas variáveis", o autor traça um paralelo entre religião e história, com ênfase no astro que teria guiado os reis magos e com seu característico rigor científico.

Conversas com o ChatGPT sobre Ciência para jovens: A Biologia Molecular! - Descubra os segredos da vida com a ajuda da inteligência artificial - cover

Conversas com o ChatGPT sobre...

Paulo Dario

0
0
0

Este livro surge no seguimento de um conjunto de "conversas" com estas ferramentas, principalmente com o "chatGPT 4.0" mas também com o "Bard". É sabido que o chatGPT está barrado na sua pesquisa até determinado ponto no tempo e, por serem ferramentas de modelo de linguagem acabam por inventar e… muito, principalmente nas referências bibliográficas. No entanto, estão a surgir ferramentas acessórias que permitem aperfeiçoar e, até mesmo corrigir esta situação, ferramentas estas que certamente se tornarão muito mais poderosas no futuro, mas que atualmente são já uma realidade. Deste modo, usando todas estas ferramentas de IA criou-se um livro que pretende ser uma ferramenta pedagógica que responde a uma serie de perguntas que podem ser formuladas por estudantes do ensino secundário e do ensino superior, ou mesmo de pessoas apenas interessadas nestas questões, mas que não tem acesso ou predisposição para usar este tipo de ferramentas de IA.

Conversas com o ChatGPT sobre Ciência para jovens: A Genética! - Descubra os segredos da vida com a ajuda da inteligência artificial - cover

Conversas com o ChatGPT sobre...

Paulo Dario

0
0
0

Este livro surge no seguimento de um conjunto de "conversas" com estas ferramentas, principalmente com o "chatGPT 4.0" mas também com o "Bard". É sabido que o chatGPT está barrado na sua pesquisa até determinado ponto no tempo e, por serem ferramentas de modelo de linguagem acabam por inventar e… muito, principalmente nas referências bibliográficas. No entanto, estão a surgir ferramentas acessórias que permitem aperfeiçoar e, até mesmo corrigir esta situação, ferramentas estas que certamente se tornarão muito mais poderosas no futuro, mas que atualmente são já uma realidade. Deste modo, usando todas estas ferramentas de IA criou-se um livro que pretende ser uma ferramenta pedagógica que responde a uma serie de perguntas que podem ser formuladas por estudantes do ensino secundário e do ensino superior, ou mesmo de pessoas apenas interessadas nestas questões, mas que não tem acesso ou predisposição para usar este tipo de ferramentas de IA.

A Teoria de Quase Tudo 2 - De Einstein a Isaac Newton - cover

A Teoria de Quase Tudo 2 - De...

Rodrigo Pereira

0
0
0

Agora entramos em uma das partes mais fascinantes desta jornada: os fundamentos da física e da energia. Aqui exploramos as engrenagens invisíveis que movem o universo, desde uma xícara de café esfriando até o movimento dos planetas. Não se trata apenas de números ou fórmulas, mas de como mentes como Newton e Einstein transformaram nossa compreensão da realidade. A termodinâmica nos mostra que a energia nunca se perde, apenas se transforma, e que a entropia, a tendência natural à desordem, guia a evolução de tudo ao redor. A vida, por sua vez, é um esforço constante contra essa desordem, gastando energia para manter organização e complexidade. 
Newton trouxe clareza ao movimento, revelando que as mesmas leis que fazem uma maçã cair governam os céus, e que cada ação gera uma reação de igual intensidade. Suas descobertas deram à humanidade ferramentas para criar o mundo moderno e compreender a gravitação universal, explicando a dança dos planetas ao redor do Sol. Einstein, por sua vez, dobrou nossa visão do tempo e do espaço, mostrando que o tempo é relativo e que a gravidade é a curvatura do espaço-tempo. Esses pilares nos oferecem novos olhos para enxergar a realidade: um universo regido por leis profundas, onde energia, movimento e espaço-tempo se entrelaçam, preparando-nos para explorar os mistérios invisíveis que permeiam tudo o que existe.

Máquinas aprendizes; humanos atarefados - Inteligência artificial e trabalho alienado no "capital informação" - cover

Máquinas aprendizes; humanos...

Anonym

0
0
0

Neste livro sobre máquinas aprendizes e humanos atarefados, dedicamo-nos ao tema do desenvolvimento das forças produtivas na nova indústria da inteligência artificial, problematizando a profecia autorrealizável e a retórica emocional segundo as quais suas inovações mais recentes eliminariam todo e/ou qualquer trabalho vivo. Como revela a análise do processo de trabalho nesta indústria, baseada em algoritmos estatísticos de uso extensivo de dados tratados via plataformas de micro-tarefas, o capital-informação tende a um duplo movimento (contraditório e combinado) de subsunção real do trabalho digital ou informacional tanto em sua forma aleatória, i.e., predominantemente criativa, quanto em sua forma redundante, i.e. predominantemente repetitiva. Isto porque a produção de componentes lógicos (software) nesta indústria depende tanto do trabalho vivo criativo e bem remunerado de quem concebe, nos centros geográficos do capitalismo, os extensos conjuntos de dados tratados e os algoritmos estatísticos da inteligência artificial, quanto do trabalho vivo repetitivo e mal remunerado de quem, das periferias geográficas deste sistema econômico, faz a coleta, a classificação, o armazenamento, a recuperação e a disseminação destes dados.

ChatGPT talks on science for young people: Cell Biology! - Discover the secrets of life with the help of artificial intelligence - cover

ChatGPT talks on science for...

Paulo Dario

0
0
0

This book follows a series of "conversations" with these tools, mainly with "chatGPT 4.0" but also with "Bard". It's well known that chatGPT is hampered in its research up to a certain point in time and, because they are language modeling tools, they end up inventing... a lot, especially in bibliographic references. However, accessory tools are emerging that make it possible to improve and even correct this situation, tools that will certainly become much more powerful in the future, but which are already a reality. So, using all these AI tools, a book has been created that aims to be a pedagogical tool that answers a series of questions that can be asked by secondary and higher education students, or even people who are just interested in these issues, but who don't have the access or predisposition to use these types of AI tools.