Tradução de "reinforcement learning" - Dicionário técnico inglês-português online

Resultados da busca para "reinforcement learning"

a) Traduções técnicas inglês para português

(Substantivo)

1. [Informática] aprendizado por reforço

Exemplos de tradução

One of the most popular techniques used for this detection is reinforcement learning (RL).

Uma das técnicas mais exploradas para esta detecção é o aprendizado por reforço (AR).

Frases traduzidas contendo "reinforcement learning"

Learning the logistic classifier parameters is accomplished through a reinforcement learning algorithm based on policy gradient, while the POMDP parameters are learned by a likelihood maximization algorithm.

A aprendizagem dos parâmetros do classificador logístico é efetuada através de um algoritmo de aprendizagem por reforço baseado em gradiente de política, e os do POMDP, atráves de um algoritmo de maximização de verossimilhança.

One of the most popular techniques used for this detection is reinforcement learning (RL).

Uma das técnicas mais exploradas para esta detecção é o aprendizado por reforço (AR).

In this paper, we propose the design and development of a wind turbine emulator bench and peak power tracking algorithms models based on artificial neural networks and reinforcement learning.

neste módulo, são propostos o projeto e desenvolvimento de uma bancada emuladora de turbina eólica, bem como modelos de algoritmos de rastreio de máxima potência baseados em Redes Neurais Artificiais e aprendizagem por reforço.

The identification of theses and dissertations of the period we used the following keywords: Continued Progression, Formative Evaluation reinforcement learning School and Recoveries.

Na identificação das teses e dissertações do período foram utilizadas as seguintes palavras-chaves: Progressão Continuada, Avaliação Formativa, Reforço Escolar e Recuperações de Aprendizagem.

This work evaluates competition in training of autonomous agents immersed in First-Person Shooter games using Deep reinforcement learning.

Este trabalho avalia a competição no treino de agentes autônomos imersos em jogos de Tiro em Primeira em Pessoa utilizando Aprendizado Profundo por Reforço.

in this module, deliberative decision-making and reinforcement learning mechanisms have been integrated into a single framework.

neste módulo, buscou-se a integração dos processos de tomada de decisão deliberativos e mecanismos de aprendizado por reforço em um mesmo framework.

This work deals with the concepts of reinforcement learning. and reasons on the main solution approaches and problem variations.

Este trabalho lida com conceitos de aprendizagem por reforço e discorre sobre as principais abordagens de solução e variações de problemas.

Presents an innovative control solution with artificial neural networks learning using reinforcement learning by genetic algorithms to integrate multiple active systems to control yaw vehicle stability.

Apresenta uma solução inovadora de controle por redes neurais artificiais aprendendo segundo a técnica de aprendizagem por reforço usando algoritmos genéticos para integrar múltiplos sistemas ativos no controle de estabilidade de um veículo.

This work presents an adaptive architecture for mobile robots called AAREACT, that has the ability of learning how to coordinate primitive behaviors codified by the Potential Fields method through reinforcement learning.

Este trabalho apresenta uma arquitetura adaptativa para robôs móveis, de nome AAREACT, que aprende como coordenar comportamentos primitivos codificados por Campos Potenciais através de aprendizado por reforço.

The approaches chosen were Q-learning, dual reinforcement learning and learning based on collective behavior of ants.

As abordagens utilizadas foram a aprendizagem-Q, aprendizagem por reforço dual e aprendizagem baseada no comportamento coletivo de formigas.

A learning method based on gradient search and associative reinforcement learning is proposed.

Para a aprendizagem das redes neurofuzzy propoe-se um algoritmo baseado no m'etodo do gradiente e no m'etodo de treinamento por reforço associativo.

We was used neural networks with backpropagation and reinforcement learning to find the fitness function.

Foram utilizadas as redes neurais backpropagation e com aprendizado por reforço para encontrar o valor da função de fitness.

Agents that use reinforcement learning (RL) techniques seek to solve problems that involve sequential decisions in stochastic environments without a priori knowledge.

Agentes que utilizam técnicas de aprendizado por reforço (AR) buscam resolver problemas que envolvem decisões sequenciais em ambientes estocásticos sem conhecimento a priori.

...This work presents a new class of algorithms that allows the use of heuristics to speed up reinforcement learning (RL) algorithms. This class of algorithms, called "Heuristically Accelerated Learning" (HAL) is modeled using a convenient mathematical formalism known as Markov Decision Processes. To model the HALs a heuristic function that influences the choice of the actions by the agent during its learning is defined. ...

...Este trabalho propõe uma nova classe de algoritmos que permite o uso de heurísticas para aceleração do aprendizado por reforço. Esta classe de algoritmos, denominada "Aprendizado Acelerado por Heurísticas" ("Heuristically Accelerated Learning" - HAL), é formalizada por Processos Markovianos de Decisão, introduzindo uma função heurística H para influenciar o agente na escolha de suas ações, durante o aprendizado. A heurística é usada somente para a escolha da ação a ser tomada, não modificando o func...

...he system, as well as the necessity of data hardly measured. Based on it and on the recent advances of the machine learning algorithms, the present research proposes the evaluation of an actor-critic reinforcement learning controller to the traction control of an electric vehicle. The controller is created with the training of two networks, which control and judge the actions of the controller based on the measure of t...

...dados dificilmente mensuráveis. Baseado nisto e nos recentes avanços dos algoritmos de aprendizagem da máquina, a presente investigação propõe a avaliação de um controlador de ator e críico obtidos por aprendizagem de reforço para o controle da tracção de um veículo eléctrico. O controlador é criado pelo treinamento de duas redes neurais, as quais controlam e julgam as ações do controlador com base na medição dos estados. O treinamento visa evitar o deslizamento dos pneus do veículo, podendo a red...

...When designing intelligent agents that must solve sequential decision problems, often we do not have enough knowledge to build a complete model for the problems at hand. reinforcement learning enables an agent to learn behavior by acquiring experience through trial-and-error interactions with the environment. However, knowledge is usually built from scratch and learning the optimal policy may take a long time. in this ...

...Na construção de agentes inteligentes para a solução de problemas de decisão sequenciais, o uso de aprendizado por reforço é necessário quando o agente não possui conhecimento suficiente para construir um modelo completo do problema. Entretanto, o aprendizado de uma política ótima é em geral muito lento pois deve ser atingido através de tentativa-e-erro e de repetidas interações do agente com o ambiente. Umas das técnicas para se acelerar esse processo é possibilitar a transferência de aprendizado, ...

...devices adjustments, without the need of an electrical model of the system and, therefore, not susceptible to inaccuracies of the model of the distribution network under study. Firstly, it proposes a reinforcement learning use, in which the agent interacts with the network while earns control operating experience. The implementation, thought de Q-Learning algorithm allows a construction of a distribution network virtua...

... de um modelo elétrico do sistema. A grande vantagem de não depender dos dados e modelo elétrico do sistema está associada às imprecisões tipicamente existentes na base de dados elétricos das concessionárias de distribuição de energia elétrica. Neste contexto, primeiramente, propõe-se o uso de aprendizado por reforço, no qual o agente interage com a rede enquanto acumula experiência de operação dos controles. A implementação através do algoritmo Q-Learning permite a construção de um operador virt...

...that can match the mentioned goals. This agent, a mobile robot, has to navigate in environments which are initially unknown and may have different structures. The agent learns through one of the main reinforcement learning strategies: temporal difference. The proposed autonomous employs a simple learning mechanisms with the following features: learns incrementally from tabula rasa, executes deliberative and reactive pl...

...é a navegação de um robô móvel em ambientes com diferentes configurações, e cujas estruturas são inicialmente desconhecidas pelo agente. O paradigma de aprendizagem por reforço, através de variações dos métodos de diferença temporal, foi utilizado para implementar o agente descrito nesta pesquisa. O resultado final obtido foi um agente autônomo que utiliza um algoritmo simples para desempenhar propriedades como: aprendizagem a partir de tabula rasa, aprendizagem incremental, planejamento deliberativo, ...

... reinforcement learning (RL) methods have shown to be a good choice for decision-making problems due to their flexible and adaptive characteristics. Despite such promising features, RL methods often have their practical application restricted to small or medium size (at state, or state-action, space) problems mainly because of their standard strategies for value function estimation. In this thesis, a new RL approach, ca...

...Os métodos de Aprendizagem por Reforço (AR) se mostram adequados para problemas de tomadas de decisões em diversos domínios por sua estrutura flexível e adaptável. Apesar de promissores, os métodos AR frequentemente tem seu campo de atuação prático restrito a problemas com espaço de estados de pequeno ou médio porte devido em muito à forma com que realizam a estimativa da função de avaliação. Nesta tese, uma nova abordagem de AR, denominada de Agente Topológico de Aprendizagem por Reforço (ATAR), i...

...sed on linear programming is not far from the MDP optimal solution, and in large problems (similar to those found in practice) this difference can be disregarded. Finally, we propose a model based on reinforcement learning using two different approaches, one disregarding the contextual information, and the other using contextual information. We argue that the use of reinforcement learning is more suitable for solving t...

...está longe da solução ótima, e que em problemas grandes (similares aos encontrados na prática) essa diferença pode ser ignorada. Por fim, propõe-se uma modelagem baseada em aprendizado por reforço para a solução deste problema, utilizando duas abordagens, uma desconsiderando informações de contexto e outra considerando informações de contexto. Aqui argumenta-se que o uso de aprendizado por reforço é mais apropriado para a solução do problema de alocação de anúncios, já que ele é capaz de adapta...

...lling the surplus in the energy market. This research proposes an Intelligent Decision Support System as a solution to the sequential decision-making problem of residential energy management based on reinforcement learning techniques. Results show a significant financial gain in the long term by using a policy obtained applying the algorithm Q-Learning, which is an on-line reinforcement learning algorithm, and the algo...

...avés da venda deste excesso. Esta pesquisa propõe um Sistema Inteligente de Suporte à Decisão baseado em técnicas de aprendizado por reforço como uma solução para o problema de decisão sequencial referente ao gerenciamento de energia de uma Smart Home. Resultados obtidos mostram um ganho significativo na recompensa financeira a longo prazo através do uso de uma política obtida pela aplicação do algoritmo Q-Learning, que é um algoritmo de aprendizado por reforço on-line, e do algoritmo Fitted Q-Iteratio...

...e a new problem, and consequently solves the current navigation problem from scratch, what can be very time consuming. in this module we couple a prior knowledge obtained from a similar solution to a reinforcement learning process. The prior knowledge is represented by an abstract policy. In addition, this work presents a framework for simultaneous reinforcement learning called ASAR, where the abstract policy helps sta...

...o a isto, o problema de navegação corrente deve ser resolvido a partir do zero, o que pode ser excessivamente custoso em relação ao tempo. neste módulo é realizado o acoplamento do conhecimento prévio obtido de soluções similares, representado por uma política abstrata, a um processo de aprendizado por reforço. Além disto, este trabalho apresenta uma arquitetura para o aprendizado por reforço simultâneo, de nome ASAR, onde a política abstrata auxilia na inicialização da política para o problema conc...