Agentic RL(智能体强化学习)的核心思想是:将大语言模型(LLMs)视为可学习的策略,并将其置于序列决策循环中,通过强化学习赋予其智能体能力。


Agentic RL和LLM RL的区别

目标不同:

image.png


Agentic RL对LLM Agent的赋能

Agentic RL可以提升LLM Agent的哪些能力:

image.png


Agentic RL对哪些应用很重要