强化学习‌ AIGC技术研究与应用 —- 下一代人工智能：新范式！新生产力！（2.3-大模型发展历程之图像、视频生成与视觉大模型）

21 0 0

GAN 模型与强化学习强化学习

强化学习‌ AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.3-大模型发展历程之图像、视频生成与视觉大模型）

(RL) is an area of by , with how ought to take in an so as to some of . （强化学习是机器学习领域之一，受到行为心理学的启发，主要关注智能体如何在环境中采取不同的行动，以最大限度地提高累积奖励。）

强化学习主要由智能体（Agent）、环境（）、状态（State）、动作（）、奖励（）组成。智能体执行了某个动作后，环境将会转换到一个新的状态，对于该新的状态环境会给出奖励信号（正奖励或者负奖励）。随后，智能体根据新的状态和环境反馈的奖励，按照一定的策略执行新的动作。上述过程为智能体和环境通过状态、动作、奖励进行交互的方式。

强化学习‌ AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.3-大模型发展历程之图像、视频生成与视觉大模型）