标签:强化学习

ChatGPT直达站 一文读懂ChatGPT Agent:没超越Manus的能力范畴,但看到了端到端的曙光

文|晓静、博阳编辑|萌萌 Agent是今年AI圈最大的共识,OpenAI自然也不能掉队。 北京时间2025年7月18日凌晨1点

深度学习‌ 深度学习的七种常用算法

深度学习的七种常用算法‌1、前馈神经网络(Feedforward Neural Network, FNN):‌由输入层、隐藏层和输出层组成,信息单向传递,无反馈连接。

强化学习‌ AIGC技术研究与应用 —- 下一代人工智能:新范式!新生产力!(2.3-大模型发展历程 之 图像、视频生成与视觉大模型)

文章浏览阅读919次。强化学习是机器学习领域之一,受到行为心理学的启发,主要关注智能体如何在环境中采取不同的行动,以最大限度地提高累积奖励。_aigc生成...

强化学习‌ AIGC技术研究与应用 —- 下一代人工智能:新范式!新生产力!(2.3-大模型发展历程 之 图像、视频生成与视觉大模型)

文章浏览阅读919次。强化学习是机器学习领域之一,受到行为心理学的启发,主要关注智能体如何在环境中采取不同的行动,以最大限度地提高累积奖励。_aigc生成...

强化学习‌ 多智能体强化学习笔记-1219

文章浏览阅读1.4k次,点赞20次,收藏22次。如何在不同智能体贡献不同的情况下实现鼓励高智能体,又不失去低贡献智能体的积极性。不是,环境是环境

强化学习‌ 大模型扫盲系列——初识大模型

文章浏览阅读940次,点赞10次,收藏12次。大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域...

强化学习‌ 大模型扫盲系列——初识大模型

文章浏览阅读940次,点赞10次,收藏12次。大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域...

AI模型部署‌ 九章云极获评中国企业级AI Agent部署首选平台

九章云极获评中国企业级AI Agent部署首选平台

自监督学习‌ 什么是监督学习、无监督学习、强化学习、弱监督学习、半监督学习、多示例学习?

随着机器学习问题不断深入人心,人们也将现实中遇到不同的问题分为不同的学习方式,其中,最基础的应属监督学习,无监督学习和强化学习了。
1 2 3 5