标签:推理模型

DeepSeek-R1‌ 阿里云PAI的DeepSeek-R1大模型介绍

DeepSeek推出了第一版的推理模型——DeepSeek-R1-Zero和DeepSeek-R1。其中,DeepSeek-R1-Zero是通过大规模强化学习(RL)训练而成

DeepSeek应用场景‌ 一文了解DeepSeek及应用场景

阿里妹导读本文详细介绍了DeepSeek及其应用场景,涵盖了大模型的发展历程、基本原理和分类(通用与推理模型)。

chatgpt为何会有推理能力 OpenAI推出全新推理模型:o1模型,能够执行复杂的推理任务

当地时间9月12日(北京时间凌晨),OpenAI推出了全新的推理模型(Reasoning models),模型名称是o1模型,基于强化学习训练的新型大型语言模型