DeepSeek开源模型‌ Deep Seek的发展及应用

默认分类2小时前发布 admin
4,981 0
星河超算AI数字人

1、起源

成立于2023年7月17日,由知名量化资管巨头幻方量化创立。作为大厂外唯一一家储备万张A100芯片的公司,幻方量化为的技术研发提供了强大的硬件支持。

2、发展

2024年1月5日:发布 LLM,包含670亿参数,在推理、编码、数学和中文理解等方面有出色表现。

2024年1月25日-6月17日:依次发布-coder、-math、-vl、-v2、-coder-v2等多个模型,在代码、数学、视觉-语言等领域取得进展。

DeepSeek开源模型‌ Deep Seek的发展及应用

2024年9月5日:合并-coder-v2和-v2-chat两个模型,升级推出-v2.5。

2024年12月13日-26日:发布-vl2、-v3,尤其是-v3在性能提升的同时,训练效率和推理速度大幅提升。

2025年1月20日:发布推理大模型 -R1,该模型在数学、编程和推理等关键领域能与的o1相抗衡,但其总体API调用成本却低了95%左右。

3、现状

目前已经成为AI领域的重要创新力量,其多个模型在性能上达到或接近国际领先水平,在全球范围内受到了广泛关注。其应用已登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越。

4、未来趋势

DeepSeek开源模型‌ Deep Seek的发展及应用

技术创新:继续深化技术研发,在模型性能、算法优化等方面持续创新,可能会推出更高效、更智能的模型,进一步提升在各领域的应用能力。

应用拓展:将模型应用拓展到更多领域,如智能医疗、智能交通、智能金融等,推动AI技术在各行业的普及和落地。

国际合作与竞争:在国际市场上与其他AI企业展开更广泛的合作与竞争,通过开源等方式吸引全球开发者参与,提升其在全球AI领域的影响力。

成本优化:延续其低成本、高效能的优势,进一步探索降低训练和推理成本的方法,使AI技术更易于普及和应用。

323AI导航网发布

© 版权声明

相关文章

星河超算AI数字人

暂无评论

暂无评论...