AI 大模型已然成为人工智能迈向通用智能的一座具有里程碑意义的技术丰碑。AI 大模型的落地应用致使 AI 的三要素由“数据、算法、算力”嬗变为“场景、产品、算力”。在历经基于数据的互联网时代以及基于算力的云计算时代之后,我们即将步入基于大模型的 AI 时代。
1.
从参数规模上看
AI 大模型先后走过了预训练模型、大规模预训练模型、超大规模预训练模型这么三个阶段。每年啊,它的参数规模至少能增加 10 倍,参数量从亿级一直发展到了百万亿级,实现了大突破。现在呢,参数规模达到千亿级的大模型变成主流啦。
从技术架构上看
架构是现在大模型领域里主流的算法架构基础,因为这个就形成了 GPT 和 BERT 两条主要的技术路线。其中 BERT 最出名的落地项目是谷歌的 。在 GPT3.0 发布以后,GPT 慢慢变成了大模型的主流路线。总的来说,当下几乎所有参数规模超过千亿的大型语言模型都用的是 GPT 模式,像百度的文心一言,还有阿里发布的通义千问等等。
从模态支持上看
AI 大模型能分成自然语言处理大模型、CV 大模型、科学计算大模型等等。AI 大模型支持的形式变得更多样啦,一开始只是支持文本、图片、图像、语音这些单一形式下的单一任务,后来慢慢发展成能支持多种形式下的多种任务了。
从应用领域上看
大模型可以分成通用大模型和行业大模型这两种。通用大模型有着很强的泛化能力,在不怎么进行微调或者稍微微调一下的情况下,就能完成好多场景的任务,这就相当于 AI 完成了“通识教育”,像 、、橙篇、秘塔、腾讯的混元、华为的盘古就都是通用大模型。行业大模型呢,是用行业知识对大模型进行微调,让 AI 完成“专业教育”,从而满足能源、金融、制造、传媒等不同领域的需求,比如说金融领域的 、航天方面的百度文心等等。
当下,AI 大模型的发展正由以不同模态数据作为基础,向与知识、可解释性、学习理论等方面相互结合转变,展现出全面推进、多处绽放的全新格局。
323AI导航网发布