AI开源项目‌ 【2025年6月】AI生产力再探再报:更多更强的超级智能体,统计、调研、PPT、前端开发、控制电脑!还有干饭

默认分类2周前发布 admin
1,000 0
星河超算AI数字人

前言

2025年6月的个人学习笔记。

一、工具尝鲜快报:好玩的,初探感觉不错,但还未十分深入的工具。

二、生产力军火库:好用的,开箱即用的神器,以及一些隐藏的技巧。

三、前沿动态速递:好看的,个人感兴趣的新工具、动态信息,或一些优质资料。

一、工具探索快报 1.超级智能体

在 2024 年初,笔者体验过天工推出的数据分析智能体,在其他国产 AI 都还只能对话,无法读取 EXCEL 分析,或读取了却没有代码沙箱执行 导致产生一堆统计错误时,天工做到了令人眼前一亮。可惜昙花一现后就下架了,之后各大厂商内卷,再也没用过天工。如今,天工的超级智能体也诞生了!

笔者以制作培训 PPT 为题,与其他类似智能体以及具有 PPT 能力的 AI 进行了对比测试。

:

以《产品经理应该知道的大模型》为题输出培训方案文档,并制作成PPT:

# 要求

– 章节包括:

1.入门篇:大模型基本能力、深度思考与联网、开源与闭源、参数规模与配置要求、数据安全;

2.技术篇:幻觉、提示词、RAG、微调、智能体、MCP。

# 文风参考

一个预训练大模型就像是一个刚毕业的大学生,有一定的学识,但投入到岗位上不一定能直接满足需要,提示词就是你作为导师手把手、一次次的教他该怎么做,RAG就是你给他一本操作手册让他边学边做,微调就是你对他进行专项职业培训。

那也可以类比出,为什么大模型有幻觉,那就是看在大学里他学了什么,他预训练的数据集是什么,多数是互联网数据,所以他可能过于依赖学校里的经验,来处理实际的工作,就出现了不适应症。

12 个 AI 生成 PPT 测试(主观评价):

排名AI名称能力描述

KIMI+PPT

比以前有退步,但同行衬托下还是顶呱呱

1.5

超级智能体

内容结构较好,模版略土

墨刀AI

需要会员才能下载,第二梯队

智谱

非会员每日免费下载1次

有免费额度,够体验

通义

PPT太单调,第三梯队

纳米AI超级搜索

无PPT能力,生成图文报告

扣子空间

动作最快,效果中庸

豆包

无PPT能力,只能提供文字方案

文心

无PPT能力,只能提供文字方案

元宝

无PPT能力,只能提供文字方案

WPS AI

丢人

天工生成的 PPT:

锐评时间:天工的输出整体内容结构很好,确实适合学习,但 KIMI 的画风更美观(可选模版减少了,KIMI 也变穷了吗)。天工是穷怕了,产品不赖,可惜才刚上线都无免费体验次数,送的积分连一次任务都完不成,本来消耗量就不小,充值后积分还限制 90 天内有效,和其他厂商相比略显抠搜。执行时页面会卡住不更新,刷新后才知道它干到哪了。

2.Kimi-

月之暗面推出的深度研究智能体,据说超越了 4 Opus 与 2.5 Pro(牛蛙牛蛙)。笔者以调研为题,进行了对比测试。

:

梳理国家社会信用体系建设政策的大方向。分析深圳社会信用体系建设的具体落地情况。探讨信息化技术、大数据和AI在社会信用体系建设中的应用发展方向。撰写一份既专业又通俗易懂的调研报告。 收集国家社会信用体系建设相关政策文件,解读政策大方向。调研深圳社会信用体系建设的政策文件、具体措施和实施效果。分析信息化技术、大数据和AI在社会信用体系建设中的应用案例和发展趋势。撰写调研报告,确保内容专业且通俗易懂。

AI开源项目‌ 【2025年6月】AI生产力再探再报:更多更强的超级智能体,统计、调研、PPT、前端开发、控制电脑!还有干饭

8 个 AI生成调研报告+可视化网页测试(主观评价):

AI 对比维度文字篇幅排名文字质量排名可视化图表/网页质量排名交互体验

纳米AI超级搜索

KIMI深度研究

超级智能体

扣子空间

文心X1

沉思

Qwen3分析研究

秘塔AI 长思考+研究

超级智能体组输出结果对比图:

专家智能体组(就是不够超级啦)输出结果对比图:

另外试了DS R1、豆包1.5、混元T1,只能说非超智体的推理模型,输出不足以参与到以上擂台,夸克超级框感觉和秘塔类似,必须要下载浏览器这点就劝退了。顺便一提,纳米超级搜索因为资源紧张,有时执行一半就崩了,每月免费5次,心疼跑了一半烧掉的,要是设计中断保留进度的功能就好了,纳米的交互动态效果特别酷炫!

3.GLM-PC

上期吐槽字节开源好多玩具但是没有可以直接用的产品,比如 UI-TARS,今儿个试试功能类似的产品,收藏了很久还没打开过的——智谱推出的 AI 自动化工具,官方昵称:牛牛。

基本流程是录制电脑屏幕,并通过视觉大模型理解页面元素后,操作软件或文件。官方案例是打开浏览器进行搜索之类的,试之无味,但在办公电脑上还不敢让牛牛做太多,试了以下几项,感觉无视安全性不用担心安全性的话,未来很有潜力。

-1:打开钉钉,看一下有什么未读信息

-1 :在桌面找到钉钉图标,双击打开钉钉界面 → 在界面中找到消息栏,点击 → 在消息页面找到未读选项卡,点击

-2:打开《AI学习应用周报》文件夹,在其中根目录或子目录中找到《AI应用思考与分享.docx》文件,创建副本并修改副本文件名为《AI测试.docx》

-2 :在桌面找到《AI学习应用周报》,双击进入 → 直接点击了其中的第二个文件夹 → 没找到目标文件的情况下也没有返回上级目录 → 随机单击了两个文件,然后全选了文件 → 尝试检索找不到目标文件就放弃了

以上两项是在极速模式下进行的操作(虽然执行动作也不快),用 -2 在深度思考模式下执行增加了在文件搜索栏输入目标文件名的步骤,嗯哼~这确实有思考哦,但是却没有按下回车!牛牛试了好多遍,还是没把文件搜出来,索性把自己输入到搜索栏的 AI应用思考与分享.docx 给改成了 AI测试.docx,牛牛大失败。笔者没有录屏演示,感兴趣的同学下载玩玩,更能感受到这种技术的魅力。

4.

像是 的 ,可通过自然语言执行 操作而不用写更多的函数。是个很有意思的强大的开源工具,不止为数据分析师提质增效,还为开发者提供了垂直领域细分的 AI 创新思路。待笔者有空时再单独写一篇测试体验。

地址:

5.探饭

抖音里的探饭小程序,简单来说就是:对话大模型 + 搜餐饮的地图MCP + AI总结评论,比以前的推荐系统更智能?除了推店,还能 PK 比店、辅助点菜(提供参考信息、无法单点、有接近的套餐则可购买)等,选择困难症有救啦 ~ 不知道长期使用会不会有偏好记录,擅长做推荐算法的抖音来做,嗯嗯。┓( ´∀` )┏ 这里应该给我一个商单。

6.

AI+文件分类工具,免费体验 100 个文件,可充值后获取更多文件数或本地大模型无限数量。功能逻辑相对简单,在传统 自动化办公的基础上增加 AI 即可,大手子可以自己开发一个(之前笔者就一直想开发类似的东西,奈何拖延症和懒癌发作 总是加班无暇)。

二、生产力军火库

本期生产力水军库(不是) 的神器,前两项没实际用过,几个月以来不断的看到有关视频,看起来是能开箱即用的样子。

1.V0

以下为 AI 总结:

V0 是由 推出的一个基于AI的生成式用户界面系统,专为快速和高效的用户界面(UI)创建而设计。主要面向需要快速生成用户界面的开发者和设计人员,特别是那些使用 React 和 CSS 的项目。它通过 AI 技术简化了前端开发流程,提高了开发效率‌。

2.Blot DIY

以下为 AI 总结:

Bolt.diy ‌是一款由 AI 驱动的自动化网站生成工具,其核心功能是让用户通过简单的文本描述,在无需编写任何代码的情况下自动生成并部署一个网站。Bolt.diy 通过用户的文字输入生成代码,快速构建网站,并进行页面设计与内容展示。它适用于个人主页、博客、公司简介等不同类型的网页需求,提供了一个便利的路径,让网站搭建不再是技术门槛而变成一个创意过程‌。

3.火山引擎AI体验中心

火山引擎中像是各种 AI 开发平台的综合功能就不介绍了,来瞅瞅三个好玩的超级智能体: Use 类似牛牛, Use 算是浏览器特化版,代码沙箱不解释。有免费体验额度,去感受科技吧!─=≡Σ(((つ•̀ω•́)つ 那谁,还不安排一个商单。

三、前沿动态速递 1.

以下为 AI 总结:

是一款‌开源、可自托管的云原生应用部署平台‌,主要作为 、 和 的替代方案,支持在自有服务器上快速部署应用程序和管理数据库。目前其 仓库已获得超过 24.2K 星标,涵盖自动化部署、多服务器管理等功能。‌‌

2.MIMO-VL-7B

以下为 AI 总结:

小米多模态大模型 ‌MiMo-VL-7B‌ 是小米研发的7B参数开源模型,通过四阶段预训练(2.4T )和混合强化学习(MORL)实现高效跨模态对齐。在奥林匹克竞赛、高考数学(新课标I卷139分)等复杂推理任务中超越同级模型,GUI交互能力达56.1分。技术亮点包括原生视觉编码器、长上下文支持(2.5K token)及轻量化高效表现,已开源至 Face。

3.nano-vLLM

AI开源项目‌ 【2025年6月】AI生产力再探再报:更多更强的超级智能体,统计、调研、PPT、前端开发、控制电脑!还有干饭

一位 研究员的个人项目,以下为 AI 总结:

Nano-vLLM 是一个轻量级 vLLM 实现,提供与 vLLM 相当的推理速度(RTX 4070 实测吞吐1314.65 /s)。其核心优势包括:1.2k行 代码的简洁实现,支持前缀缓存、CUDA graph等优化技术,API 兼容 vLLM。适用于需高效离线推理且注重代码可维护性的场景,已开源 。

4. / / Open Agent / UI-TARS

各种 AI + 自动化工具,但不是开箱即用,有一定的部署成本,部分开源。

对比维度 工具微软()Open Agent( Face)字节跳动UI-TARS

技术架构

视觉解析双模型

LLM+增强

云端VLM+虚拟机

端到端多模态智能体

核心功能

结构化UI元素输出

原子化Web操作

基础桌面自动化

复杂任务规划

准确性

(依赖LLM)

(低稳定性)

响应速度

(实时)

(毫秒级)

(>30秒延迟)

(迭代响应)

跨平台能力

(全平台)

(仅Web)

(仅Linux)

(全平台)

部署成本

(需本地资源)

(集成成本)

(免费)

(需算力支持)

用户评价

开发效率提升显著

指令可靠性高

排队久、性能不稳定

执行效率跃升

最佳场景

UI测试/无障碍交互

Web自动化脚本

简单任务

复杂跨平台长任务

5.几篇好文

虽然是3月份发布的文章了,但仍值得一读,点击直达:

1、最新「大模型简史」整理!从(2017)到-R1(2025)

2、AI 全栈技术框架综述与未来!

3、团队开盒:AI大脑原来这样工作

后记

如果每家都推出超智体,就可以轮流白嫖了。这里是脑瓜子嗡嗡的 Seon塞翁,下一篇再见~

323AI导航网发布

© 版权声明

相关文章

星河超算AI数字人

暂无评论

暂无评论...