首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

一文读懂2025核心概念 AI Agent:科技巨头都在布局的未来赛道(DeepSeek只是开始,AI Agent更是未来!)

  • 25-04-22 01:01
  • 4613
  • 11722
juejin.cn

随着2024年度人工智能大模型技术的进一步发展,2025年开年众多科技大佬包括英伟达的黄仁勋、OpenAI的奥特曼、机器学习大佬吴恩达都开始频繁强调一个词:AI Agent, ,就连微软,谷歌,腾讯、字节,阿里等公司都一再说明AI Agent是2025年最值得关注的人工智能技术,2025年是AI Agent元年。那么问题来了,众多人工智能爱好者关注者可能要问:什么是AI Agent呢?AI Agent都有哪些表现形式或关键技术呢?(毕竟在互联网领域,创造新词的速度远比创造价值的速度快,比如颗粒度,透传,Paas, Sass, Iass,呃有点跑偏了~),本篇文章就结合吴恩达在Build 2024的演讲为大家通俗易懂的分享 “到底什么是AI Agent?”

0.png

AI Agent 与 大模型的区别

我们目前使用的DeepSeek,千问等模型都归属于大模型范畴,它们执行任务的流程特别简单:你只需要提出问题,它在接受指令后直接生成回答,期间只有用户和它自己本身模型参与。以编写一个文案为例: 1.png

那么如果是让AI Agent写一个文案,他会如何做呢?它的处理路径可能如下:

  1. 先使用模型撰写大纲
  2. 根据大纲查询资料
  3. 对资料和输出内容进行总结生成
  4. 可用相同或不同模型评测,根据评测结果反复优化
  5. 达到条件输出内容

2.png

可想而知,经过以上设计处理的文案输出效果明显好于单一大模型输出的。然后大家再想想我们人类是如何写文案的?看看AI Agent的处理是不是和人类特别相似。 3png.png

通过以上例子相信大家能直观感受到AI Agent和大模型的区别。通俗易懂的讲:AI Agent是一个包含一个或多个大模型,具备一定编排,和人类直观行为更相辅的复杂系统。 更简单来说,AI Agent就是将大模型作为处理部件,编排类人处理流程的系统。

AI Agent分类

机器学习大佬吴恩达曾在演讲中将AI Agent分为如下四类:

反思系统 Reflecttion

定义: 一种通过自我反思方式,帮助模型不断改进输出质量的编排系统。这种方法模仿了人类在完成任务时的思考和修正过程,使得模型推理能力更强,结果更可靠。

举例: 这种编排系统特别适合输出高质量的文案,比如我们上面提到的AI Agent编写文案的例子就是这种反思系统的模式。著名的国外平台:Grammarly 就是利用了编排系统,调用强大的AI大模型进行写作,同时它不断反思检查你的拼写、语法和标点符号,通过多模型提供的句子结构和语言流畅性的建议进一步优化输出更好的效果。 5.png

工具调用系统 Tool Use

定义: 让大语言模型在生成答案或解决问题的过程中,调用外部工具(如计算器、数据库、搜索引擎等),以完成自身无法直接处理的任务。

举例: 现在的大语言模型更多的只是文本的生成和回答,工具调用系统可以通过调用工具弥补大语言模型的不足,扩展模型的功能。我的文章 手把手教你使用DeepSeek+VS Code玩转AI编程 中使用的Vs Code 插件 Cline+Continue 相当于 代码编程领域的AI Agent,通过调用各类工具完成文件创建,代码编写检查,代码调试运行等一系列的功能。将DeepSeek大模型的能力扩展到了编程领域。

web5.png

计划系统 Planning

定义: 模型在解决复杂问题时,为实现目标指定合理的步骤或行动计划的能力。让大模型在面对复杂任务时,能像人一样制定计划、分解问题、逐步执行。

举例: Image Describer X图片描述网站 在处理我们图片时会使用模型制定计划,如果我们想输入一张小女孩读书的图片并进行描述,Image Describer X会进行如下行为:

  1. 调用openpose model提取小女孩读书的动作
  2. 调用Google Vit模型把动作转化为图片
  3. 调用Vit-GPT2模型把图片转成文字
  4. 调用fast speech模型把文字转成语音

这种AI Agent就像我们人类一样把大问题拆分成小问题,并制定计划解决。它更贴近真实智能的行为,可以处理广泛复杂任务。

6.png

Multi-Cast Multi Agent

定义: 最复杂的Agent系统,利用了多个Agent智能体,在共同目标的指导下,通过分工、协作和交互来完成任务或解决问题的过程。

举例: 2023年7月,清华大学 NLP 实验室联合面壁智能、北京邮电大学、布朗大学的研究人员共同发布了一个大模型驱动的全流程自动化软件开发框架 ChatDev (Chat-powered Software Development),加入 OpenBMB 大模型工具体系。ChatDev 是一个由多智能体协作运营的虚拟软件公司,在人类“用户”指定一个具体的任务需求后,不同角色的智能体将进行交互式协同,包括产品智能体设计方案,UI智能体设计界面,程序员智能体实现效果,测试智能体评估代码来生产一个完整软件(包括源代码、环境依赖说明书、用户手册等),直观上来说这种机制和软件公司并无两样,也是多智能体Agent系统的表达形式之一。具体的项目体验可参考chatdev的github: github.com/OpenBMB/Cha… chatdev.png

科技公司AI Agent的探索

AI Agent的概念如此重要,各科技公司也对它展开了积极的探索,推出了一些实际或理想的产品。下面简单列举国内外各大公司在Agent领域的项目:

  1. 腾讯: 腾讯元器开放的智能体模式就是AI Agent的典型应用,大家可以通过外部插件(tool use), 大模型流程编排(planning)等方法构建智能体,大家也是施展聪明才智构建了包括PPT助手,育儿助手等各种各样的智能体,大家可以体验一下~ 7.png
  2. 谷歌:2024年5月,谷歌就发布了一个震撼的AGI系统 Astra将AI Agent的能力集中在手机摄像头上,通过手机的摄像头让Astra对所有听到、看到的东西进行解读。可以点击扬声器、画笔、代码让其解释用途和含义,是典型的Multi Agent 多智能体应用。演示视频可见:www.bilibili.com/video/BV1AU… 7.5.png

总结

经过以上的分享,大家都直观感受到了AI Agent的重要意义。人工智能的发展道路基本可分为如下三步:AI->AI Agent->AGI。DeepSeek,Qwen等强力大模型的出现为AI Agent提供了良好的模型基础,使其可以构建更大更强的智能体系统。AI Agent的发展又让AGI(通用人工智能,旨在创造一个能像人类一样思考、学习、执行多种任务的系统)的美好愿景逐渐成为现实,未来的世界一定是人工智能的世界!【本期先为大家介绍AI Agent的概念,之后也会出分享利用大模型Function Calling基础能力,Dify等低代码框架,Swarm等Multi Agent框架为大家分享搭建智能体的实践,大家感兴趣可关注wx公众号大模型真好玩获取更多精彩内容和免费资料分享~】

8.png

注:本文转载自juejin.cn的大模型真好玩的文章"https://juejin.cn/post/7476755577193938983"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top