AI Agent概念，AI Agent是什么（非常全面）

Agent 是一种能够自主规划、自行决策和自动执行任务的智能实体应用程序。与传统的人工智能相比，Agent 具备通过主动思考、调用工具，有计划地逐步完成用户设定目标的能力。

Agent 不是近年来才出现的概念，在大语言模型（Large Language Model，LLM）出现之前，Agent 实现的是其字面意思“代理”或“助理”的功能，作为工具被动地协助人类完成一些工作任务。

随着 ChatGPT 及同类型大语言模型产品的迅速发展，Agent 技术也在快速迭代，从通过多个角色对话的方式来解决用户问题的简单场景开始，逐步加强在长记忆、主动思考、任务分解、任务执行、工具调用等方面的能力，目前正在朝通用人工智能（Artificial General Intelligence，AGI）方向迈进。

在很多场景下，大语言模型也被称为 LLMs（Large Language Models），是指一类 LLM 服务。

Agent的概念

在人工智能语境下，Agent 是 AI Agent 的简写。Agent 的概念与人工智能、主动服务于人类的软件、大语言模型等有关。

亚马逊的 AWS 云服务网站中的 Agent 定义为：AI Agent 是一种软件程序，它可以与环境互动，收集数据，并利用数据执行自主任务，以实现人类预定的目标。AI Agent 会独立选择实现这些目标所需的最佳行动。

IBM 对 Agent 的定义则突出了其自主性和扩展性，将 Agent 定义成能够通过设计工作流程和利用可用工具，代表用户或其他系统自主执行任务的系统或程序。AI Agent 可以包含自然语言处理之外的广泛功能，包括决策、解决问题、与外部环境交互和执行操作。

Microsoft 则着重强调了 Agent 的使用场景和功能：Agent 为用户执行特定任务、回答问题并自动执行流程，具有较高的复杂性而且功能差异很大，从简单的聊天机器人到 Copilot，再到数字人或机器人系统形式的高级人工智能助手，可以自主运行复杂的工作流程。

Microsoft还阐述了Agent与大语言模型或基于规则的软硬件之间在自主性方面的重要区别，也明确了 Agent 具备规划（Planning）、工具使用（Tool usage）、感知（Perception）和记忆（Memory）等功能。

综合以上信息，笔者对 Agent 的定义总结如下：Agent（AI Agent）是一种人工智能应用，通过自主规划、工具调用、感知和记忆等功能，在大语言模型的支持下，代表或代理人类，自主决策，主动解决用户提出的任务。

Agent 的中文翻译是“代理”，代理这个词指代的职业、职位比较宽泛，有些图书或文章将 AI Agent 直译成“人工智能代理”，其主动性被弱化了。如果翻译成“助理”（Assistant），则会把 Agent 的应用场景缩小很多。目前比较通行的翻译是“智能体”，虽然未能表达出Agent代表人类的特点，但是说明了 Agent 是一个具有智能的独立个体，有一定的主动性。笔者的想法是将智能体简化为“智体”，智体与智能体表达的意思没有区别，但更有科技感和画面感。

常用的Agent开源技术

下表列出了一些常用的开源 Agent 应用、开发框架和运行平台。

表：常用的Agent开源技术
序号	名称	功能说明
1	AdaL	自主进行数据标注的 Agent 框架
2	Agent4Rec	个性化电影推荐 Agent
3	AgentForge	可扩展的 AGI 框架
4	AgentGPT	基于浏览器的 AutoGPT 无代码版本
5	AgentPilot	在桌面应用程序中构建、管理 Agent 并与之聊天
6	GPT-4（未完全公开）	基于GPT-3数据扩展，新增高质量合成数据与人类反馈样本
7	AgentScope	阿里巴巴开源的 Multi-Agent 框架，亮点是支持分布式框架，并且做了工程链路上的优化及监控
8	HMM/CRF序列模型	具备序列标注能力，适用于结构预测
9	词向量模型（Word2Vec）	词义分布表示，引入稠密向量空间
10	DeepSeek-V2	中文网页、维基百科、新闻、新浪微博、代码等
11	Mistral	The Pile、RefinedWeb、Books、StackExchange、HackerNews等
12	Claude（Anthropic）	高比例人类反馈训练数据、网页内容、对话语料
13	ChatGLM3	中文互联网页面、百科、新闻、问答语料、GitHub 代码等
14	PalM 2	C4、Books、Wikipedia、科学语料（PubMed）、对话语料等
15	Falcon	RefinedWeb、Books、Dialogues、Code、Multilingual Web数据
16	Devika	主动式 AI 软件工程师
17	DevOpsGPT	AI 驱动的软件开发自动化解决方案
18	dotagent	在云端、个人计算机或移动设备上部署 Agent
19	e2b-dev/E2B	Agent的云端运行环境
20	evo.ninja	多功能通用型 Agent，使其角色适应并完成多种任务
21	GeniA	AI 工程团队协作工具
22	Godmode	AutoGPT 和 BabyAGI 同类产品
23	GPT Discard	提供针对 Discard 的集成 GPT 接口
24	GPT Engineer	根据提示词生成整个代码库
25	GPT Migrate	在不同框架 / 语言之间迁移代码库
26	GPT Pilot	从头开始编写一个完整的可扩展的应用程序
27	GPT Researcher	基于 GPT 的自主 Agent，可对任意给定主题进行在线综合研究
28	Devika	主动式 AI 软件工程师
29	DevOpsGPT	AI 驱动的软件开发自动化解决方案
30	dotagent	在云端、个人计算机或移动设备上部署 Agent
31	e2b-dev/E2B	Agent 的云端运行环境
32	evo.ninja	多功能通用型 Agent，使其角色适应并完成多种任务
33	GeniA	AI 工程团队协作工具
34	Godmode	AutoGPT 和 BabyAGI 同类产品
35	GPT Discard	提供针对 Discard 的集成 GPT 接口
36	GPT Engineer	根据提示词生成整个代码库
37	GPT Migrate	在不同框架 / 语言之间迁移代码库
38	GPT Pilot	从头开始编写一个完整的可扩展的应用程序
39	GPT Researcher	基于 GPT 的自主 Agent，可对任意给定主题进行在线综合研究
40	GPTswarm	基于图形的 Agent 框架
41	h2oGPT	查询管理本地文档、图片、视频等文件的 RAG 应用
42	JARVIS	一个将 LLM 与 ML（机器学习）社区连接起来的系统
43	LangChain	构建情境感知推理应用程序的 Agent 开发框架
44	LangGraph	以图的形式弹性构建 Agent 的开发框架
45	LlamaIndex	基于 LLM 的数据应用开发框架
46	MemGPT	创建具有长期记忆和自定义工具的 Agent 应用
47	MetaGPT	返回设计、任务或仓库的 Agent 框架
48	NLsOM	以统一的符号语言轻松将 Agent 集成到系统中
49	OpenAgents	通用型 Multi-Agent 平台
50	OpenAGI	专注于研究与开发（R&D）领域的 Agent 平台
51	Pezzo	用于管理提示词等的开发工具包
52	Databerry	本地知识库问答系统，支持各种文件格式和数据库，允许离线安装和使用
25	DB-GPT	AI 原生数据应用开发框架
26	DemoGPT	生成新应用程序演示的工具
27	DevGPT	虚拟开发者团队
54	Vanna.AI	基于 Python 的 AI SQL Agent，可根据特定数据进行训练
55	Voyager	用于 Minecraft 游戏的受 LLM 驱动的终身学习 Agent
56	Westworld simulation	《西部世界》的 Multi-Agent 环境仿真库
57	UFO	面向 Windows 系统的 Agent，结合自然语言和视觉语言操作 Windows GUI

AI Agent概念，AI Agent是什么（非常全面）

Agent的概念

常用的Agent开源技术

相关文章