AGI Agent 不仅是一个支持 Vibe Colorful Doc、Vibe Coding 和自然语言通用任务执行的智能体平台,更是一个图文文档与代码的交互式创作平台。
通过直观的 GUI,AGI Agent 能够与您携手完成内容的深度加工——更换图片、编辑文字、实时修改 SVG 矢量图与 Mermaid 流程图,乃至边写边运行 HTML 小程序,让每一次创作都所见即所得。结合自然语言与丰富的 skills 技能库,支持多轮次创意迭代,在网页端和纯 Python 环境下均可获得类 Cursor 的强交互智能体创作体验。
平台内置 40+ 工具,提供 GUI、CLI 及嵌入式运行等多种模式,可部署于云端、笔记本或嵌入式设备(ARM),全面支持 Anthropic/OpenAI 大模型接口及开源/私有化部署。
- 正在寻找开源的 Claude cowork? AGI Agent 提供类似的协作式 AI 体验,让您能够与智能体协作,智能体可以理解您的需求、操作本地环境并自主执行复杂任务。
- 需要通用化的本地智能体? 如果您想要一个能够在本地机器上处理多样化任务的智能体系统——从代码编写到文档生成,从数据分析到系统操作——AGI Agent 正是为您设计的。
- 编写复杂的专业文档? 如果您需要创建带有丰富插图、复杂的专业报告,如学术论文、深度研究或专利,AGI Agent 表现的会让你满意(参考介绍);
- 寻求可本地部署的代理? 如果您想要一个支持本地部署且兼容各种 Anthropic/OpenAI 接口模型的代理系统,这可能是您的解决方案;
- Vibe 爱好者? 如果您热衷于 Vibe 工作流程,您会喜欢 AGI Agent。
虽然 AGI Agent 与 OpenClaw 在逻辑上都具有智能体内核、记忆系统、通用任务执行能力、长程执行能力和本地部署能力,但 AGI Agent 从零开始构建,不依赖于 OpenClaw 的任何组件,并具有以下关键优势:
- 🤖 强调智能体本身:AGI Agent 本身是一个集成了众多工具的多智能体系统,且提示词、工具调用等各个方面都可以自己定制(位于 prompts 文件夹);
- 🛠️ 强化生产力工具:AGI Agent 主要用于生产力任务,如写专业文档、编写程序、整理数据等,并提供了强大的文档/图像编辑能力,包括图文文档的 Word/PDF 无损直接导出、网页小程序直接执行等;
- ✍️ 交互式创作体验:大模型输出及工具执行过程会实时流式地输出到网页前端,可观察大模型智能体的实时处理过程。结合自然语言与 skills 技能库,实现多轮次创意迭代,在网页端、纯 Python 环境下即可获得类 Cursor 的强交互式智能体创作体验,您可以@已编辑的文件(或者拖拽)加入新的需求,您可以审查并修改plan计划,支持与用户协同加工生产的结果——例如在 GUI 中直接更换图片、编辑文字、实时修改 SVG 矢量图与 Mermaid 流程图,HTML 小程序可以边写边运行;
- 🀄 强化中文处理:对 Mermaid、SVG 图像等环节的中文进行了优化,生成的图像中文显示效果出众,界面支持中/英文切换;
- 🇨🇳 强调与中国大模型的配合:适配了多数国产大模型,支持各类大模型接口(streaming/non-streaming、tool-call/message、OpenAI/Claude)。
虽然 AGI Agent 提供与 Claude cowork 类似的协作式 AI 体验,但它具有以下关键优势:
- 🏠 完全可本地化:AGI Agent 可以完全安装在您的本地机器上运行,让您完全控制自己的数据和环境,无需依赖云服务。
- 🔌 通用模型支持:与 Claude cowork 仅限于 Claude 模型不同,AGI Agent 支持任何主流大语言模型,包括 Claude、GPT-4、DeepSeek V3、Kimi K2、GLM、Qwen 等,通过标准的 Anthropic/OpenAI API 接口接入。
- 💻 跨平台兼容性:完全支持 Windows、Linux 和 macOS,让您可以在任何您喜欢的操作系统上使用 AGI Agent。
- 📖 100% 开源:提供完整的源代码,实现透明度、可定制性和社区驱动的改进,无供应商锁定。
- ⚙️ 无需 Claude Code 作为底层:从零开始构建的独立架构,AGI Agent 不需要 Claude Code 作为底层依赖,提供更大的灵活性和控制权。
📝 图文写作
🤖 通用智能体介绍
🧑🤝🧑 多智能体功能
💻 编程介绍
以下是使用 AGI Agent 生成的部分作品示例,展示了平台在各类文档生成任务中的能力:
- 大模型及智能体对国内外就业的影响及未来趋势综述
- 2026年AI_Agent发展趋势报告
- 大模型推理芯片发展趋势报告
- 06-大模型推理芯片未来展望与发展路径
- 手机大模型推理芯片未来趋势_完整报告
- 大模型辅助金融投资的现状与未来_完整报告
- 类脑持续学习算法综述
- 浅析马斯克的脑机接口技术-完整报告
- 01_国内外发展现状
- 色彩学完整介绍
2026/3/2 微信公众号"AGI智创机器人"已就绪,关注+留言可以联系我们。
2026/1/15 GUI支持多平台,如果您希望使用专业图文写作,请选择ColorDoc(彩文)平台,如果您想写专利,可以使用专利写作助手,各个平台的技能(功能)不一样哦~
2025/12/30 GUI 已更新,用于高效的 Vibe 编程、Vibe 文档、Vibe 研究、Vibe任何东西 https://agiagentonline.com。
2025/10/27 AGIAgent 在线注册现已开放!点击 https://agiagentonline.com 右侧的注册按钮进行注册并开始使用。
2025/10/12 提供了 AGIAgent 用于生成带丰富图片的文章的介绍,详见 apps/colordoc/md/README.md 和 apps/colordoc/md/README_zh.md(中文版)。
2025/10/10 Windows 安装包(在线/离线)已就绪!请查看 发布页面。
2025/9/15 在线网站(中文版)已可用。访问 https://agiagentonline.com,无需 APIKey 即可登录,您可以找到许多示例。项目介绍主页:https://agiagentonline.com/intro(中文版)已可用。
2025/7/21 GUI 已可用,支持 markdown/PDF/源代码预览,支持 svg 图像编辑和 mermaid 编辑功能,访问 GUI/README_GUI_en.md 了解更多信息,相同的 GUI 已部署在 https://agiagentonline.com。
AGI Agent 遵循基于计划的 ReAct 模型来执行复杂任务。它采用多轮迭代工作机制,大模型可以在每一轮中调用工具并接收反馈结果。它用于根据用户需求更新工作区中的文件或通过工具改变外部环境。AGIAgent 可以自主调用各种 MCP 工具和操作系统工具,具有多代理协作、多级长期记忆和具身智能感知功能。它强调代理的通用性和自主决策能力。AGIAgent 广泛的操作系统支持、大模型支持和多种操作模式使其适合构建类人通用智能系统,以实现复杂的报告研究和生成、项目级代码编写、自动计算机操作、多代理研究(如竞争、辩论、协作)等应用。
AGIAgent 采用 Manager + 多子 Agent 的协作架构:Manager(老板)负责发起并管理多个子 Agent(如码工、具身机器人、艺术工作者等),每个子 Agent 在独立线程中运行,可独立完成任务,也可相互协作或竞争。
- 高度自主:自组队、自配置、自监控、自销毁
- 协作通信:每个智能体具备邮箱,支持点对点及广播消息通信
- 灵活配置:每个智能体可单独配置提示词、模型、工具库(MCP)、工作区
- 智能体自主创建:Agent 可依据任务需求自主决定创建新的子 Agent,以应对复杂任务
大模型可调用的智能体相关工具包括:启动智能体、发送消息给智能体、发送广播消息、汇报工作状态、查看活跃智能体、终止智能体。
遵循 Plan → Act → Observe → Reflect 循环,大模型在每轮中调用工具并接收反馈,支持多轮迭代优化(默认 50 轮)。内置渐进式历史压缩机制,突破上下文长度限制,实现真正的长程任务执行。
- 短期记忆:当前任务上下文与工具调用历史
- 长期记忆:跨任务知识积累,支持语义检索 + 关键词混合检索,无需配置外部 Embedding 模型(内置向量化检索)
针对长程任务设计的"节能模式":Agent 在等待外部事件时进入休眠,条件满足后自动唤醒继续执行,支持跨会话任务恢复。
- 内置工具(40+):文件读写、代码执行、网络搜索、图像处理、文档转换等
- OS 工具:直接调用系统终端命令,支持 pip/apt 等包管理
- MCP 工具:通过模型上下文协议动态接入第三方服务(GitHub、Slack、文件系统等)
支持 Markdown / Word / PDF / LaTeX 无损转换,内置 Mermaid 图表渲染与 SVG 矢量图编辑,中文显示经过专项优化。
📖 详见 AGIAgent 技术白皮书
- 🧠 智能任务分解:AI 自动将复杂需求分解为可执行的子任务
- 🔄 多轮迭代执行:每个任务支持多轮优化以确保质量(默认 50 轮)
- 🔍 智能代码搜索:语义搜索 + 关键词搜索,快速定位代码
- 🌐 网络搜索集成:实时网络搜索获取最新信息和解决方案
- 📚 代码库检索:高级代码仓库分析和智能代码索引
- 🛠️ 丰富的工具生态系统:完整的本地工具 + 操作系统命令调用能力,支持完整的开发流程
- 🖼️ 图像输入支持:支持输入图像素材,支持 Claude 和 OpenAI 视觉模型
- 📂 文件输入支持:支持输入word(docx),pdf,文本,代码等多种数据源
- 🎨 图像创作/搜图/文档生图/代码生图支持:多种图像生产方式,mermaid/svg与文档混排,自动解析
- 📤 多格式导出:支持word/pdf/latex/md四种格式的导出,可以配置word生成模板
- ✨ SVG图像润色支持:支持基于nanobanana的SVG图像润色
- 🖥️ Web 界面:直观的 Web 界面,实时执行监控
- 📊 双格式报告:JSON 详细日志 + Markdown 可读报告
- ⚡ 实时反馈:详细的执行进度和状态显示
- 🤝 交互式控制:可选的用户确认模式,逐步控制
- 📁 灵活输出:自定义输出目录,新项目自动时间戳命名
ColorDoc 是一个划时代的富图像文档撰写智能体——不仅是全自主智能体,依靠内建工具即可完成复杂的文档撰写、数据分析、编程、网络检索等任务,同时在文档撰写上做了大量深度优化,并支持 MCP 进行工具扩展。
-
🖼️ 丰富图文排版:支持多样化图片来源(Mermaid 图、SVG 图、谷歌/百度搜图、AI 生图、代码生图),大模型可直接输出图文混合排版格式
-
📃 长文档生成:一次生成完整的报告、申请书、论文、专利等,篇幅可达 30~50 页
-
🖊️ 专业写作风格:文字优雅,类似论文和深度报告的文体,不像普通大模型那样只列观点不写细节,写作更专业、更拟人,适合深度写作应用
-
🛠️ 内建可视化编辑器:内建 SVG 图编辑器、Mermaid 源码编辑器、Markdown 编辑器及预览器,搜到的图像可一键更换,图文文档编辑更轻松
-
📤 多格式导出:支持输出 Markdown、Word、PDF、LaTeX 等多种文档格式,尤其是 LaTeX 格式,写论文党的必备利器
-
🔷 矢量图双格式:为提供高质量出版物所需的矢量图并保证兼容性,生成图像同时提供 SVG 与 PNG 两种格式;Markdown 和 PDF 支持 SVG,Word 默认采用 PNG
-
🔗 MCP 工具扩展:支持外挂各类 MCP 工具,可集成外部知识库、网络检索、淘宝商品搜索、地图检索等
-
🤖 全自主智能体内核:采用类似 Manus/Cursor 的完全自主智能体内核,智商高、处理问题灵活,可自主安装工具
-
⚙️ 丰富内建工具:内建 10 余种类 Cursor 常用工具,支持终端运行各类系统程序,内建代码/文档自动增量索引系统,可写代码、做实验、分析用户数据,并将结果汇总为图像和报告
-
📋 多样写作模板:提供 10 余个写作模板,涵盖报告、国家项目申请书、标书技术应标稿、博客、富图片文档、专利交底书、文档配图等,风格多样
-
👥 多智能体协同:具备多智能体协同能力,可发起多个智能体共同撰写文档,智能体间完全自主协同
-
🔒 私有化部署:软件无保留开源,完全免费;支持无互联网环境下的纯私有化部署,支持终端运行、个人网页端运行、小规模云端部署等多种模式;适配 GLM-4.5 等多种国产大模型及 Claude Sonnet 4 等国际先进大模型;国产模型成本可控(几十页、数万字文档开销低于 1 元人民币)
AGI Agent 支持各种主流 AI 模型,包括 Claude、GPT-4、DeepSeek V3、Kimi K2 等,满足不同用户需求和预算。支持流式/非流式、工具调用或基于聊天的工具接口、Anthropic/OpenAI API 兼容性。
- 🏆 质量优先:Claude Sonnet 4.5 - 最佳智能和代码质量
- 💰 性价比:DeepSeek V3.2 / GLM-4.7 - 出色的性价比
- 🆓 本地部署:Qwen3-30B-A3B / GLM-4.5-air - 简单任务
💡 提示:有关详细的模型比较、配置方法和性能优化建议,请参阅 MODELS.md
AGI Agent 使用 config/config.txt 和 config/config_memory.txt 文件进行系统配置。
安装后,请配置以下基本选项:
# 必需配置:API 密钥和模型
api_key=your_api_key
api_base=the_api_base
model=claude-sonnet-4-0
# 语言设置
LANG=zh💡 提示:有关详细配置选项、使用建议和故障排除,请参阅 CONFIG.md
- ✅ Linux - 完全支持
- ✅ Windows - 完全支持
- ✅ MacOS - 完全支持
- 终端模式:纯命令行界面,适用于服务器和自动化场景
- Python 库模式:作为组件嵌入到其他 Python 应用程序中
- Web 界面模式:提供可视化操作体验的现代 Web 界面
- 全自动模式:完全自主执行,无需人工干预
- 交互模式:支持用户确认和指导,提供更多控制
- Python 3.8+
- 网络连接:用于 API 调用和网络搜索功能
推荐使用 install.sh 一键安装(需要 Python 3.8+)。最小化安装:
⚠️ Python 3.8 用户注意:fastmcp不支持 Python 3.8,安装前请在requirements.txt中注释掉fastmcp那一行。
pip install -r requirements.txt
# 可选:网页抓取 / 文档转换 / Mermaid 图像
playwright install-deps && playwright install chromium安装后在 config/config.txt 中配置 api_key、api_base、model 和 LANG=en/zh。
python GUI/app.py
# 然后通过浏览器访问 http://localhost:5001Web GUI 显示文件列表。默认列出包含工作区子目录的文件夹,否则不会显示。根目录位置可以在 config/config.txt 中配置。 注意:Web GUI 目前是实验性的,仅提供单用户开发版本(不适合工业部署)。
#### 新任务
python agia.py "写一个笑话"
#### 📁 指定输出目录
python agia.py "写一个笑话" --dir "my_dir"
#### 🔄 继续任务执行
python agia.py -c
#### ⚡ 设置执行轮数
python agia.py --loops 5 -r "需求描述"
#### 🔧 自定义模型配置
python agia.py --api-key YOUR_KEY --model gpt-4 --api-base https://api.openai.com/v1注意:
-
继续执行只会恢复工作目录和最后一个需求提示,不会恢复大模型的上下文。
-
可以通过命令行直接指定 API 配置,但建议在
config/config.txt中配置以便重复使用。
系统支持外部的 skill 文件(例程/技能)。系统默认的 skill 存放在 routine 文件夹中,并会显示在 GUI 界面的技能栏(中文界面显示 routine_zh 中的内容,英文界面显示 routine 中的内容)。您也可以指定自定义的 skill 目录:
#### 🧩 使用自定义 skill 目录
python agia.py "<your requirements>" --routine routine_file_dir作为通用任务代理,AGI Agent 具有调用系统终端命令的能力。虽然它通常不会在工作目录外操作文件,但大模型可能会执行软件安装命令(如 pip、apt 等)。使用时请注意:
- 仔细审查执行的命令
- 建议在沙箱环境中运行重要任务
- 定期备份重要数据
系统支持灵活调整 Agent 所使用的工具集:
- 系统默认加载
prompts/tool_prompts.json中定义的工具 - 可将需要启用的工具从
prompts/additional_tools.json的对应字段移入prompts/tool_prompts.json - 不需要的工具可以从
prompts/tool_prompts.json移回prompts/additional_tools.json,以减少 Agent 的工具数量,降低 token 消耗
系统的各类提示词均可自由编辑定制,文件位于 prompts/ 目录下:
| 文件 | 说明 | 生效模式 |
|---|---|---|
prompts/system_prompts.txt |
系统主提示词 | Agent 模式 |
prompts/rules_prompt.txt |
工具调用规则提示词 | Agent 模式 |
prompts/user_rules.txt |
额外用户需求提示词 | Agent 模式 |
prompts/system_plan_prompt.txt |
计划模式系统提示词 | Plan 模式 |
在 Agent 模式下,系统会加载 system_prompts.txt、rules_prompt.txt 和 user_rules.txt;在 Plan 模式下,系统会加载 system_plan_prompt.txt。您可以直接编辑这些文件来调整 Agent 的行为和风格。
支持模型上下文协议(MCP)与外部工具服务器通信,大大扩展了系统的工具生态系统。
- 🌐 标准化工具调用协议
- 🔧 支持官方和第三方 MCP 服务器
- 📁 文件系统、GitHub、Slack 等服务集成
- ⚡ 动态工具发现和注册
AGI Agent 现在支持在代码中直接作为 Python 库调用,提供类似于 OpenAI Chat API 的编程接口。
- 🐍 纯 Python 接口,无需命令行
- 💬 OpenAI 风格 API,易于集成
- 🔧 程序化配置,灵活控制
- 📊 详细的返回信息和状态
在 Google Colab 中体验 AGI Agent
点击上面的徽章直接在浏览器中启动 AGI Agent,开始体验自主 AI 编程。
您可以通过提交 Issue 来提交问题或建议。如需进一步沟通,您可以发送邮件至 bitcursor@2925.com,或关注微信公众号"AGI智创机器人"并留言联系我们。
























