AGI Agent

🚀 项目介绍

AGI Agent 不仅是一个支持 Vibe Colorful Doc、Vibe Coding 和自然语言通用任务执行的智能体平台，更是一个图文文档与代码的交互式创作平台。

通过直观的 GUI，AGI Agent 能够与您携手完成内容的深度加工——更换图片、编辑文字、实时修改 SVG 矢量图与 Mermaid 流程图，乃至边写边运行 HTML 小程序，让每一次创作都所见即所得。结合自然语言与丰富的 skills 技能库，支持多轮次创意迭代，在网页端和纯 Python 环境下均可获得类 Cursor 的强交互智能体创作体验。

平台内置 40+ 工具，提供 GUI、CLI 及嵌入式运行等多种模式，可部署于云端、笔记本或嵌入式设备（ARM），全面支持 Anthropic/OpenAI 大模型接口及开源/私有化部署。

🤔 这款软件适合您吗？

正在寻找开源的 Claude cowork？ AGI Agent 提供类似的协作式 AI 体验，让您能够与智能体协作，智能体可以理解您的需求、操作本地环境并自主执行复杂任务。
需要通用化的本地智能体？ 如果您想要一个能够在本地机器上处理多样化任务的智能体系统——从代码编写到文档生成，从数据分析到系统操作——AGI Agent 正是为您设计的。
编写复杂的专业文档？ 如果您需要创建带有丰富插图、复杂的专业报告，如学术论文、深度研究或专利，AGI Agent 表现的会让你满意（参考介绍）;
寻求可本地部署的代理？ 如果您想要一个支持本地部署且兼容各种 Anthropic/OpenAI 接口模型的代理系统，这可能是您的解决方案;
Vibe 爱好者？ 如果您热衷于 Vibe 工作流程，您会喜欢 AGI Agent。

🆚 与 OpenClaw 的对比

虽然 AGI Agent 与 OpenClaw 在逻辑上都具有智能体内核、记忆系统、通用任务执行能力、长程执行能力和本地部署能力，但 AGI Agent 从零开始构建，不依赖于 OpenClaw 的任何组件，并具有以下关键优势：

🤖 强调智能体本身：AGI Agent 本身是一个集成了众多工具的多智能体系统，且提示词、工具调用等各个方面都可以自己定制（位于 prompts 文件夹）；
🛠️ 强化生产力工具：AGI Agent 主要用于生产力任务，如写专业文档、编写程序、整理数据等，并提供了强大的文档/图像编辑能力，包括图文文档的 Word/PDF 无损直接导出、网页小程序直接执行等；
✍️ 交互式创作体验：大模型输出及工具执行过程会实时流式地输出到网页前端，可观察大模型智能体的实时处理过程。结合自然语言与 skills 技能库，实现多轮次创意迭代，在网页端、纯 Python 环境下即可获得类 Cursor 的强交互式智能体创作体验，您可以@已编辑的文件（或者拖拽）加入新的需求，您可以审查并修改plan计划，支持与用户协同加工生产的结果——例如在 GUI 中直接更换图片、编辑文字、实时修改 SVG 矢量图与 Mermaid 流程图，HTML 小程序可以边写边运行；
🀄 强化中文处理：对 Mermaid、SVG 图像等环节的中文进行了优化，生成的图像中文显示效果出众，界面支持中/英文切换；
🇨🇳 强调与中国大模型的配合：适配了多数国产大模型，支持各类大模型接口（streaming/non-streaming、tool-call/message、OpenAI/Claude）。

🆚 与 Claude Cowork 的对比

虽然 AGI Agent 提供与 Claude cowork 类似的协作式 AI 体验，但它具有以下关键优势：

🏠 完全可本地化：AGI Agent 可以完全安装在您的本地机器上运行，让您完全控制自己的数据和环境，无需依赖云服务。
🔌 通用模型支持：与 Claude cowork 仅限于 Claude 模型不同，AGI Agent 支持任何主流大语言模型，包括 Claude、GPT-4、DeepSeek V3、Kimi K2、GLM、Qwen 等，通过标准的 Anthropic/OpenAI API 接口接入。
💻 跨平台兼容性：完全支持 Windows、Linux 和 macOS，让您可以在任何您喜欢的操作系统上使用 AGI Agent。
📖 100% 开源：提供完整的源代码，实现透明度、可定制性和社区驱动的改进，无供应商锁定。
⚙️ 无需 Claude Code 作为底层：从零开始构建的独立架构，AGI Agent 不需要 Claude Code 作为底层依赖，提供更大的灵活性和控制权。

Vibe Demo

鼠标单击打开Youtube视频

鼠标单击打开Youtube视频（视频中国备用链接）

📺 演示视频（单击播放）

📝 图文写作


AI行研报告写作4款软件横评	免费的专利AI辅助撰写神器

国家项目申请书撰写	AGI Agent：开源智能体图文写作案例

AGI Agent深度图文写作案例-房价走势分析

🤖 通用智能体介绍


适合中国宝宝体质的自主智能体AGI Agent	AGI Agent 登陆Moltbook社区

🧑‍🤝‍🧑 多智能体功能


多智能体辩论赛

💻 编程介绍


游戏编程-合金弹头

📹 更多的功能演示视频（鼠标单击打开演示视频）

📚 作品展示

以下是使用 AGI Agent 生成的部分作品示例，展示了平台在各类文档生成任务中的能力：

🔬 技术研究报告（鼠标单击下载查看）

📊 社会调研报告

📝 项目申请书与专利

🗺️ 旅游攻略与介绍

🎬 其他作品

🚀 新闻

2026/3/2 微信公众号"AGI智创机器人"已就绪，关注+留言可以联系我们。

2026/1/15 GUI支持多平台，如果您希望使用专业图文写作，请选择ColorDoc（彩文）平台，如果您想写专利，可以使用专利写作助手，各个平台的技能（功能）不一样哦～

2025/12/30 GUI 已更新，用于高效的 Vibe 编程、Vibe 文档、Vibe 研究、Vibe任何东西 https://agiagentonline.com。

2025/10/27 AGIAgent 在线注册现已开放！点击 https://agiagentonline.com 右侧的注册按钮进行注册并开始使用。

2025/10/12 提供了 AGIAgent 用于生成带丰富图片的文章的介绍，详见 apps/colordoc/md/README.md 和 apps/colordoc/md/README_zh.md（中文版）。

2025/10/10 Windows 安装包（在线/离线）已就绪！请查看发布页面。

2025/9/15 在线网站（中文版）已可用。访问 https://agiagentonline.com，无需 APIKey 即可登录，您可以找到许多示例。项目介绍主页：https://agiagentonline.com/intro（中文版）已可用。

2025/7/21 GUI 已可用，支持 markdown/PDF/源代码预览，支持 svg 图像编辑和 mermaid 编辑功能，访问 GUI/README_GUI_en.md 了解更多信息，相同的 GUI 已部署在 https://agiagentonline.com。

AGI Agent原理介绍

AGI Agent 遵循基于计划的 ReAct 模型来执行复杂任务。它采用多轮迭代工作机制，大模型可以在每一轮中调用工具并接收反馈结果。它用于根据用户需求更新工作区中的文件或通过工具改变外部环境。AGIAgent 可以自主调用各种 MCP 工具和操作系统工具，具有多代理协作、多级长期记忆和具身智能感知功能。它强调代理的通用性和自主决策能力。AGIAgent 广泛的操作系统支持、大模型支持和多种操作模式使其适合构建类人通用智能系统，以实现复杂的报告研究和生成、项目级代码编写、自动计算机操作、多代理研究（如竞争、辩论、协作）等应用。

🏗️ 核心技术架构

自主多智能体架构

AGIAgent 采用 Manager + 多子 Agent 的协作架构：Manager（老板）负责发起并管理多个子 Agent（如码工、具身机器人、艺术工作者等），每个子 Agent 在独立线程中运行，可独立完成任务，也可相互协作或竞争。

高度自主：自组队、自配置、自监控、自销毁
协作通信：每个智能体具备邮箱，支持点对点及广播消息通信
灵活配置：每个智能体可单独配置提示词、模型、工具库（MCP）、工作区
智能体自主创建：Agent 可依据任务需求自主决定创建新的子 Agent，以应对复杂任务

大模型可调用的智能体相关工具包括：启动智能体、发送消息给智能体、发送广播消息、汇报工作状态、查看活跃智能体、终止智能体。

基于 ReAct 的执行引擎

遵循 Plan → Act → Observe → Reflect 循环，大模型在每轮中调用工具并接收反馈，支持多轮迭代优化（默认 50 轮）。内置渐进式历史压缩机制，突破上下文长度限制，实现真正的长程任务执行。

双层记忆架构

短期记忆：当前任务上下文与工具调用历史
长期记忆：跨任务知识积累，支持语义检索 + 关键词混合检索，无需配置外部 Embedding 模型（内置向量化检索）

无限睡眠唤醒机制

针对长程任务设计的"节能模式"：Agent 在等待外部事件时进入休眠，条件满足后自动唤醒继续执行，支持跨会话任务恢复。

三层工具生态

内置工具（40+）：文件读写、代码执行、网络搜索、图像处理、文档转换等
OS 工具：直接调用系统终端命令，支持 pip/apt 等包管理
MCP 工具：通过模型上下文协议动态接入第三方服务（GitHub、Slack、文件系统等）

多格式文档输出

支持 Markdown / Word / PDF / LaTeX 无损转换，内置 Mermaid 图表渲染与 SVG 矢量图编辑，中文显示经过专项优化。

📖 详见 AGIAgent 技术白皮书

🎯 核心功能

🧠 智能任务分解：AI 自动将复杂需求分解为可执行的子任务
🔄 多轮迭代执行：每个任务支持多轮优化以确保质量（默认 50 轮）
🔍 智能代码搜索：语义搜索 + 关键词搜索，快速定位代码
🌐 网络搜索集成：实时网络搜索获取最新信息和解决方案
📚 代码库检索：高级代码仓库分析和智能代码索引
🛠️ 丰富的工具生态系统：完整的本地工具 + 操作系统命令调用能力，支持完整的开发流程
🖼️ 图像输入支持：支持输入图像素材，支持 Claude 和 OpenAI 视觉模型
📂 文件输入支持：支持输入word（docx），pdf，文本，代码等多种数据源
🎨 图像创作/搜图/文档生图/代码生图支持：多种图像生产方式，mermaid/svg与文档混排，自动解析
📤 多格式导出：支持word/pdf/latex/md四种格式的导出，可以配置word生成模板
✨ SVG图像润色支持：支持基于nanobanana的SVG图像润色
🖥️ Web 界面：直观的 Web 界面，实时执行监控
📊 双格式报告：JSON 详细日志 + Markdown 可读报告
⚡ 实时反馈：详细的执行进度和状态显示
🤝 交互式控制：可选的用户确认模式，逐步控制
📁 灵活输出：自定义输出目录，新项目自动时间戳命名

📄 文档生成功能（选择 APP 平台为 ColorDoc）

ColorDoc 是一个划时代的富图像文档撰写智能体——不仅是全自主智能体，依靠内建工具即可完成复杂的文档撰写、数据分析、编程、网络检索等任务，同时在文档撰写上做了大量深度优化，并支持 MCP 进行工具扩展。

✨ 核心特点

🖼️ 丰富图文排版：支持多样化图片来源（Mermaid 图、SVG 图、谷歌/百度搜图、AI 生图、代码生图），大模型可直接输出图文混合排版格式
📃 长文档生成：一次生成完整的报告、申请书、论文、专利等，篇幅可达 30～50 页
🖊️ 专业写作风格：文字优雅，类似论文和深度报告的文体，不像普通大模型那样只列观点不写细节，写作更专业、更拟人，适合深度写作应用
🛠️ 内建可视化编辑器：内建 SVG 图编辑器、Mermaid 源码编辑器、Markdown 编辑器及预览器，搜到的图像可一键更换，图文文档编辑更轻松
📤 多格式导出：支持输出 Markdown、Word、PDF、LaTeX 等多种文档格式，尤其是 LaTeX 格式，写论文党的必备利器
🔷 矢量图双格式：为提供高质量出版物所需的矢量图并保证兼容性，生成图像同时提供 SVG 与 PNG 两种格式；Markdown 和 PDF 支持 SVG，Word 默认采用 PNG
🔗 MCP 工具扩展：支持外挂各类 MCP 工具，可集成外部知识库、网络检索、淘宝商品搜索、地图检索等
🤖 全自主智能体内核：采用类似 Manus/Cursor 的完全自主智能体内核，智商高、处理问题灵活，可自主安装工具
⚙️ 丰富内建工具：内建 10 余种类 Cursor 常用工具，支持终端运行各类系统程序，内建代码/文档自动增量索引系统，可写代码、做实验、分析用户数据，并将结果汇总为图像和报告
📋 多样写作模板：提供 10 余个写作模板，涵盖报告、国家项目申请书、标书技术应标稿、博客、富图片文档、专利交底书、文档配图等，风格多样
👥 多智能体协同：具备多智能体协同能力，可发起多个智能体共同撰写文档，智能体间完全自主协同
🔒 私有化部署：软件无保留开源，完全免费；支持无互联网环境下的纯私有化部署，支持终端运行、个人网页端运行、小规模云端部署等多种模式；适配 GLM-4.5 等多种国产大模型及 Claude Sonnet 4 等国际先进大模型；国产模型成本可控（几十页、数万字文档开销低于 1 元人民币）

🤖 模型选择

AGI Agent 支持各种主流 AI 模型，包括 Claude、GPT-4、DeepSeek V3、Kimi K2 等，满足不同用户需求和预算。支持流式/非流式、工具调用或基于聊天的工具接口、Anthropic/OpenAI API 兼容性。

🎯 查看详细模型选择指南 →

快速推荐

🏆 质量优先：Claude Sonnet 4.5 - 最佳智能和代码质量
💰 性价比：DeepSeek V3.2 / GLM-4.7 - 出色的性价比
🆓 本地部署：Qwen3-30B-A3B / GLM-4.5-air - 简单任务

💡 提示：有关详细的模型比较、配置方法和性能优化建议，请参阅 MODELS.md

⚙️ 配置文件

AGI Agent 使用 config/config.txt 和 config/config_memory.txt 文件进行系统配置。

快速配置

安装后，请配置以下基本选项：

# 必需配置：API 密钥和模型
api_key=your_api_key
api_base=the_api_base
model=claude-sonnet-4-0

# 语言设置
LANG=zh

💡 提示：有关详细配置选项、使用建议和故障排除，请参阅 CONFIG.md

🌐 平台兼容性

操作系统支持

✅ Linux - 完全支持
✅ Windows - 完全支持
✅ MacOS - 完全支持

运行时接口

终端模式：纯命令行界面，适用于服务器和自动化场景
Python 库模式：作为组件嵌入到其他 Python 应用程序中
Web 界面模式：提供可视化操作体验的现代 Web 界面

交互模式

全自动模式：完全自主执行，无需人工干预
交互模式：支持用户确认和指导，提供更多控制

🔧 环境要求和安装

系统要求

Python 3.8+
网络连接：用于 API 调用和网络搜索功能

安装步骤

推荐使用 install.sh 一键安装（需要 Python 3.8+）。最小化安装：

⚠️ Python 3.8 用户注意：fastmcp 不支持 Python 3.8，安装前请在 requirements.txt 中注释掉 fastmcp 那一行。

pip install -r requirements.txt

# 可选：网页抓取 / 文档转换 / Mermaid 图像
playwright install-deps && playwright install chromium

安装后在 config/config.txt 中配置 api_key、api_base、model 和 LANG=en/zh。

基本使用

GUI

python GUI/app.py

# 然后通过浏览器访问 http://localhost:5001

Web GUI 显示文件列表。默认列出包含工作区子目录的文件夹，否则不会显示。根目录位置可以在 config/config.txt 中配置。注意：Web GUI 目前是实验性的，仅提供单用户开发版本（不适合工业部署）。

CLI

#### 新任务
python agia.py "写一个笑话" 
#### 📁 指定输出目录
python agia.py "写一个笑话" --dir "my_dir"
#### 🔄 继续任务执行
python agia.py -c
#### ⚡ 设置执行轮数
python agia.py --loops 5 -r "需求描述"
#### 🔧 自定义模型配置
python agia.py --api-key YOUR_KEY --model gpt-4 --api-base https://api.openai.com/v1

注意：

继续执行只会恢复工作目录和最后一个需求提示，不会恢复大模型的上下文。
可以通过命令行直接指定 API 配置，但建议在 config/config.txt 中配置以便重复使用。

🛠️ 外部 Skill 文件支持

系统支持外部的 skill 文件（例程/技能）。系统默认的 skill 存放在 routine 文件夹中，并会显示在 GUI 界面的技能栏（中文界面显示 routine_zh 中的内容，英文界面显示 routine 中的内容）。您也可以指定自定义的 skill 目录：

#### 🧩 使用自定义 skill 目录
python agia.py "<your requirements>" --routine routine_file_dir

⚠️ 安全提示

作为通用任务代理，AGI Agent 具有调用系统终端命令的能力。虽然它通常不会在工作目录外操作文件，但大模型可能会执行软件安装命令（如 pip、apt 等）。使用时请注意：

仔细审查执行的命令
建议在沙箱环境中运行重要任务
定期备份重要数据

🎛️ 灵活的智能体自定义

🤖 自定义 Agent 工具集

系统支持灵活调整 Agent 所使用的工具集：

系统默认加载 prompts/tool_prompts.json 中定义的工具
可将需要启用的工具从 prompts/additional_tools.json 的对应字段移入 prompts/tool_prompts.json
不需要的工具可以从 prompts/tool_prompts.json 移回 prompts/additional_tools.json，以减少 Agent 的工具数量，降低 token 消耗

📝 自定义提示词

系统的各类提示词均可自由编辑定制，文件位于 prompts/ 目录下：

文件	说明	生效模式
`prompts/system_prompts.txt`	系统主提示词	Agent 模式
`prompts/rules_prompt.txt`	工具调用规则提示词	Agent 模式
`prompts/user_rules.txt`	额外用户需求提示词	Agent 模式
`prompts/system_plan_prompt.txt`	计划模式系统提示词	Plan 模式

在 Agent 模式下，系统会加载 system_prompts.txt、rules_prompt.txt 和 user_rules.txt；在 Plan 模式下，系统会加载 system_plan_prompt.txt。您可以直接编辑这些文件来调整 Agent 的行为和风格。

🔌 MCP 协议支持

支持模型上下文协议（MCP）与外部工具服务器通信，大大扩展了系统的工具生态系统。

📖 查看 MCP 集成指南 →

🌐 标准化工具调用协议
🔧 支持官方和第三方 MCP 服务器
📁 文件系统、GitHub、Slack 等服务集成
⚡ 动态工具发现和注册

🔗 扩展功能

🐍 Python 库接口

AGI Agent 现在支持在代码中直接作为 Python 库调用，提供类似于 OpenAI Chat API 的编程接口。

📖 查看 Python 库使用指南 →

🐍 纯 Python 接口，无需命令行
💬 OpenAI 风格 API，易于集成
🔧 程序化配置，灵活控制
📊 详细的返回信息和状态

🚀 快速开始

在 Google Colab 中体验 AGI Agent

点击上面的徽章直接在浏览器中启动 AGI Agent，开始体验自主 AI 编程。

联系我们

您可以通过提交 Issue 来提交问题或建议。如需进一步沟通，您可以发送邮件至 bitcursor@2925.com，或关注微信公众号"AGI智创机器人"并留言联系我们。

Name		Name	Last commit message	Last commit date
Latest commit History 284 Commits
GUI		GUI
apps		apps
assets/mermaid		assets/mermaid
config		config
jupyter_demo		jupyter_demo
md		md
prompts		prompts
routine		routine
routine_zh		routine_zh
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
agia.py		agia.py
install.sh		install.sh
lib_demo.py		lib_demo.py
requirements.txt		requirements.txt
setup.py		setup.py

Folders and files

Latest commit

History

Repository files navigation

AGI Agent

🚀 项目介绍

🤔 这款软件适合您吗？

🆚 与 OpenClaw 的对比

🆚 与 Claude Cowork 的对比

Vibe Demo

📺 演示视频（单击播放）

📹 更多的功能演示视频（鼠标单击打开演示视频）

📚 作品展示

🔬 技术研究报告（鼠标单击下载查看）

📊 社会调研报告

📝 项目申请书与专利

🗺️ 旅游攻略与介绍

🎬 其他作品

🚀 新闻

AGI Agent原理介绍

🏗️ 核心技术架构

自主多智能体架构

基于 ReAct 的执行引擎

双层记忆架构

无限睡眠唤醒机制

三层工具生态

多格式文档输出

🎯 核心功能

📄 文档生成功能（选择 APP 平台为 ColorDoc）

✨ 核心特点

🤖 模型选择

快速推荐

⚙️ 配置文件

快速配置

🌐 平台兼容性

操作系统支持

运行时接口

交互模式

🔧 环境要求和安装

系统要求

安装步骤

基本使用

GUI

CLI

🛠️ 外部 Skill 文件支持

⚠️ 安全提示

🎛️ 灵活的智能体自定义

🤖 自定义 Agent 工具集

📝 自定义提示词

🔌 MCP 协议支持

🔗 扩展功能

🐍 Python 库接口

🚀 快速开始

联系我们

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 3

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages