如果你刚开始接触 AI,可能会被无穷无尽的术语搞晕:Token、上下文窗口、提示词、RAG、MCP、Agent、工作流……这些不是随意的行话。它们记录了 AI 完整的演进路径:从一个简单的聊天机器人,到能处理实际工作的强大系统。
本文用通俗的语言解释每个概念,搭配实际操作、命令和代码示例,帮助零基础的 AI 学习者一步步理解这些术语的逻辑、功能和使用场景。所有操作都可以直接应用到 Claude Code、Codex 等主流 AI 工具中。
1. Token 与上下文窗口:AI 一次能"读"多少内容?
基本定义
AI 不能像人类一样读文本。它会将所有输入内容拆分成小的基本单位,称为 Token。一个中文词组或一个英文单词可能被拆成多个 Token。
上下文窗口指的是 AI 模型在单次会话中能处理和记忆的最大 Token 数。它决定了三个核心点:
- AI 一次能看到的总体内容量
- 每次 AI 调用的成本(大部分平台按 Token 计费)
- 为什么 AI 会"忘记"早期的对话内容
当你的对话、文件、提示词和工具输出超过上下文窗口限制时,最早的内容会被自动截断。
实际检测操作
我们可以通过 Claude Code CLI 查看 Token 用量和上下文窗口状态。
# Check current session token usage and remaining context window
/cli token stats
初学者使用技巧
- 不要把所有文件和对话历史都塞进一个会话。把长内容分成多个部分处理。
- 对于 8k Token 限制的模型,保持总内容在 7k 以内,避免被截断。
- 长对话可以使用内置压缩功能来节省上下文空间。
2. 提示词与提示工程:让 AI 清晰理解你的任务
基本定义
提示词是你发给 AI 的指令。提示工程是编写标准化、清晰指令的技能,就像给 AI 写一份详细的工作说明书。
模糊的提示词只会得到空洞无用的输出。标准提示词定义了 AI 的角色、任务、背景、输出格式和验收标准。
实用对比与标准模板
❌ 糟糕的模糊提示词
Write a work plan for me.
✅ 初学者标准提示(可直接复制使用)
You are a professional project manager. Write a 1-week AI learning work plan for absolute beginners.
Requirements:
1. Divide tasks by day;
2. Match simple practice cases for each task;
3. Output in table format;
4. Avoid complex professional terms.
AI 工具中的常用命令
# Load fixed prompt rules for the current project (take Claude Code as an example)
/prompt load ./basic-rule.md
3. RAG(检索增强生成):让 AI 查询外部资料
基本定义
纯提示词的一个重大缺陷:AI 只能依赖它的训练数据。对于不熟悉的内部文档、新材料或私人文件,AI 会编造答案(这就是 AI 幻觉)。
RAG 解决了这个问题。它的核心逻辑是:先从知识库中检索相关信息,然后基于检索到的内容生成答案。
RAG 还涉及相关概念:
- Embedding(嵌入):将文本转换为数字向量,用于语义匹配
- 向量数据库:存储海量向量数据,快速搜索相似内容
- Agentic RAG:高级 RAG,能够主动拆分问题、补充资料和验证冲突信息
RAG 实际部署步骤(针对本地文件)
- 准备你的文档(如
employee-manual.md),放入项目文件夹 - 运行命令构建本地知识库并启用 RAG
# Import local documents into RAG knowledge base (Claude Code)
/rag add ./employee-manual.md
# Enable automatic retrieval mode
/rag enable auto
- 提问题测试效果
According to the employee manual, how many working days in advance should I apply for annual leave?
AI 会先检索文档内容,然后给出准确答案,而不是猜测。
4. 工具调用:让 AI 从回答问题到执行操作
基本定义
RAG 给了 AI"查资料"的能力,而工具调用(Function Calling)给了 AI"操作工具"的能力。AI 不再局限于文字生成,可以调用第三方工具完成实际操作。
常见的适用工具:日历、代码运行器、订单系统、浏览器工具、数据库等。
工具调用的简易 Python 演示
以下案例实现 AI 调用时间查询工具:
# Define a simple time query tool
import datetime
def get_current_time():
return datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
# AI triggers tool calling according to instructions
user_input = "Tell me the current system time"
if "time" in user_input:
result = get_current_time()
print(f"Current time: {result}")
AI Agent 中的工具调用命令
# Call the built-in code running tool to execute the above script
/tool run python ./time-tool.py
5. MCP(模型上下文协议):AI 连接外部工具的统一标准
基本定义
当工具越来越多时,每个工具都需要独立的接口,导致开发和维护成本高昂。
MCP 是 AI 与外部工具的统一连接协议,相当于"AI 世界的 USB-C 接口"。它统一了所有工具的接入规则,包括参数传输、权限管理、结果返回和安全控制。
MCP 实际安装与连接
以连接网页搜索 MCP 服务为例:
npm install -g @brave-search-mcp-server
claude mcp add brave-search --api-key YOUR_API_KEY
配置完成后,你只需发送自然语言指令,AI 就会自动调用 MCP 工具完成搜索。
6. 上下文工程与上下文引擎:管理 AI 看到的信息
基本定义
提示工程关注单条指令,而上下文工程关注整体信息流。它合理地为 AI 搭配对话历史、用户数据、文档内容和工具结果。
核心原则:不要发送过多信息干扰 AI,也不要发送过少信息导致误判——提供恰好需要的内容。
上下文引擎是上下文工程的自动化系统。它能自动过滤敏感内容、压缩长文本和排序关键信息。
实际配置文件示例
在项目文件夹中创建 context-config.json,限制上下文规则:
{
"keep_recent_dialogue": 5,
"compress_long_text": true,
"filter_sensitive_data": true,
"max_token_per_request": 6000
}
在 AI 工具中加载配置文件:
/context load ./context-config.json
7. Skill(技能):复用成熟工作流,避免重复教学
基本定义
Skill 是可复用的固化工作流。提示词是一次性指令,而 Skill 是长期使用的标准操作流程(SOP)。
对于写周报、整理代码、处理表单等重复性工作,你可以将整个流程固化为一个 Skill。下次直接调用即可。
创建与调用自定义 Skill
1. 创建一个名为"AI 周报生成"的新 Skill
Create a new skill named weekly-report. The requirements: sort this week's work content,
extract core achievements, list pending problems and next week's plan, and use formal workplace tone.
2. 一键调用已有的 Skill
Use weekly-report to generate my work weekly report.
8. Computer Use:让 AI 像人一样操作电脑
基本定义
工具调用是调用 API 接口,而Computer Use是让 AI 直接操作电脑:识别屏幕、控制鼠标和键盘,完成页面点击、表单填写、文件上传等人工操作。
它适用于没有开放 API 的老系统和网页,如内部审批系统、旧版后台管理页面等。
实际操作(结合 Playwright CLI)
# Start headed browser for manual simulation operations
playwright-cli open https://your-work-system.com --headed --persistent
# Automatically click the login button
playwright-cli click "text=Login"
# Automatically fill account and password
playwright-cli fill "input[name=username]" "test-user"
playwright-cli fill "input[name=password]" "test-123456"
9. Agent:AI 自动拆分任务并循环执行
基本定义
Agent 是自主 AI 执行体。与单轮对话和单一工具调用不同,Agent 遵循循环逻辑:制定计划 → 执行动作 → 观察结果 → 调整步骤。
给定一个总体目标,Agent 会将复杂任务拆分为多个子任务,自主选择工具并逐轮解决问题。广泛应用于代码开发、项目调试和数据分析。
Agent 核心启动命令(Claude Code)
# Set the overall goal and start automatic cycle execution
/goal Debug the project startup error, check logs and configuration files, fix bugs and ensure the project runs normally. Stop after 15 iterations.
# Enable automatic mode to reduce manual confirmation
/auto on
10. Harness 工程:让 Agent 安全可控地运行
基本定义
强大的 Agent 也有风险:误删文件、修改生产代码、泄露数据等。Harness 工程是 Agent 的安全控制系统,相当于安全带的刹车。
它包含权限控制、沙箱运行、日志追踪、人工审批、回滚机制和成本控制。
简易沙箱限制配置
创建 harness-rule.md 限制 Agent 权限:
# Agent Safety Rules
1. Only allow operating files in the ./test folder;
2. Prohibit deleting any files;
3. All code modifications must be reviewed manually before submission;
4. Automatically stop when token consumption exceeds 10000 per hour.
加载规则文件:
/harness load ./harness-rule.md
11. 工作流与工作空间 Agent:接入正式业务流程
11.1 工作流
工作流将 AI、数据库、消息通知、人工审批和定时任务连接成完整的业务流程。它负责安排每一步的执行顺序,适用于客户咨询、订单处理和报表统计等长链路业务。
11.2 工作空间 Agent
- 普通 Agent:相当于临时工,完成单一任务
- 工作空间 Agent:相当于长期在岗的助理。它始终存在于团队工作空间中,掌握团队文档、人员分工、历史工作和权限规则。能自动关联长期上下文完成工作。
简单工作流命令示例
# Start the customer consultation process workflow
/workflow start customer-service-flow
# View the running status of the workflow
/workflow status
完整演进逻辑与入门学习建议
AI 演进主线
聊天机器人(提示词)→ 查询外部知识(RAG)→ 执行动作(工具调用 + MCP)→ 复用工作流(Skill)→ 模拟人工操作(Computer Use)→ 自主执行任务(Agent)→ 安全上线(Harness)→ 接入业务场景(工作流 + 工作空间 Agent)
零基础学习步骤
- 先掌握 Token 和上下文窗口,控制使用成本和内容量
- 练习提示词编写,提高 AI 基础输出质量
- 学习 RAG,解决私密文档查询问题
- 尝试工具调用和 MCP,实现简单的自动化操作
- 将重复操作固化为Skill,提升效率
- 逐步学习 Agent、Harness 和工作流,构建复杂 AI 系统
以上所有命令和代码片段都可以直接应用到 Claude Code、Codex 等主流 AI 工具中。从简单案例开始,一步步实践,就能轻松掌握主流 AI 技术。