万字长文:Prompt Engineering 完全指南 —— 从入门到专家的 30 个核心技巧
一、什么是 Prompt Engineering?为什么它如此重要?
Prompt Engineering(提示工程)是一门通过设计和优化提示词来引导大语言模型(LLM)产出精准、高质量回应的技术与方法。 它被誉为"大模型的魔法杖",与传统模型开发中的特征工程地位相当。
一个核心事实:同一个任务,使用不同的提示词设计,可能产生差异巨大的结果。 精心设计的提示词能让模型准确理解任务并给出高质量回答,而模糊的提示词只会换来泛泛而谈甚至错误输出。根据SQ Magazine(2025)统计,清晰的Prompt可减少42%的不相关结果,经过迭代优化的提示语能提升35%的输出品质。
与微调(Fine-tuning)相比,Prompt Engineering有两大核心优势:
| 对比维度 | Prompt Engineering | Fine-tuning(微调) |
|---|---|---|
| 成本 | 几乎零成本,实时传入知识 | 需要大量标记数据,训练成本高 |
| 灵活性 | 修改提示词即可切换任务 | 每个任务通常需训练一个模型 |
| 知识时效性 | 可实时注入最新信息 | 知识固化在训练时刻,容易过时 |
Prompt Engineering本质上是一种新的人机沟通艺术。 掌握它,不仅能提升AI使用效率,更是在AI时代保持竞争力的关键技能。
二、入门篇:8个立刻能用的基础技巧
技巧1:指令必须"无歧义"
AI不是你肚子里的蛔虫,模糊的指令只能得到模糊的结果。
| ❌ 错误示范 | ✅ 正确示范 |
|---|---|
| "分析下这个" | "总结这篇论文的关键发现,并用项目符号列表展示" |
| "语气别太随意" | "请使用正式、学术的语调写作" |
就像教小孩"要轻轻地摸小狗"比"不要使劲抓小狗"更有效一样,告诉AI"要做什么"永远比"不要做什么"更有指导性。 "不要"只适合用来控制边界,比如"解释什么是经济计量学,但不要使用复杂的数学公式或行话"。
技巧2:用正面表述替代负面表述
正面指令的指导性远强于负面指令。 "请使用正式、学术的语调"比"语气别太随意"更能让AI准确执行。给AI一个清晰的目标,而不是一个雷区。
技巧3:提供充足的上下文(Context)
LLM本质上是"模式匹配"高手,充足的背景信息能帮助它找到正确的知识库。
上下文的三大作用:
领域背景: 帮助模型使用正确的专业术语——如在医学问答中提供病例信息
对话历史: 让模型理解多轮对话的连贯性
参考材料: 提供具体信息来源,提高答案准确性
关键提醒:上下文并非越多越好。 过长的上下文会增加计算负担,可能导致关键信息被稀释,甚至触发模型的"懒政"。只保留与当前任务最相关的信息。
技巧4:明确指定受众群体
"给5岁小孩解释量子计算"与"为物理学博士写综述"会产生截然不同的结果。 这个简单的设定能让AI自动调整内容深度和表达方式。指定读者群体是一个极其高效的技巧。
技巧5:使用界定符与分隔符
把"指令""背景资料""示例""你的问题"这些不同部分,用清晰的分隔符隔开。
常用分隔符:
| 分隔符类型 | 示例 |
|---|---|
| 三重反引号 | 指令内容 |
| XML标签 | <context>内容</context> |
| 井号 | # 指令 # |
| 破折号 | --- |
示例:
# AIPUZI.CN 指令 # 总结以下文章: <content>这里是文章内容</content>
技巧6:角色设定(Persona Pattern)
"你现在是一个资深前端开发工程师……"——一旦给AI"人设",它就会用该角色相关的风格、术语和思维模式来回答。
甚至设定MBTI人格都能让回复更像这类人的思考表达,这有论文支撑(arXiv:2509.04343)。
但需注意:角色设定在写作风格、语气调整与创意任务上效果显著,但在纯粹的事实问答上,过度强调"你是专家"反而可能降低准确度。 Persona Pattern最适合用在"怎么说",而非"说什么"。
技巧7:明确规定输出格式
必须明确告诉AI你要什么格式,这是让输出能被程序调用的关键。
| 格式类型 | 适用场景 |
|---|---|
| JSON | 后端程序直接解析 |
| Markdown | 复制到飞书、Obsidian等工具自动渲染 |
| 项目符号列表 | 快速浏览的总结内容 |
| 表格 | 结构化数据展示 |
技巧8:输出启动(Output Priming)
想让AI写Python代码?在提示词结尾加上```python,AI就会自觉地按照这个格式继续。
这是一个专业级技巧:通过在结尾给出输出的"起手式",引导AI顺着你的格式往下生成。同理,要求AI输出Markdown代码、SQL查询等,都可以用这个方法。

三、进阶篇:10个提升输出质量的核心方法
技巧9:零样本提示(Zero-shot Prompting)
不给AI任何例子,直接让它干活。 这依赖于AI在训练时已经"内化"的知识。
适合场景:任务简单明确、模型熟悉的场景。GPT-4等大型模型在许多任务上即使没有示例也能表现良好。
局限性: 对于复杂任务或特殊格式要求,模型可能无法准确理解用户期望。
技巧10:少样本提示(Few-shot Prompting)
提供2-5个"输入-输出"的例子,让AI通过情境学习(In-Context Learning)掌握模式。
实战案例——情感分类:
文本:"这顿饭太好吃了!" 情感:正面 文本:"我等了三个小时才上菜。" 情感:负面 文本:"这家店的装修还行吧。" 情感:中性 文本:"他们的服务真是绝了,再也不来了。" 情感:[?]
研究发现,示例的"格式"和"多样性"甚至比示例的"答案"还重要。AI在学你的"模式",而不是在背答案。
技巧11:思维链(Chain-of-Thought, CoT)
这是提示工程领域里程碑式的技术。 要求AI把"思考过程"写出来,而不是急着蹦答案。
原始问题:
"小明有5个苹果,他又买了3筐,每筐4个。他现在有几个?"
AI可能直接给"17"也可能给"12",准不准全靠运气。
使用CoT后:
小明原有5个苹果。他买了3筐,每筐4个,所以新买了 3 × 4 = 12 个苹果。他总共有 5 + 12 = 17 个苹果。答案是17。
CoT给了AI更多的"计算空间"去处理问题,准确率暴涨。
技巧12:Zero-shot CoT(零样本思维链)
你甚至不需要给解题示例,只需要在问题最后加一句"魔法咒语":
"让我们一步一步地思考。"(Let's think step by step)
更强版本:"让我们一步一步地解决这个问题,以确保我们得到正确的答案。"
有研究表明,这句话能让AI回答的准确率大幅提升。
注意:对于推理模型(如DeepSeek R1、ChatGPT o1),它们本身就擅长推理,用这个提示词反而效果可能不好。
技巧13:自一致性(Self-Consistency)
这是CoT的"威力加强版"。 让AI生成多个思维链,取"多数投票"作为最终答案。
比如10次计算中:7次答案是"17",2次是"12",1次是"23"——那就选最自洽的"17"。
方法:调高temperature参数让AI每次思路不一样,生成多个答案后取共识。 这种方法能极大提高复杂推理的准确性,且广泛适用、非常有效。
技巧14:最小到最多提示(Least-to-Most Prompting)
将推理问题分解为更小的步骤,每次解决一个,每个子问题的输出用作下一个子问题的输入。
比普通CoT稍复杂,但更能解决需要许多步骤的推理问题。当CoT不够用时,这是你的重型武器。
| 方法 | 特点 | 适用场景 |
|---|---|---|
| CoT | 单线程逐步推理 | 中等复杂度推理 |
| Least-to-Most | 分解子问题,逐个击破 | 多步骤复杂推理 |
| Self-Consistency | 多路径取共识 | 需要高准确率的场景 |
技巧15:思维树(Tree of Thoughts, ToT)
如果CoT是"单线程思考",ToT就是"多线程+自我评估"。 模拟人的"广度优先搜索":
分解: 把问题拆成几步
生成: 在第一步同时想出多个可能的思路(A、B、C)
评估: AI自己评估哪个最有前途
探索: 顺着最优路径往下走,发现走不通就"回溯"
ToT非常适合下棋、解谜、写小说这种需要"走一步看三步"的复杂任务。
技巧16:验证链(Chain-of-Verification, CoVe)
专门用来"治幻觉"的技术。 流程如下:
| 步骤 | 说明 |
|---|---|
| 1. 生成答案 | AI先给出初步答案 |
| 2. 验证计划 | AI生成需要验证的关键事实列表 |
| 3. 独立验证 | AI逐一验证每个事实 |
| 4. 修正输出 | 根据验证结果修正最终答案 |
技巧17:CO-STAR 框架
由新加坡政府科技局数据科学与AI团队创立,是最实用的提示构建工具之一:
| 字母 | 含义 | 说明 |
|---|---|---|
| C | Context(上下文) | 为任务提供背景信息 |
| O | Objective(目标) | 明确你要求完成的任务 |
| S | Style(风格) | 指定写作风格,如"商业分析师" |
| T | Tone(语气) | 设置情感调,如正式、幽默 |
| A | Audience(受众) | 识别目标受众,如专家/初学者 |
| R | Response(响应) | 规定输出格式,如JSON/列表 |
CO-STAR框架把提示词设计变成了一套可复用的工程流程,强烈建议日常使用。
技巧18:RAG技术(检索增强生成)
AI的知识是静态的,RAG通过外接实时知识库来解决"胡说八道"问题。
工作流程:
| 步骤 | 说明 |
|---|---|
| 1. 检索 | 系统先从知识库中检索相关信息 |
| 2. 注入 | 将检索到的可靠信息注入提示词 |
| 3. 生成 | AI基于这些真实信息作答 |
RAG大大降低了幻觉概率,是当前企业级应用的主流方案。
技巧19:生成式知识提示(Generated Knowledge Prompting)
在正式答题前,让AI先生成相关知识。 比如要求模型"在生成最终答案之前,先列出有关这个主题的所有有用信息"。
这个简单的技巧在许多情况下可以显著提高LLM的性能。
技巧20:提示链(Prompt Chaining)
将复杂任务分解为一系列小任务,每个任务的输出作为下一个任务的输入。
这就像把一个大项目拆成多个里程碑,降低了每个步骤的复杂度,同时提高了整体的可控性。
四、专家篇:10个高阶策略与实战心法
技巧21:元提示(Meta-prompting / Auto Prompt Engineering)
AI来生成提示词。 让一个LLM为另一个LLM编写优化的提示词,通过beam search等技术自动搜索最优提示。
这是一种"让AI教AI"的方法论,可以大幅减少手动调参的工作量。
技巧22:展示而非告知(Show, Don't Tell)
不要满足于"他很悲伤"这样的表述,而是要求AI通过场景、声音和感觉来展现悲伤。
在创作场景中,这个技巧能让AI的输出从"平铺直叙"升级为"身临其境"。同时要明确规定视角一致性,避免AI在不同段落间随意切换人称。
技巧23:深度角色扮演与风格模仿
通过模仿特定作家风格或深度角色扮演来提升作品质量。 可以指定"用鲁迅的风格写""用海明威的简洁笔触写"等。
这在创意写作、营销文案、品牌内容生产中效果极为显著。
技巧24:像管理初级程序员一样管理AI
从简单指令开始,逐步迭代优化,按照示例统一代码风格,通过分解大任务来降低复杂度。
特别有价值的做法:让AI在编码前先用自然语言解释实现逻辑——这相当于自动生成代码文档,既能验证思路正确性,又能留下可维护的说明。
技巧25:思考强度控制(Think / Think Harder / UltraThink)
以Claude Code为代表的AI编程工具,内置了思考强度控制关键词:
| 关键词 | Token消耗 | 输出质量 |
|---|---|---|
| think | 最低 | 基础 |
| think hard | 中等 | 较好 |
| think harder | 较高 | 更好 |
| ultrathink | 最高 | 最优 |
一些搞不定的Bug,试试加上"think harder"甚至"ultrathink",有奇效。
技巧26:认知验证器(Cognitive Verifier)
让AI主动列出自己的假设,由你来判断哪些正确。 这是一种"AI自检"机制,能有效降低错误信息的传播风险。
技巧27:事实查核清单(Fact Checklist)
要求AI在回答中附上信息来源,降低幻觉风险。 尤其在涉及数据、法规、医学等高风险领域时,这个技巧是必选项。
技巧28:反向互动(Reverse Interaction)
让AI反过来问你问题,引导出更完整的需求。 当你不确定自己想要什么时,这个技巧能让AI帮你梳理思路,比你自己瞎想高效得多。
技巧29:自定义暗语(Meta Language Creation)
用简短的符号或代码触发复杂指令,大幅加快重复性工作的沟通效率。
实战示例:
从现在开始,当我输入 "2 -> 3" 时,意思是: "请将这段文字从200字扩写成300字,并保持语气专业。" 如果理解请回答 YES。
原理是利用LLM的In-Context Learning能力——你在对话开头定义规则,模型就会在后续对话中遵守。 适合每天处理大量类似任务的营销人员或客服主管。
建议将常用设定存成"Prompt懒人包",每次开新对话直接贴上。
技巧30:提示词版本控制与A/B测试
把提示词当作代码来管理:做版本控制(V1、V2版)、用占位符动态塞数据、搞A/B测试看哪个效果好。
| 管理方式 | 说明 |
|---|---|
| 版本控制 | 保存不同版本的提示词,追踪效果变化 |
| 占位符 | 用{{变量名}}代替具体内容,实现模板复用 |
| A/B测试 | 同时运行两个提示词,对比输出质量 |
完美的提示词很少一蹴而就。测试→发现问题→调整→再测试,这个循环才是提示工程师的日常。
五、Prompt Engineering 无法解决的问题
| 问题类型 | 说明 |
|---|---|
| 纯计算问题 | AI的算术能力仍有局限,需借助代码解释器(如PAL技术) |
| 实时信息 | 模型知识有截止日期,需用RAG或联网搜索补充 |
| 精确的事实记忆 | AI会"幻觉",必须用RAG、CoVe等技术约束 |
| 过度复杂的多步骤指令 | 模型可能忽略部分指令,需用Prompt Chaining拆解 |
六、30个技巧速查总表
| 编号 | 技巧名称 | 难度 | 核心价值 |
|---|---|---|---|
| 1 | 无歧义指令 | ⭐ | 消除模糊输出 |
| 2 | 正面表述 | ⭐ | 提升指令执行力 |
| 3 | 上下文管理 | ⭐ | 精准定位知识库 |
| 4 | 指定受众 | ⭐ | 自动调整深度 |
| 5 | 界定符与分隔符 | ⭐ | 结构清晰化 |
| 6 | 角色设定 | ⭐ | 风格与术语对齐 |
| 7 | 明确输出格式 | ⭐ | 程序化调用 |
| 8 | 输出启动 | ⭐⭐ | 引导格式延续 |
| 9 | 零样本提示 | ⭐⭐ | 简单任务首选 |
| 10 | 少样本提示 | ⭐⭐ | 情境学习,掌握模式 |
| 11 | 思维链 CoT | ⭐⭐⭐ | 推理准确率暴涨 |
| 12 | Zero-shot CoT | ⭐⭐ | 一句咒语搞定推理 |
| 13 | 自一致性 | ⭐⭐⭐ | 多路径取共识 |
| 14 | 最小到最多 | ⭐⭐⭐ | 多步骤推理 |
| 15 | 思维树 ToT | ⭐⭐⭐⭐ | 多线程+回溯搜索 |
| 16 | 验证链 CoVe | ⭐⭐⭐ | 专治幻觉 |
| 17 | CO-STAR框架 | ⭐⭐ | 系统化构建提示词 |
| 18 | RAG技术 | ⭐⭐⭐⭐ | 接入实时知识库 |
| 19 | 生成式知识提示 | ⭐⭐ | 答题前先列知识 |
| 20 | 提示链 | ⭐⭐⭐ | 复杂任务分解 |
| 21 | 元提示 | ⭐⭐⭐⭐ | AI生成提示词 |
| 22 | 展示而非告知 | ⭐⭐ | 创作质量飞跃 |
| 23 | 深度角色扮演 | ⭐⭐ | 风格精准模仿 |
| 24 | 管理式提示 | ⭐⭐ | 像管程序员一样管AI |
| 25 | 思考强度控制 | ⭐⭐⭐ | 编程调试神器 |
| 26 | 认知验证器 | ⭐⭐⭐ | AI自检假设 |
| 27 | 事实查核清单 | ⭐⭐⭐ | 降低幻觉风险 |
| 28 | 反向互动 | ⭐⭐ | AI帮你梳理需求 |
| 29 | 自定义暗语 | ⭐⭐⭐ | 重复性工作提速 |
| 30 | 版本控制与A/B测试 | ⭐⭐⭐ | 工程化管理提示词 |
结语
Prompt Engineering不是天赋,而是一套可学、可练、可优化的系统工程。 从最基础的无歧义指令开始,逐步尝试思维链、自一致性、RAG等高级技巧,你会发现AI的真正潜力远超想象。
记住:测试→发现问题→调整→再测试。 这个循环,就是提示工程师的日常,也是你与AI对话水平持续跃升的唯一路径。
版权及免责申明:本文由@AI铺子原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-tutorial/prompt-engineering-complete-guide.html

