万字长文：Prompt Engineering 完全指南 —— 从入门到专家的 30 个核心技巧

AI教程 AI铺子 1个月前

834

一、什么是 Prompt Engineering？为什么它如此重要？

Prompt Engineering（提示工程）是一门通过设计和优化提示词来引导大语言模型（LLM）产出精准、高质量回应的技术与方法。 它被誉为"大模型的魔法杖"，与传统模型开发中的特征工程地位相当。

一个核心事实：同一个任务，使用不同的提示词设计，可能产生差异巨大的结果。 精心设计的提示词能让模型准确理解任务并给出高质量回答，而模糊的提示词只会换来泛泛而谈甚至错误输出。根据SQ Magazine（2025）统计，清晰的Prompt可减少42%的不相关结果，经过迭代优化的提示语能提升35%的输出品质。

与微调（Fine-tuning）相比，Prompt Engineering有两大核心优势：

对比维度	Prompt Engineering	Fine-tuning（微调）
成本	几乎零成本，实时传入知识	需要大量标记数据，训练成本高
灵活性	修改提示词即可切换任务	每个任务通常需训练一个模型
知识时效性	可实时注入最新信息	知识固化在训练时刻，容易过时

Prompt Engineering本质上是一种新的人机沟通艺术。 掌握它，不仅能提升AI使用效率，更是在AI时代保持竞争力的关键技能。

二、入门篇：8个立刻能用的基础技巧

技巧1：指令必须"无歧义"

AI不是你肚子里的蛔虫，模糊的指令只能得到模糊的结果。

❌ 错误示范	✅ 正确示范
"分析下这个"	"总结这篇论文的关键发现，并用项目符号列表展示"
"语气别太随意"	"请使用正式、学术的语调写作"

就像教小孩"要轻轻地摸小狗"比"不要使劲抓小狗"更有效一样，告诉AI"要做什么"永远比"不要做什么"更有指导性。 "不要"只适合用来控制边界，比如"解释什么是经济计量学，但不要使用复杂的数学公式或行话"。

技巧2：用正面表述替代负面表述

正面指令的指导性远强于负面指令。 "请使用正式、学术的语调"比"语气别太随意"更能让AI准确执行。给AI一个清晰的目标，而不是一个雷区。

技巧3：提供充足的上下文（Context）

LLM本质上是"模式匹配"高手，充足的背景信息能帮助它找到正确的知识库。

上下文的三大作用：

领域背景：帮助模型使用正确的专业术语——如在医学问答中提供病例信息
对话历史：让模型理解多轮对话的连贯性
参考材料：提供具体信息来源，提高答案准确性

关键提醒：上下文并非越多越好。 过长的上下文会增加计算负担，可能导致关键信息被稀释，甚至触发模型的"懒政"。只保留与当前任务最相关的信息。

技巧4：明确指定受众群体

"给5岁小孩解释量子计算"与"为物理学博士写综述"会产生截然不同的结果。 这个简单的设定能让AI自动调整内容深度和表达方式。指定读者群体是一个极其高效的技巧。

技巧5：使用界定符与分隔符

把"指令""背景资料""示例""你的问题"这些不同部分，用清晰的分隔符隔开。

常用分隔符：

分隔符类型	示例
三重反引号	`指令内容`
XML标签	`<context>内容</context>`
井号	`# 指令 #`
破折号	`---`

示例：

# AIPUZI.CN 指令 #
总结以下文章：
<content>这里是文章内容</content>

技巧6：角色设定（Persona Pattern）

"你现在是一个资深前端开发工程师……"——一旦给AI"人设"，它就会用该角色相关的风格、术语和思维模式来回答。

甚至设定MBTI人格都能让回复更像这类人的思考表达，这有论文支撑（arXiv:2509.04343）。

但需注意：角色设定在写作风格、语气调整与创意任务上效果显著，但在纯粹的事实问答上，过度强调"你是专家"反而可能降低准确度。 Persona Pattern最适合用在"怎么说"，而非"说什么"。

技巧7：明确规定输出格式

必须明确告诉AI你要什么格式，这是让输出能被程序调用的关键。

格式类型	适用场景
JSON	后端程序直接解析
Markdown	复制到飞书、Obsidian等工具自动渲染
项目符号列表	快速浏览的总结内容
表格	结构化数据展示

技巧8：输出启动（Output Priming）

想让AI写Python代码？在提示词结尾加上```python，AI就会自觉地按照这个格式继续。

这是一个专业级技巧：通过在结尾给出输出的"起手式"，引导AI顺着你的格式往下生成。同理，要求AI输出Markdown代码、SQL查询等，都可以用这个方法。

Prompt Engineering 完全指（图1）

三、进阶篇：10个提升输出质量的核心方法

技巧9：零样本提示（Zero-shot Prompting）

不给AI任何例子，直接让它干活。 这依赖于AI在训练时已经"内化"的知识。

适合场景：任务简单明确、模型熟悉的场景。GPT-4等大型模型在许多任务上即使没有示例也能表现良好。

局限性：对于复杂任务或特殊格式要求，模型可能无法准确理解用户期望。

技巧10：少样本提示（Few-shot Prompting）

提供2-5个"输入-输出"的例子，让AI通过情境学习（In-Context Learning）掌握模式。

实战案例——情感分类：

文本："这顿饭太好吃了！" 情感：正面
文本："我等了三个小时才上菜。" 情感：负面
文本："这家店的装修还行吧。" 情感：中性
文本："他们的服务真是绝了，再也不来了。" 情感：[?]

研究发现，示例的"格式"和"多样性"甚至比示例的"答案"还重要。AI在学你的"模式"，而不是在背答案。

技巧11：思维链（Chain-of-Thought, CoT）

这是提示工程领域里程碑式的技术。 要求AI把"思考过程"写出来，而不是急着蹦答案。

原始问题：

"小明有5个苹果，他又买了3筐，每筐4个。他现在有几个？"

AI可能直接给"17"也可能给"12"，准不准全靠运气。

使用CoT后：

小明原有5个苹果。他买了3筐，每筐4个，所以新买了 3 × 4 = 12 个苹果。他总共有 5 + 12 = 17 个苹果。答案是17。

CoT给了AI更多的"计算空间"去处理问题，准确率暴涨。

技巧12：Zero-shot CoT（零样本思维链）

你甚至不需要给解题示例，只需要在问题最后加一句"魔法咒语"：

"让我们一步一步地思考。"（Let's think step by step）
更强版本："让我们一步一步地解决这个问题，以确保我们得到正确的答案。"

有研究表明，这句话能让AI回答的准确率大幅提升。

注意：对于推理模型（如DeepSeek R1、ChatGPT o1），它们本身就擅长推理，用这个提示词反而效果可能不好。

技巧13：自一致性（Self-Consistency）

这是CoT的"威力加强版"。 让AI生成多个思维链，取"多数投票"作为最终答案。

比如10次计算中：7次答案是"17"，2次是"12"，1次是"23"——那就选最自洽的"17"。

方法：调高temperature参数让AI每次思路不一样，生成多个答案后取共识。 这种方法能极大提高复杂推理的准确性，且广泛适用、非常有效。

技巧14：最小到最多提示（Least-to-Most Prompting）

将推理问题分解为更小的步骤，每次解决一个，每个子问题的输出用作下一个子问题的输入。

比普通CoT稍复杂，但更能解决需要许多步骤的推理问题。当CoT不够用时，这是你的重型武器。

方法	特点	适用场景
CoT	单线程逐步推理	中等复杂度推理
Least-to-Most	分解子问题，逐个击破	多步骤复杂推理
Self-Consistency	多路径取共识	需要高准确率的场景

技巧15：思维树（Tree of Thoughts, ToT）

如果CoT是"单线程思考"，ToT就是"多线程+自我评估"。 模拟人的"广度优先搜索"：

分解：把问题拆成几步
生成：在第一步同时想出多个可能的思路（A、B、C）
评估： AI自己评估哪个最有前途
探索：顺着最优路径往下走，发现走不通就"回溯"

ToT非常适合下棋、解谜、写小说这种需要"走一步看三步"的复杂任务。

技巧16：验证链（Chain-of-Verification, CoVe）

专门用来"治幻觉"的技术。 流程如下：

步骤	说明
1. 生成答案	AI先给出初步答案
2. 验证计划	AI生成需要验证的关键事实列表
3. 独立验证	AI逐一验证每个事实
4. 修正输出	根据验证结果修正最终答案

技巧17：CO-STAR 框架

由新加坡政府科技局数据科学与AI团队创立，是最实用的提示构建工具之一：

字母	含义	说明
C	Context（上下文）	为任务提供背景信息
O	Objective（目标）	明确你要求完成的任务
S	Style（风格）	指定写作风格，如"商业分析师"
T	Tone（语气）	设置情感调，如正式、幽默
A	Audience（受众）	识别目标受众，如专家/初学者
R	Response（响应）	规定输出格式，如JSON/列表

CO-STAR框架把提示词设计变成了一套可复用的工程流程，强烈建议日常使用。

技巧18：RAG技术（检索增强生成）

AI的知识是静态的，RAG通过外接实时知识库来解决"胡说八道"问题。

工作流程：

步骤	说明
1. 检索	系统先从知识库中检索相关信息
2. 注入	将检索到的可靠信息注入提示词
3. 生成	AI基于这些真实信息作答

RAG大大降低了幻觉概率，是当前企业级应用的主流方案。

技巧19：生成式知识提示（Generated Knowledge Prompting）

在正式答题前，让AI先生成相关知识。 比如要求模型"在生成最终答案之前，先列出有关这个主题的所有有用信息"。

这个简单的技巧在许多情况下可以显著提高LLM的性能。

技巧20：提示链（Prompt Chaining）

将复杂任务分解为一系列小任务，每个任务的输出作为下一个任务的输入。

这就像把一个大项目拆成多个里程碑，降低了每个步骤的复杂度，同时提高了整体的可控性。

四、专家篇：10个高阶策略与实战心法

技巧21：元提示（Meta-prompting / Auto Prompt Engineering）

AI来生成提示词。让一个LLM为另一个LLM编写优化的提示词，通过beam search等技术自动搜索最优提示。

这是一种"让AI教AI"的方法论，可以大幅减少手动调参的工作量。

技巧22：展示而非告知（Show, Don't Tell）

不要满足于"他很悲伤"这样的表述，而是要求AI通过场景、声音和感觉来展现悲伤。

在创作场景中，这个技巧能让AI的输出从"平铺直叙"升级为"身临其境"。同时要明确规定视角一致性，避免AI在不同段落间随意切换人称。

技巧23：深度角色扮演与风格模仿

通过模仿特定作家风格或深度角色扮演来提升作品质量。 可以指定"用鲁迅的风格写""用海明威的简洁笔触写"等。

这在创意写作、营销文案、品牌内容生产中效果极为显著。

技巧24：像管理初级程序员一样管理AI

从简单指令开始，逐步迭代优化，按照示例统一代码风格，通过分解大任务来降低复杂度。

特别有价值的做法：让AI在编码前先用自然语言解释实现逻辑——这相当于自动生成代码文档，既能验证思路正确性，又能留下可维护的说明。

技巧25：思考强度控制（Think / Think Harder / UltraThink）

以Claude Code为代表的AI编程工具，内置了思考强度控制关键词：

关键词	Token消耗	输出质量
think	最低	基础
think hard	中等	较好
think harder	较高	更好
ultrathink	最高	最优

一些搞不定的Bug，试试加上"think harder"甚至"ultrathink"，有奇效。

技巧26：认知验证器（Cognitive Verifier）

让AI主动列出自己的假设，由你来判断哪些正确。 这是一种"AI自检"机制，能有效降低错误信息的传播风险。

技巧27：事实查核清单（Fact Checklist）

要求AI在回答中附上信息来源，降低幻觉风险。 尤其在涉及数据、法规、医学等高风险领域时，这个技巧是必选项。

技巧28：反向互动（Reverse Interaction）

让AI反过来问你问题，引导出更完整的需求。 当你不确定自己想要什么时，这个技巧能让AI帮你梳理思路，比你自己瞎想高效得多。

技巧29：自定义暗语（Meta Language Creation）

用简短的符号或代码触发复杂指令，大幅加快重复性工作的沟通效率。

实战示例：

从现在开始，当我输入 "2 -> 3" 时，意思是：
"请将这段文字从200字扩写成300字，并保持语气专业。"
如果理解请回答 YES。

原理是利用LLM的In-Context Learning能力——你在对话开头定义规则，模型就会在后续对话中遵守。 适合每天处理大量类似任务的营销人员或客服主管。

建议将常用设定存成"Prompt懒人包"，每次开新对话直接贴上。

技巧30：提示词版本控制与A/B测试

把提示词当作代码来管理：做版本控制（V1、V2版）、用占位符动态塞数据、搞A/B测试看哪个效果好。

管理方式	说明
版本控制	保存不同版本的提示词，追踪效果变化
占位符	用{{变量名}}代替具体内容，实现模板复用
A/B测试	同时运行两个提示词，对比输出质量

完美的提示词很少一蹴而就。测试→发现问题→调整→再测试，这个循环才是提示工程师的日常。

五、Prompt Engineering 无法解决的问题

问题类型	说明
纯计算问题	AI的算术能力仍有局限，需借助代码解释器（如PAL技术）
实时信息	模型知识有截止日期，需用RAG或联网搜索补充
精确的事实记忆	AI会"幻觉"，必须用RAG、CoVe等技术约束
过度复杂的多步骤指令	模型可能忽略部分指令，需用Prompt Chaining拆解

六、30个技巧速查总表

编号	技巧名称	难度	核心价值
1	无歧义指令	⭐	消除模糊输出
2	正面表述	⭐	提升指令执行力
3	上下文管理	⭐	精准定位知识库
4	指定受众	⭐	自动调整深度
5	界定符与分隔符	⭐	结构清晰化
6	角色设定	⭐	风格与术语对齐
7	明确输出格式	⭐	程序化调用
8	输出启动	⭐⭐	引导格式延续
9	零样本提示	⭐⭐	简单任务首选
10	少样本提示	⭐⭐	情境学习，掌握模式
11	思维链 CoT	⭐⭐⭐	推理准确率暴涨
12	Zero-shot CoT	⭐⭐	一句咒语搞定推理
13	自一致性	⭐⭐⭐	多路径取共识
14	最小到最多	⭐⭐⭐	多步骤推理
15	思维树 ToT	⭐⭐⭐⭐	多线程+回溯搜索
16	验证链 CoVe	⭐⭐⭐	专治幻觉
17	CO-STAR框架	⭐⭐	系统化构建提示词
18	RAG技术	⭐⭐⭐⭐	接入实时知识库
19	生成式知识提示	⭐⭐	答题前先列知识
20	提示链	⭐⭐⭐	复杂任务分解
21	元提示	⭐⭐⭐⭐	AI生成提示词
22	展示而非告知	⭐⭐	创作质量飞跃
23	深度角色扮演	⭐⭐	风格精准模仿
24	管理式提示	⭐⭐	像管程序员一样管AI
25	思考强度控制	⭐⭐⭐	编程调试神器
26	认知验证器	⭐⭐⭐	AI自检假设
27	事实查核清单	⭐⭐⭐	降低幻觉风险
28	反向互动	⭐⭐	AI帮你梳理需求
29	自定义暗语	⭐⭐⭐	重复性工作提速
30	版本控制与A/B测试	⭐⭐⭐	工程化管理提示词

结语

Prompt Engineering不是天赋，而是一套可学、可练、可优化的系统工程。 从最基础的无歧义指令开始，逐步尝试思维链、自一致性、RAG等高级技巧，你会发现AI的真正潜力远超想象。

记住：测试→发现问题→调整→再测试。 这个循环，就是提示工程师的日常，也是你与AI对话水平持续跃升的唯一路径。

打赏

版权及免责申明：本文由@AI铺子原创发布。该文章观点仅代表作者本人，不代表本站立场。本站不承担任何相关法律责任。

如若转载，请注明出处：https://www.aipuzi.cn/ai-tutorial/prompt-engineering-complete-guide.html

THE END

AI铺子

关注ai行业发展，专注ai工具推荐

+ 关注