Prompt Engineering系统化方法论：从基础模板到高级技巧的完整实战指南

系统化讲解Prompt Engineering方法论，从基础五要素模板到Chain of Thought、Few-shot、System Prompt高级技巧，附完整Python代码示例。

# 为什么你的Prompt总是得不到满意的输出？一套系统化的提示工程方法论

你一定有过这样的经历：同样的问题发给大模型，别人拿到的是精准、结构化的专业回答，而你得到的却是一段泛泛而谈的废话。差距不在模型，而在 Prompt Engineering（提示工程）。

提示工程不是玄学，而是一套可以被系统化学习和复用的工程方法论。本文将从基础模板讲起，逐步深入到 Chain of Thought、Few-shot Learning、System Prompt 设计等高级技巧，并结合可直接运行的 Python 代码示例，帮你建立完整的提示工程知识体系。

一、基础 Prompt 模板：用结构化思维消除歧义

大多数失败的 Prompt 都有一个共同特征：信息模糊、缺少约束、没有输出格式要求。

一个合格的基础 Prompt 应包含以下要素：

要素	说明	示例
角色设定	定义模型扮演的身份	"你是一名资深 Python 后端工程师"
任务描述	明确要完成的具体工作	"请编写一个 REST API 接口"
输入数据	提供任务所需的上下文信息	"数据库表结构如下：..."
输出格式	约束返回结果的结构	"以 JSON 格式返回"
约束条件	限定范围和规则	"不使用第三方库，仅用标准库"

来看一个可直接运行的完整示例：

python
from openai import OpenAI

client = OpenAI()  # 默认读取环境变量 OPENAI_API_KEY

def basic_prompt_example():
    """基础结构化 Prompt 示例：代码审查"""

    prompt = """
你是一名拥有 10 年经验的 Python 高级工程师，专注于代码质量审查。

## 任务
请对以下 Python 函数进行代码审查，指出潜在问题并给出改进建议。

## 输入代码

def get_user_orders(user_id):

orders = db.execute(f"SELECT * FROM orders WHERE user_id = {user_id}")

result = []

for row in orders:

result.append({

'id': row[0],

'name': row[1],

'total': row[2]

})

return result

bash

## 输出要求
请按以下格式输出：
1. **安全问题**：列出所有安全隐患（如 SQL 注入风险）
2. **性能问题**：分析性能瓶颈
3. **代码风格**：指出不符合 PEP 8 的地方
4. **改进后的代码**：给出完整的改进版本
"""

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3,
    )
    print(response.choices[0].message.content)

basic_prompt_example()

关键要点：temperature 设为 0.3 可以让输出更稳定、更确定。代码审查类任务适合低温度值，创意写作类任务则适合 0.7-0.9。

二、高级技巧一：Chain of Thought（思维链）

Chain of Thought（CoT）的核心思想非常简单：让模型"想清楚"再回答，而不是直接给出结论。

研究表明，当模型被要求展示推理过程时，其输出的准确率可以提升 40% 以上，尤其在数学推理、逻辑判断等任务上效果显著。

2.1 隐式 CoT：通过"逐步思考"触发

最简单的 CoT 实现方式，只需在 Prompt 中加一句引导语：

python
def chain_of_thought_implicit():
    """隐式 CoT 示例：数据分析推理"""

    prompt = """
你是一名数据分析师。请分析以下电商销售数据，判断是否需要调整营销策略。

## 销售数据
- 1月：转化率 3.2%，客单价 285 元，UV 50,000
- 2月：转化率 2.8%，客单价 271 元，UV 52,000
- 3月：转化率 2.1%，客单价 248 元，UV 55,000

请逐步分析每个指标的变化趋势及其可能原因，最后给出是否需要调整策略的建议。
"""

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.2,
    )
    print(response.choices[0].message.content)

chain_of_thought_implicit()

2.2 显式 CoT：提供完整的推理模板

对于复杂任务，可以给模型提供结构化的推理框架：

python
def chain_of_thought_explicit():
    """显式 CoT 示例：带推理框架的技术方案评估"""

    prompt = """
你是一名技术架构师，需要评估以下系统升级方案。

## 背景
当前系统：单体 Django 应用，MySQL 数据库，日活用户 10 万。
升级方案：拆分为微服务架构，引入 Redis 缓存，使用 Kafka 做消息队列。

## 请按以下框架逐步分析
### Step 1 - 现状分析
列出当前系统的主要瓶颈。

### Step 2 - 方案匹配度
评估升级方案中的每个组件是否真正解决了 Step 1 中的瓶颈。

### Step 3 - 风险评估
分析引入微服务、Redis、Kafka 后可能带来的新问题。

### Step 4 - 成本估算
评估人力成本、运维成本、迁移风险。

### Step 5 - 最终建议
给出明确的 Go/No-Go 建议，以及推荐的分阶段执行计划。
"""

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.2,
    )
    print(response.choices[0].message.content)

chain_of_thought_explicit()

三、高级技巧二：Few-shot Learning（少样本学习）

Few-shot 的核心是：不要告诉模型"怎么做"，而是直接展示"做好了的样子"。人类学习新技能也是这个逻辑——看几个例子比读一堆规则更高效。

3.1 Few-shot 文本分类

python
def few_shot_classification():
    """Few-shot 示例：用户意图分类"""

    prompt = """
请对用户输入进行意图分类，仅返回以下类别之一：
- PRODUCT_INQUIRY（产品咨询）
- COMPLAINT（投诉）
- TECH_SUPPORT（技术支持）
- OTHER（其他）

## 示例

用户输入：你们的旗舰款手机支持 5G 吗？
分类：PRODUCT_INQUIRY

用户输入：我上周买的耳机左声道没声音了，要求退货！
分类：COMPLAINT

用户输入：App 登录后一直白屏，重装了也不行
分类：TECH_SUPPORT

用户输入：你们公司总部在哪里？
分类：OTHER

## 待分类

用户输入：我刚更新了系统，蓝牙连不上了，之前一直正常的
分类："""

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.0,  # 分类任务用最低温度
        max_tokens=20,     # 限制输出长度
    )
    print(response.choices[0].message.content.strip())

few_shot_classification()

3.2 Few-shot 格式转换

python
def few_shot_format_conversion():
    """Few-shot 示例：将非结构化会议记录转为结构化 JSON"""

    prompt = """
将会议记录转换为结构化的 JSON 格式。

## 输入格式示例
"周三下午产品会议，张三说Q3要上线支付功能，李四表示后端需要2周开发时间，王五建议先出MVP版本。最终决定：先做MVP，8月15日上线。"

## 输出格式示例

{

"meeting_topic": "产品规划会议",

"date": null,

"participants": ["张三", "李四", "王五"],

"key_points": [

{"speaker": "张三", "point": "Q3上线支付功能"},

{"speaker": "李四", "point": "后端需要2周开发时间"},

{"speaker": "王五", "point": "建议先出MVP版本"}

"decision": "先做MVP，8月15日上线",

"action_items": []

}

bash

## 待转换输入
"周五站会，赵六报告用户反馈搜索太慢，需要优化。陈七说索引已经加了但还是慢，可能需要换Elasticsearch。老板说先评估成本，下周三前出方案。"
"""

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.0,
    )
    print(response.choices[0].message.content)

few_shot_format_conversion()

四、高级技巧三：System Prompt 设计

System Prompt 是你与模型之间的"操作系统层"——它定义了模型的行为准则，在所有对话中持续生效。好的 System Prompt 可以让模型的输出质量产生质的飞跃。

4.1 专业代码助手的 System Prompt

python
def system_prompt_code_assistant():
    """System Prompt 示例：专业代码助手"""

    system_prompt = """
你是一个专业的 Python 代码助手。请严格遵守以下规则：

## 身份
你是一名在大型互联网公司工作的资深 Python 工程师，精通 Django、FastAPI、asyncio、SQLAlchemy 等技术栈。

## 行为规则
1. 所有代码必须包含类型注解（type hints）
2. 所有函数必须包含 docstring（Google 风格）
3. 优先使用 Python 3.10+ 语法特性（如 match-case、ParamSpec）
4. 涉及异步操作时，必须正确使用 async/await
5. 不得使用已废弃的 API 或库
6. 给出代码时，同时提供至少一个使用示例

## 回答格式
- 先简要说明思路（2-3句话）
- 给出完整可运行的代码
- 标注代码中的关键设计决策

## 禁止事项
- 不要在代码中使用 print() 做调试，使用 logging
- 不要写 if __name__ == '__main__' 块，除非用户明确要求
- 不要省略 import 语句
"""

    user_prompt = "请实现一个通用的重试装饰器，支持自定义重试次数、间隔时间、异常类型过滤。"

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt},
        ],
        temperature=0.2,
    )
    print(response.choices[0].message.content)

system_prompt_code_assistant()

4.2 多轮对话中的 System Prompt 保持

System Prompt 在多轮对话中始终保持，不会被用户的输入覆盖：

python
def multi_turn_with_system_prompt():
    """多轮对话示例：System Prompt 贯穿始终"""

    system_prompt = """
你是一名技术文档写作专家。你的任务是将技术内容转化为清晰、专业、结构化的文档。
所有输出必须使用中文，技术术语保留英文原文。
"""

    conversation = [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": "请帮我写一段关于 Docker 容器网络模式的说明，包括 bridge、host、none 三种模式。"},
    ]

    # 第一轮
    response1 = client.chat.completions.create(
        model="gpt-4o", messages=conversation, temperature=0.3,
    )
    reply1 = response1.choices[0].message.content
    print("=== 第一轮回复 ===")
    print(reply1)

    # 第二轮：追加上下文继续对话
    conversation.append({"role": "assistant", "content": reply1})
    conversation.append({
        "role": "user",
        "content": "很好，请在以上内容基础上，增加一段关于 overlay 网络模式的说明，并补充各模式的适用场景对比表。",
    })

    response2 = client.chat.completions.create(
        model="gpt-4o", messages=conversation, temperature=0.3,
    )
    print("\n=== 第二轮回复 ===")
    print(response2.choices[0].message.content)

multi_turn_with_system_prompt()

五、实战案例：从 Prompt 到成品

5.1 实战案例一：自动化代码生成流水线

下面展示一个完整的 Prompt 驱动的代码生成器，将需求描述转化为可直接运行的 FastAPI 接口代码：

python
def code_generation_pipeline():
    """实战：Prompt 驱动的 FastAPI 接口代码生成"""

    system_prompt = """
你是一名 FastAPI 专家开发者。根据用户的需求描述，生成完整的 FastAPI 接口代码。

要求：
1. 使用 Pydantic v2 定义请求/响应模型
2. 包含完整的类型注解和 docstring
3. 包含合理的参数校验（如 email 格式、字符串长度）
4. 使用依赖注入模式处理数据库会话
5. 包含 HTTP 异常处理（404、422、500）
6. 代码可以直接复制到 FastAPI 项目中运行
"""

    user_prompt = """
需求：实现一个用户管理模块，包含以下接口：
1. POST /users - 创建用户（字段：username, email, password）
2. GET /users/{user_id} - 获取用户信息
3. PUT /users/{user_id} - 更新用户信息
4. DELETE /users/{user_id} - 删除用户

业务规则：
- username 3-20 个字符，仅允许字母数字下划线
- email 必须符合标准格式
- password 至少 8 位，包含大小写字母和数字
- 创建时检查 username 和 email 唯一性
"""

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt},
        ],
        temperature=0.1,
    )

    # 将生成的代码保存到文件
    generated_code = response.choices[0].message.content
    with open("/workspace/generated_fastapi_users.py", "w", encoding="utf-8") as f:
        f.write(generated_code)
    print("代码已生成并保存到 generated_fastapi_users.py")
    print(generated_code)

code_generation_pipeline()

5.2 实战案例二：结构化文档写作

python
def structured_document_writing():
    """实战：Prompt 驱动的 API 文档生成"""

    system_prompt = """
你是一名技术文档工程师，擅长编写清晰、专业的 API 文档。

文档规范：
- 使用中文撰写，API 路径和参数名保持英文
- 每个 API 包含：功能描述、请求方法、URL、请求参数表、响应示例、错误码说明
- 请求参数表包含：参数名、类型、必填、说明
- 响应示例使用真实的 JSON 结构
"""

    user_prompt = """
请为以下 FastAPI 接口编写 API 文档：

@router.post("/api/v1/orders", response_model=OrderResponse, status_code=201)

async def create_order(

order: OrderCreate,

current_user: User = Depends(get_current_user),

db: AsyncSession = Depends(get_db),

"""

创建订单

校验商品库存
计算价格（含折扣）
扣减库存
创建订单记录

"""

...

bash

其中 OrderCreate 模型包含：
- product_ids: list[int]（商品ID列表，1-10个）
- shipping_address: str（收货地址，5-200字符）
- coupon_code: str | None（优惠券码，可选）

OrderResponse 模型包含：
- order_id: str
- total_amount: float
- status: str
- created_at: datetime
"""

    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt},
        ],
        temperature=0.2,
    )
    print(response.choices[0].message.content)

structured_document_writing()

六、性能优化策略

6.1 Token 成本控制

Token 用量直接决定 API 调用成本。以下策略可以显著降低消耗：

python
def token_optimization():
    """Token 优化对比示例"""

    # ---- 低效写法：Prompt 冗长，重复信息 ----
    bad_prompt = """
    你是一个非常专业的人工智能助手，擅长各种编程语言和技术领域。
    请你帮我分析一下下面的这段代码有没有什么问题。
    如果有问题的话请告诉我具体是什么问题，以及应该如何修复。
    代码如下：def calc(a, b): return a/b
    """

    # ---- 高效写法：简洁精准 ----
    good_prompt = """
审查以下 Python 代码，指出 bug 并给出修复版本：

def calc(a, b):

return a / b

bash
"""

    # 使用 tiktoken 计算实际 token 数（需安装：pip install tiktoken）
    import tiktoken
    enc = tiktoken.encoding_for_model("gpt-4o")

    print(f"低效 Prompt token 数: {len(enc.encode(bad_prompt))}")
    print(f"高效 Prompt token 数: {len(enc.encode(good_prompt))}")

token_optimization()

6.2 缓存与复用策略

对于重复性任务，可以通过 Prompt 模板化减少重复编写：

python
from string import Template

# 定义可复用的 Prompt 模板
CODE_REVIEW_TEMPLATE = Template("""
审查以下 $language 代码，重点检查：
1. 安全漏洞（注入、XSS、敏感信息泄露）
2. 性能问题（N+1查询、内存泄漏、不必要的循环）
3. 错误处理（异常捕获是否合理、边界条件）
4. 代码可维护性（命名、职责单一、可测试性）

给出严重程度评级：[CRITICAL / HIGH / MEDIUM / LOW]

代码：

$code

bash
""")

def review_code(language: str, code: str):
    """复用模板进行代码审查"""
    prompt = CODE_REVIEW_TEMPLATE.substitute(language=language, code=code)
    response = client.chat.completions.create(
        model="gpt-4o",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.2,
    )
    return response.choices[0].message.content

6.3 模型选择策略

不同复杂度的任务应选择不同的模型，避免"杀鸡用牛刀"：

任务类型	推荐模型	temperature	原因
文本分类、意图识别	gpt-4o-mini	0.0	简单任务，低成本
代码审查、文档生成	gpt-4o	0.2	需要深度推理
创意写作、头脑风暴	gpt-4o	0.8	需要多样性输出
JSON 结构化提取	gpt-4o-mini	0.0	格式固定，成本敏感

七、常见问题 FAQ

Q1：Prompt 写得很详细，但模型总是忽略其中部分要求，怎么办？

A：这是常见的"注意力稀释"问题。当 Prompt 过长时，模型会降低对细节的关注度。解决方案：

将最重要的约束放在 Prompt 的开头和结尾（首因效应 + 近因效应）
使用 Markdown 标题、序号等结构化排版，增强层次感
对关键规则使用加粗或特殊符号标注
如果约束很多，考虑分多轮对话逐步提出

Q2：Few-shot 示例到底给几个最合适？

A：经验法则如下：

0-shot（不给示例）：适合模型已非常熟悉的通用任务（如翻译、总结）
1-3 shot：适合格式转换、分类、提取等结构化任务
5+ shot：适合领域专业性强的任务，但要注意 Token 成本
超过 8-10 个示例时，边际收益递减，且可能引发模型对示例模式的"过拟合"

Q3：temperature 应该怎么设？不同任务的最优值是多少？

A：temperature 控制输出的随机性，取值范围 0.0-2.0（实际使用建议 0.0-1.0）：

0.0：确定性最强的输出，适合分类、数据提取、代码生成
0.2-0.3：轻微变化，适合代码审查、文档写作、数据分析
0.5-0.7：中等创造性，适合邮件撰写、文案生成、方案设计
0.8-1.0：高创造性，适合头脑风暴、创意写作、故事生成

Q4：System Prompt 和 User Prompt 的分工应该怎么划分？

A：遵循"角色和规则放 System，具体任务放 User"原则：

System Prompt：角色设定、行为准则、输出格式规范、禁止事项（全局生效，相对固定）
User Prompt：具体的任务描述、输入数据、本次对话的特殊要求（每次不同）
好比公司的规章制度（System）和具体的工作任务（User），两者配合才能高效运转

Q5：如何评估 Prompt 的质量？有没有量化的方法？

A：可以从三个维度量化评估：

首次成功率：对同一类任务，Prompt 在第一次调用时就得到满意输出的比例。目标值应大于 80%
输出稳定性：同一 Prompt 多次调用（temperature > 0 时），输出质量的一致性。可通过交叉对比评分衡量
Token 效率比：有用信息量 / 总 Token 数。可以通过人工标注输出中的有效信息行数来估算

Q6：模型输出 JSON 格式时经常格式不规范，如何解决？

A：三种方案，按推荐程度排序：

使用 OpenAI 的 Structured Outputs（response_format={"type": "json_object"}），强制输出合法 JSON
在 Prompt 末尾加上 "请仅输出 JSON，不要包含任何其他文字"
结合 Few-shot 给出完整的 JSON 示例，让模型"照猫画虎"

python
# Structured Outputs 示例
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "分析这段文本的情感倾向：..."}],
    response_format={"type": "json_object"},  # 强制 JSON 输出
    temperature=0.0,
)

Q7：如何在生产环境中做好 Prompt 版本管理？

A：建议采用以下策略：

将 Prompt 存储在独立的配置文件或数据库中，不要硬编码在业务逻辑里
为每个 Prompt 版本打标签（如 code_review_v3）
记录每次 Prompt 变更的 diff 和对应的评估指标变化
A/B 测试：将用户流量按比例分配到不同 Prompt 版本，对比效果
回滚机制：发现新版本效果下降时，可快速切回上一版本

八、结语

Prompt Engineering 是一项兼具工程严谨性和创作灵活性的技能。回顾本文的核心要点：

结构化是基础：角色、任务、输入、格式、约束五要素缺一不可
CoT 提升推理：让模型"逐步思考"，尤其适用于复杂分析任务
Few-shot 加速对齐：用示例代替规则描述，让模型快速理解你的期望
System Prompt 定基调：全局行为准则一次设定，持续生效
成本意识不可缺：合理选择模型、控制 temperature、复用 Prompt 模板

好的 Prompt 不是一次性写成的，而是通过反复迭代、量化评估持续优化的结果。建议你将本文的代码示例直接运行起来，替换为你自己的业务场景，在实践中建立属于自己的 Prompt 模板库。

提示工程之路没有捷径，但有一套系统化的方法可以让你少走弯路。从今天开始，让你的每一个 Prompt 都有据可依、有迹可循。

本文首发于 1630.top，转载请注明出处。

标签：

#Prompt Engineering #AI #提示工程 #大模型