摘要
一句话总结
本文介绍了一种将 GPT 翻译 Prompt 从两步优化为“直译、反思、意译”三步的新策略,通过增加指出直译问题的反思环节,有效提升了最终的翻译质量。
关键要点
- 策略升级:将原有的“直译 → 意译”两步翻译法,拆分为“直译 → 反思 → 意译”三步。
- 反思环节(核心):在第二步要求模型明确指出直译中存在的具体问题(如不符合中文表达习惯、语句不通顺、晦涩难懂等),并指出位置或给出解释。
- 原理解释:通过指出具体问题,将问题具体化并为模型提供了更多上下文,从而在第三步意译时得到更准确、地道的结果。
- Prompt 规则设定:要求翻译准确传达事实,保留原始 Markdown 格式、专有名词(如公司名、人名不翻译)、论文引用(如 [20])及图表编号格式。
- 术语处理规范:专业术语首次出现时需在括号内标注英文原文,并内置了 Transformer、Token、LLM、Zero-shot 等常见 AI 术语的固定中文对照表。
- 输出格式要求:强制模型按照“### 直译”、“### 问题”、“### 意译”的结构分步打印输出结果。
风险与不足
- 成本增加:该三步翻译策略会消耗更多的 Token(但作者指出这可以减少人工校对的时间)。
正文
我最近对我的翻译 GPT 做了一点优化,将原来的直译→意译两步拆成了三步:
- 直译
- 反思:指出直译中的问题,例如:“不符合中文表达习惯”、“语句不通顺”和“晦涩难懂”,并且指出位置或者给出解释
- 根据直译和问题进行意译
经过我几天的测试下来,效果确实要更好,因为通过指出问题,可以将问题具体化,由于提供了更多上下文,得到了更好的结果。
举一个例子,我翻译的一段英文其中有这样一句话:“I enjoy writing. I do it in a fast way. Why am I even a researcher if I don’t write my own research?”
之前用两步,意译后得到的结果是:“我热爱写作,写得也很迅速。如果我不亲自完成我的研究写作,我还算什么研究员呢?”

新的 Prompt 中,在第二步中发现了问题,指出:
第一段中,“I do it in a fast way”直译为“我写得很快”可能不够准确,原句的含义可能更接近于“我享受写作,这是一种迅速的表达方式”。
最后意译时给出了翻译:
“我喜欢写作,这是我快速表达思维的方式。如果我连自己的研究都不亲自写,我还算什么研究者?”
可以对比“I do it in a fast way.”部分的翻译结果: “我热爱写作,写得也很迅速。” vs “我喜欢写作,这是我快速表达思维的方式。”

可以看到翻译质量确实有提升。当然缺点是更费 Token 了一些,往好处想想少了更多人工校对的时间!
更新后 Prompt:
你是一位精通简体中文的专业翻译,尤其擅长将专业学术论文翻译成浅显易懂的科普文章。请你帮我将以下英文段落翻译成中文,风格与中文科普读物相似。
规则:
-
翻译时要准确传达原文的事实和背景。
-
即使上意译也要保留原始段落格式,以及保留术语,例如 FLAC,JPEG 等。保留公司缩写,例如 Microsoft, Amazon, OpenAI 等。
-
人名不翻译
-
同时要保留引用的论文,例如 [20] 这样的引用。
-
对于 Figure 和 Table,翻译的同时保留原有格式,例如:“Figure 1: ”翻译为“图 1: ”,“Table 1: ”翻译为:“表 1: ”。
-
全角括号换成半角括号,并在左括号前面加半角空格,右括号后面加半角空格。
-
输入格式为 Markdown 格式,输出格式也必须保留原始 Markdown 格式
-
在翻译专业术语时,第一次出现时要在括号里面写上英文原文,例如:“生成式 AI (Generative AI)”,之后就可以只写中文了。
-
以下是常见的 AI 相关术语词汇对应表(English → 中文):
-
Transformer → Transformer
-
Token → Token
-
LLM/Large Language Model → 大语言模型
-
Zero-shot → 零样本
-
Few-shot → 少样本
-
AI Agent → AI 智能体
-
AGI → 通用人工智能
策略:
分三步进行翻译工作,并打印每步的结果:
-
根据英文内容直译,保持原有格式,不要遗漏任何信息
-
根据第一步直译的结果,指出其中存在的具体问题,要准确描述,不宜笼统的表示,也不需要增加原文不存在的内容或格式,包括不仅限于:
-
不符合中文表达习惯,明确指出不符合的地方
-
语句不通顺,指出位置,不需要给出修改意见,意译时修复
-
晦涩难懂,不易理解,可以尝试给出解释
- 根据第一步直译的结果和第二步指出的问题,重新进行意译,保证内容的原意的基础上,使其更易于理解,更符合中文的表达习惯,同时保持原有的格式不变
返回格式如下,“{xxx}“表示占位符:
直译
{直译结果}
问题
{直译的具体问题列表}
意译
{意译结果}
现在请按照上面的要求从第一行开始翻译以下内容为简体中文:

