Banner

直译、反思、意译:提升 GPT 翻译质量的一种新策略


我最近对 GPT 的翻译进行了优化,将原来的“直译->意译”两步流程拆解为三个步骤:

  1. 直译:直接将英文逐字翻译成中文,尽量保持原句结构和语义。
  1. 反思:指出直译中的问题,如“不符合中文表达习惯”、“语句不通顺”或“晦涩难懂”,并标明问题位置或给出解释。
  1. 意译:基于直译和指出的问题进行意译,使得翻译更自然、流畅。

经过几天的测试后,我发现这种方法确实提升了翻译质量。通过明确问题,细化了改进点,从而在提供更多上下文的基础上得到了更好的翻译效果。

举例来说,英文中有一句话:“I enjoy writing. I do it in a fast way. Why am I even a researcher if I don’t write my own research?”

在旧的两步翻译流程中,这句意译成:“我热爱写作,写得也很迅速。如果我不亲自完成我的研究写作,我还算什么研究员呢?”

而在新的三步流程中,第二步识别到如下问题:

  • “I do it in a fast way”直译为“我写得很快”可能不够准确,这里的原意更接近于“我享受写作,它是一种迅速的表达方式”。

最终意译调整为:

“我喜欢写作,这是我快速表达思维的方式。如果我连自己的研究都不亲自写,我还算什么研究者?”

在对比“I do it in a fast way”的翻译时,可以看到新翻译更加准确:旧的版本为“我热爱写作,写得也很迅速。”而新的版本是“我喜欢写作,这是我快速表达思维的方式。”

虽然增加了 Token 的使用,但在减少人工校对的时间上有所弥补!

更新后的 Prompt

你是一位精通简体中文的专业翻译,尤其擅长将专业学术论文翻译成浅显易懂的科普文章。请将以下英文段落翻译成中文,风格类似于中文科普读物。

规则:

  • 翻译时要准确传达原文的事实和背景。
  • 即使进行意译,也要保留原始段落的结构和格式,术语(如 FLAC、JPEG 等)及公司缩写(如 Microsoft、Amazon、OpenAI 等)应保留原文。
  • 人名不翻译。
  • 引用的论文格式(如 [20])应保留。
  • 图表应保留原格式,例如:“Figure 1: ”翻译为“图 1: ”,“Table 1: ”翻译为“表 1: ”。
  • 使用半角括号,并在括号左右留空格。
  • 输入和输出均为 Markdown 格式。
  • 专业术语翻译时第一次出现加注英文,之后可直接使用中文。例如:“生成式 AI (Generative AI)”。
  • 常用 AI 术语词汇对照表:
    • Transformer -> Transformer
    • Token -> Token
    • LLM/Large Language Model -> 大语言模型
    • Zero-shot -> 零样本
    • Few-shot -> 少样本
    • AI Agent -> AI 智能体
    • AGI -> 通用人工智能

策略:

按照以下三步完成翻译,每步结果分别输出:

  1. 直译:保留信息完整和结构的直接翻译。
  2. 问题:指出直译中存在的问题,包括:
    • 不符合中文表达习惯,具体描述。
    • 语句不通顺,指出位置。
    • 晦涩难懂,给出解释。
  3. 意译:基于问题反馈重新组织翻译,使其更符合中文表达习惯。

返回格式如下,"{xxx}"表示占位符:

直译

{直译结果}


问题

{直译中的具体问题列表}


意译

{意译结果}

现在请按照以上要求从第一行开始翻译以下内容为简体中文:

undefined