“机器翻译”是一个描述非常不同技术的术语。Google Translate在2010年所做的事情与现代LLM所做的事情有着根本的区别。理解这种差异很重要:网站翻译的质量直接影响转化率和搜索排名。
第一代:统计机器翻译 (SMT)
统计机器翻译基于平行语料库工作:系统分析已翻译的文档,并选择每个单词或短语在统计上最可能的翻译。
结果:翻译机械化,失去上下文,产生典型的“机器式”表达。正是关于SMT,人们开玩笑说,翻译后的文本需要解读。
自2016-2017年以来,SMT实际上已不再用于商业系统。
第二代:神经网络机器翻译 (NMT)
神经机器翻译处理文本的方式不同:它不是逐字处理,而是将整个文本作为一个整体,并考虑上下文。
与SMT相比的关键改进:
- 单词不再孤立翻译——而是考虑整个句子的上下文
- 习语和固定表达处理得更准确
- 文本的自然度显著提高
- 语气和风格保留得更好
Google Translate于2016年转向NMT。DeepL最初就是作为NMT引擎构建的,并在很长一段时间内保持了质量领先地位。
对于大多数文本,NMT都能提供可接受的结果——技术描述、产品卡片、标准内容。
第三代:LLM翻译
大型语言模型(GPT-4、Claude、Gemini)并非专业的翻译器,但其Transformer架构为复杂文本带来了质的飞跃。
LLM 的优势所在:
- 营销文本。 德语中的“免费试用”并非直译,而是对母语使用者而言具有号召力的措辞。LLM 理解任务,而不仅仅是翻译单词。
- 文化适应。 称呼、语气、正式程度——不同语言有不同的规范。LLM 会根据目标文化进行调整。
- SEO 文本。 不同语言中的关键词并非直译。LLM 可以有机地嵌入所需的查询。
- 品牌语境。 可以传递品牌语调、术语、禁用措辞——LLM 会将其考虑在内。
LLM冗余的场景: 技术规范、标准描述、重复内容——在这些方面,NMT能以更快的速度和更低的成本提供足够的质量。
对网站的实际意义
- 产品卡片、技术描述: NMT就足够了
- 营销文本、标题、CTA: LLM或母语人士的强制校对
- 法律文本、隐私政策: 仅限专业翻译
- SEO内容: LLM,考虑搜索查询和结构
- 博客和文章: LLM + 编辑修订
为什么这在选择工具时很重要
许多自动网站翻译工具使用Google Translate API或DeepL——这些是NMT,它们足以满足基本内容的需求。如果工具描述中只写着“AI翻译”而没有具体说明,那通常也是NMT。
当结果很重要时,差异就出现了:营销文本、CTA、独特描述。正是在这里,LLM方法提供了显著的优势。
