编辑
2025-04-29
技术杂谈
00
请注意,本文编写于 100 天前,最后修改于 100 天前,其中某些信息可能已经过时。

目录

发展历程
基于规则的机器翻译
基于实例的机器翻译
统计机器翻译

本文尝试梳理在前大模型时代的机器翻译实现

大部分来源于黄书剑老师的PPT.

发展历程

  • 规则机器翻译
  • 实例机器翻译
  • 统计机器翻译
  • 神经网络机器翻译
  • 多语言大模型

image.png

基于规则的机器翻译

  • 由语言学的专家进行规则制订,语言分析往往采用规则方式进行
  • 规则示例:
    • 我 => me(宾语); I(主语)
    • 汉语主谓宾结构->英语主谓宾结构
  • 最有影响力的例子为Georgetown–IBM experiment,将60个俄语句子翻译为英文. 论文链接

image.png

  • 南京大学日汉规则翻译系统

基于实例的机器翻译

  • 储存巨量的翻译实例,每次翻译时在存储中寻找接近的翻译实例,逐词替换完成翻译

  • 受到数据规模限制

  • 我 来自 南京 大学 <==> I come from Nanjing University

    我 来自 X ~ I come from X

    南京 大学 ~ Nanjing University

统计机器翻译

  • 很显然上述的两种机器翻译模式都不够“智能”
  • 未完待续。。。