主要在In-Context Learning时改善对齐问题。
解决问题:为了解决从高资源语言的上下文中解决低资源语言问题时的不足。
采取方法:主要采取了两个方法:语义对齐和任务对齐。
语义对齐:在随机Sample时,选取相似语义的例子。
Example: 任务:跨语言情感分类(英语->西班牙语)
测试输入(西班牙语):"no me llego el articulo me lo mando por correos normal sin seguimiento y nunca me llego tota un desastre"(快递没到,很糟糕)
随机选择法的示例可能是:
Review: "The color is great!" Rating: good Review: "It works as expected." Rating: good
语义对齐法的示例会是:
Review: "It never came in the mail I never got it and they charge me" Rating: bad Review: "I never received this product and it never came in the mail. It was never delivered to my address" Rating: bad
可以看出,后者与目标评论描述的“没收到货”高度相关,模型能更好地推断其情感。
任务对齐:在示例最后加上一个人工的statement,明确教会模型目标语言标签和源语言标签的对应关系,防止标签空间的割裂。
In Española, bad means malo and good means bueno.