生成型大型语言模型(LLM)在各种NLP任务中取得了显著的进步。在这项工作中,我们的目标是通过使用机器翻译作为涉及英语和22种印度语言的任务来探索大型语言模型的多语言能力。我们首先研究了原始大型语言模型的翻译能力,然后探索了相同原始模型的上下文学习能力。我们使用参数有效的微调方法(如LoRA)对这些大型语言模型进行微调,此外还使用完全微调。通过我们的研究,我们已经为涉及LLM的翻译任务确定了性能最好的大型语言模型,该模型基于LLaMA。

评论