第265回自然言語処理研究発表会, Sep. 22, 2025
第265回自然言語処理研究発表会 (NL265)
大規模言語モデルの発展により自然言語処理タスクの性能は飛躍的に向上したが、翻訳タスクに特化したモデルの最適化は依然として課題である。本研究では、日本語・英語の翻訳タスクに特化した大規模言語モデル「plamo-2-translate」を提案する。提案モデルは、専用フォーマットによる入出力制御、対訳コーパスと合成データによる追加学習、Iterative DPOによる最適化を組み合わせることで、流暢かつ文脈に適した翻訳を実現する。評価実験では、BLEU、chrF、BERTScore、COMET、GEMBA-MQMなどの複数の指標において、ベースモデルや他のLLMと同等以上の性能を達成し、特に人間評価と相関の高いGEMBA-MQMにおいて顕著な改善を示した。さらに、文体指定や文脈保持などの機能により、多様な翻訳ニーズに対応する。本研究で開発したモデルはHuggingfaceで公開されている。
@inproceedings{Imajo2025-nl265,
title={{PLaMo Translate: 翻訳特化大規模言語モデルの開発}},
author={今城, 健太郎 and 平野, 正徳 and 野沢, 健人 and 中鉢, 魁三郎},
booktitle={第265回自然言語処理研究発表会},
url={https://ipsj.ixsq.nii.ac.jp/records/2004363},
year={2025}
}