OpenNMT 2.0.0rc1 使用手册
最近在用OpenNMT训练机器翻译模型。OpenNMT 全称 Open-Source Neural Machine Translation,是https://nlp.seas.harvard.edu/ 和SYSTRAN 共同开发的适用于机器翻译的集成库(现在由SYSTRAN和 Ubiqus 维护)。
OpenNMT有两个版本,分别为依赖PyTorch 和TensorFlow的。从使用人数上来说,PyTorch用的人多得多,更新的速度也快一点,所以就选了OpenNMT-py 的版本。据说Academia的趋势也是PyTorch增多,考虑复用的话PyTorch是你的好朋友 :p
不得不说,OpenNMT开发得确实快,版本更新也快,眼睁睁看着它两个月更新一个版本,也是挺6。但这也导致文档update的速度跟不上开发的速度 🐶
所以本文记录下从头训练一个NMT的pipeline,也记录一些useful 的七七八八。