оч круто, наверное, но если что — яндексовские данные (миллион которые) очень грязненькие (мы на них немного перевод гоняли, я на данные смотрела, много вопросов к ним). в идеале б мб даже более каноничные датасеты WMT и около получше подошли для тренировки, наверное (но это я так, рассуждаю)
пинг
@cointegrated