для русского модель слабая, т.к. датасет очень маленький (кажется всего порядка 20к предложений), практического смысла использовать нет. да и даже для английского — ну ошибаемость на слово порядка 7%, если пытаться из такого какой-то логический вывод сделать — выведешь противоречие (а из него всё что угодно).