Берите самую большую ruGPT-3 и самую большую T5. Обе в теории могут даже без дообучения генерировать то, что вам нужно. Либо руками размечаете примеры (500 штук будет достаточно) и дообучаете модель на этих данных или же используете 10-15 примеров как промт