Ок. Задачи NLP часто лежат близко к бизнес логике и являются высокоуровневыми. Есть исключения. Если речь идет о локальных (не международных или не многоязыковых) проектах, то домен описан скорее на местном языке, пускай это будет русский язык. Эксперты тоже говорят на русском.
Разработчики языков программирования не зря добавили фичу - возможности задавать идентификаторы в unicode. В масштабных проектах бизнес логику выносят в DSL, для реализации конструкций DSL выбирают язык на котором описана предметная область и говорят эксперты, чтобы не спотыкаться о кривой перевод туда-обратно (немец - половина дирижера).
Порог входа для новичков - почти нулевой. Родным языком все владеют.
1С прекрасный пример. Завоевал рынок и не имеет конкурентов. Постоянно меняющееся законодательство не дает остаться без хлеба и масла как разработчикам платформы, так и 1С-кодерам.
Практически во всех высокоуровневых продуктах, код которых я видел, разработчики скатывались до транслита в коде.
Пример, когда русские идентификаторы уместны: вы разрабатываете грамматику на Yargy для разбора таких фрагментов
Подпункт "е" пункта 26 статьи 1, пункты 11, 16, 17, 19, 20, подпункты "в" и "д" пункта 21, пункт 24, подпункт "а" пункта 25, пункты 26, 28, 29, 30, 31, 32, 35, 38, подпункт "б" пункта 46, абзац второй подпункта "а", подпункты "б" - "г" пункта 47, пункты 50, 51, 52, абзац второй подпункта "а", подпункты "б" - "г" пункта 53 статьи 2 и статья 3
Это реальная цитата. Помимо указанных структурных единиц есть еще с десяток разных типов. Изобретать clause subclause paragraph... о чорт, но ведь есть еще и настоящий параграф §
Там даже в русском слово "часть" может использоваться в двух значениях: как часть документа и как синоним пункта. Переводить на английский - это отстрелить себе ногу или даже что похуже.
Про OSS. Из тысяч NLP проектов в открытый доступ выкладывают единицы. Я вот из отечественных вспомню только Томиту, Ярги, Наташу, Mystem и Pymorphy. Все эти проекты так или иначе используют особенности русского языка и я не уверен, что у них очень много не русскоязычных пользователей. Конечно плох тот солдат, который не мечтает стать генералом или хотя бы не мечтает, чтобы его проект попался на глаза рекрутеру из Америки или на худой конец из Европы, но тут скорее уместно "подойди поближе". Есть в программировании такое понятие "преждевременная оптимизация", так вот писать комментарии, сообщения к коммитам и документацию на английском при старте локального проекта, когда команда по английски хорошо только читает, ИМХО неправильно. Если вдруг вы или ваш босс захочет международной славы, то проще отрефакторить код.
Если кандидат услышав про использование русского языка в коде убежит с выпученными глазами, вместо того чтобы задать вопрос "почему", то туда ему и дорога.
В общем, русские (испанские, исландские) идентификаторы в коде это инструмент, которым можно и нужно пользоваться, когда это уместно.
P.S. Еще вангуют, что приходит эпоха low-code, no-code решений, а в них если и будет использоваться язык, то скорее всего национальный и возможно те кто сейчас воротит нос от 1С, лет через 5 будут писать код на русском 🥳