C# или Java? TypeScript или JavaScript? Классификация языков программирования на основе машинного обучения.
На GitHub представлено больше 300 языков программирования, начиная с общеизвестных языков, таких как Python, Java, и Javascript, и заканчивая эзотерическими языками, такими как Befunge, известными только малым группам людей. Одна из проблем, с которой сталкивается GitHub — распознавание разных языков программирования. С целью сделать определение языка более четким в долгосрочной перспективе был разработан классификатор с машинным обучением, названный OctoLingua. Он создан на основе архитектуры Artificial Neural Network (ANN), которая может справиться с предсказанием языка в нетривиальных сценариях.
Подробности:
http://msft.it/6270TzweY