День добрый, вопрос из школьной комбинаторики.
«Допустим, Вы хотите строить матрицу признаков с помощью TF-IDF на биграммах токенов (N-граммах с N=2). Оцените наибольшее количество уникальных биграмм в словаре для достаточно большой коллекции. Предполагайте, что в текстах используется 1000 уникальных токенов»
Решал как (1000!/(1000-2)! * 2!) * 2!. Получается 999000. Подскажите, где я тут напортачил :/