ну с одной стороны да, но с другой стороны были же даже исследования, показывающие, что размерности w2v, в общем, понятно, за что отвечают. То есть они не совсем случайные, как минимум часть из них, а семантические
И тот факт, что мы можем получить синонимы/антонимы -- это тоже указатель на то, что дистрибутивные модели ловят семантические свойства.
Да, я не спорю, что она частичная и неполная, но она все-таки что-то "знает" про семантику. Имхо, утверждать, что это вообще не семантика -- слишком сильно -- скажем, словарь НОСС под редакцией Апресяна много чего пишет именно про сочетаемостные свойства слов, в том числе выделенные автоматически.
Ну, классически много где другие вещи имеются в виду :), но да, у семантики с этим и вправду больше всего проблем. Что логично -- тут больше всего проблем с формализацией