Используя только GPL они уже шли по офигенно тонкому льду. Могут ли они так нейросетку использовать — вопрос открытый, т.к. прецедентов еще толком не было.
А когда ты перемешиваешь все лицензии наплевательски, то тут >95% они нарушили чью-то лицензию, даже если "в научных целях". Например, лицензия может сказать что ты обязан кредитовать авторов кода, даже если использовал в научных целях. Или должен сначала спросить разрешения перед использованием кода. Условий может быть куча