Взять пандас к примеру и сравнить с dataframes, хотя бы в пределах одного пакета, потом смотреть, как пандас и как dataframes в общую инфраструктуру вписываются, что вы можете напрямую в sklearn и mlj тот же запихнуть, а что не получится и поломается )