вопрос . реальная бигдата это :
1. умение вертеть большой датасет от 100гб который не поместица в пандас\юпитер
2. умение админить инфраструктуру для хранения большого датасета - поднять кластер если упал, выгружать \загружать датасет на кластер? инфраструктура - map reduce, hadoop?
3. а сам анализ ,обучение , тренька моделей ничем не отличаеца по идее?
что я упустил?