Ребята, всем привет!
Порекомендуйте плез ресурсы для самостоятельного изучения DE.
Имею опыт разработки ETL тулзов на python, NLP задачами(web-scrapping, preprocessing, labeling и тд.), знаю data analysis toolkit( pandas, dask, numpy и тд.), знаю SQL (могу писать ad-hoc и немного проектировать).
Как я понял, для работы надо знать овер-много всяких big data фреймворков(Spark, Hadoop..) + облака.
Также на каждую позицию есть свой specific technology stack. Есть ли какой-то стандарт по технологиям по тому, что должен знать jun+, middle- ?
Спасибо заранее)