Ребята, всем привет!
Порекомендуйте плез ресурсы для самостоятельного изучения DE.
Имею опыт разработки ETL тулзов на python, NLP задачами(web-scrapping, preprocessing, labeling и тд.), знаю data analysis toolkit( pandas, dask, numpy и тд.), знаю SQL (могу писать ad-hoc и немного проектировать).
Как я понял, для работы надо знать овер-много всяких big data фреймворков(Spark, Hadoop..) + облака.
Также на каждую позицию есть свой specific technology stack. Есть ли какой-то стандарт по технологиям по тому, что должен знать jun+, middle- ?
Спасибо заранее)
перечисленный опыт кажется больше подходит для вакансии data science, ML. Я бы выбрала несколько интересных позиции (например, в питон вакансиях есть требования для ds, cv engineer, da) и подогнала бы свои знания по требованиям вакансии.
Стек по DE совсем другой.