Size: a a a

Инжиниринг Данных

2020 June 21
Инжиниринг Данных
Вот это интересно, stackoverflow позволяет искать remote jobs, вот пример data engineer https://stackoverflow.com/jobs?id=380126&q=data+engineer&r=true
источник
Инжиниринг Данных
В datalearn мы говорили про 3nf в качестве модели данных. А какие бывают форму и в чем различия? https://habr.com/ru/post/254773/
источник
Инжиниринг Данных
Нашел свои заметку про требования к кандидатам DW/ETL/BI  в 2014. Не считая облака, мало что изменилось с тех пор.
источник
2020 June 22
Инжиниринг Данных
Ещё одна статья про сравнение озера данных и хранилища
источник
Инжиниринг Данных
AWS SageMaker - фреймворк для Machine Learning и Data Science. Или уже не модно использовать data science)). А вот курс End to end SageMaker Workshop на гитхаб https://github.com/data-science-on-aws/workshop
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Авторы курсы из AWS еще и книгу написали. https://www.oreilly.com/library/view/data-science-on/9781492079385/
источник
Инжиниринг Данных
Последние пол года я пытался записаться на курсы по SageMaker, но все не было места. Мы даже его используем для Alexa Churn модели. И так получилось что я записался на Machine Learning Accelerator (3 дня курс) и параллельно с этим попал на курс по SageMaker в тоже время. Начальника сказала нельзя учиться, надо работать, пришлось взять отпуск. Будет контент для модуля 12 datalearn. Кто-то использует SageMaker на работе?
источник
Инжиниринг Данных
источник
2020 June 23
Инжиниринг Данных
Сегодня я задался вопросом в чем разница между массивом и dataframe в python. https://towardsdatascience.com/python-list-numpy-and-pandas-3a32f1aee948
источник
Инжиниринг Данных
Еще я придумал новый термин - HR Казино. Это когда вам предлагают сыграть в игру, типа останься и "может быть" мы повысим зарплату, точнее спросим у HR. А HR работает как казино, всегда в выигрыше, а вы в проигрыше. Поэтому я не стал с ними играть, а это значит с хайпом Alexa можно подождать. Alexa это пересечение NLU (Natural Language Understanding), AI, ML и Software Engineering. Оказалось, что рынок не так уж благосклонен к голосовым ассистентам, так как это относительно новая категория продуктов и все навыки часто очень специфичны.

Вместо платформы качества Alexa, которая кстати назваться должна была Спутник (это слово понравилось даже топам Алекса👌🏻). Я буду заниматься более приземленными вещами, где тоже надо построить платформу, но уже больше свободы. Маркетологи, трепещите😆 "The Customer Behavior Analytics team is building a big data platform to provide machine learning based solutions to measure and optimize marketing experiences. The next generation of our marketing analytics solutions will go beyond the transaction a customer makes to help us understands what customers think about our products and services. We will develop an array of solutions that create and consume data which measures and predicts customer perceptions. The platform and measurement services will be consumed across brands and page owners. "

Самое интересное, что ко мне пришла девочка, которой я помогал в 2016 году с базовыми вещами SQL/Tableau. А теперь она начальник Science команды, где строят модели для атрибуции элементов Amazon и все, что с этим связано. Так что, очень важно всем помогать, не знаешь, что будет в будущем.
источник
Инжиниринг Данных
Согласны с цифрами? https://habr.com/ru/company/new_hr/blog/507538/
источник
2020 June 24
Инжиниринг Данных
Америку "колбасит", продлили запрет на визу H1B.  Именно за счет иммигрантов в Америке собираются таланты со всему мира и создают великие компании.
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Бельгийская компания Datylon, прославившаяся своим [платным] плагином для Adobe Illustator, зарелизила бесплатный онлайн-сервис для создания графиков!
Из плюсов - наличие большого количества настроек, таблицы в виде тепловой карты, вафельного графика и бесплатного экспорта в svg!

Кажется, стоит попробовать: https://insights.datylon.com/stories

Чтобы пользоваться, в сервисе нужно зарегистрироваться.
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Многие слышали про Redash? Это такое приложение, как BI иснтрумент, где все завязано на SQL запросах + элементы визуализации. Очень популярен в амазон, позволяет работать с клиентскими данными (красные данные), и позволяет создать единый интерфейс с SQL для хранилища данных (Redshift) и озера данных (Athena/Spectrum). Используем open source.

Так вот его приобрел Databricks. Наверно будет крутая платформа. https://blog.redash.io/redash-joins-databricks/
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Вот это подгончик от Амазон scientists - они написали книгу по Deep Learning и опубликовали с примерами и кодом http://d2l.ai/
источник
Инжиниринг Данных
Повлиял COVID19 на вашу работу?
Анонимный опрос
6%
Я потерял работу и сейчас в поиске
4%
Я потерял работу и нашел новую
4%
Я потерял работу и решил переквалифицироваться в другую профессию
12%
Появилось больше работы/заказов
57%
Меня это не затронуло
17%
Мою зарплату урезали на X%
Проголосовало: 549
источник