Size: a a a

Инжиниринг Данных

2020 May 20
Инжиниринг Данных
Увидел сегодня в посте - BI для бедных🙃 Вы не пробовали?  https://airtable.com/
источник
2020 May 21
Инжиниринг Данных
Ещё одна сторона миграции решения в облако для решения Hadoop типа.
источник
Инжиниринг Данных
Написал про Self-Service Analytics + BI Survey. Согласен, старо как мир, но я нашел на гугл диске, когда-то я это написал для какого-то журнала и они не захотели брать.
источник
Инжиниринг Данных
Пример Data Vault. DV - это техника модели данных хранилищ данных.  https://www.vertabelo.com/blog/data-vault-series-data-vault-2-0-modeling-basics/
источник
Инжиниринг Данных
Продолжение про аналитику, то есть заключительная часть про определение аналитики https://www.youtube.com/watch?v=80zFSlm9w0w
источник
Инжиниринг Данных
Котятки🐱
Сегодня у нас фундаменталочка из 7 глав по дизайну и проектированию дашборда.
В ней, помимо очевидных вещей, есть прикольная классификация пользователей (не по принципу пирамиды Минто, а по принципу характера потребления информации), расширенный экскурс в прототипирование и подборочка трендов.
Линк:
https://www.logianalytics.com/dashboarddesignguide/
источник
Инжиниринг Данных
Теперь и mail.ru запустил бесплатную школу по ML, DataScience, Data engineering. Конечно если вы прошли экзамен по математике и программированию и все в этом духе. Правильно я понимаю позицию российских тех гигантов - если ты был ботаном хорошо учился и не забыл матан, то тогда у тебя есть шанс пройти долгий курс и потом устроиться на достаточно не высокую ЗП? То есть компании, хотят отобрать лучших (по их мнению) кандидатов и им впринципе плевать на большинство.

Кстати какие ЗП в mail, если не секрет? Раньше я слышал, что не очень высокие🥴
источник
Инжиниринг Данных
Недавно я писал про "Написать книгу про Snowflake", желающих не нашлось, да и с курсом время все туда уходит. Теперь вот еще предложили книгу про Azure Data Factory. Кстати все студенты проходят сюрвей, и там интересный вопрос "город в котором, хотели жить", и больше половины хотят иммигрировать. Что-бы иммигрировать и потом еще найти работу, нужно не только скилы и бизнес кейсы применения скилов (результат работы аналитики и польза от данных - именно про это я рассказываю в первом модуле DE - 101).  Но еще нужны активы (блог, книга, конференции..) Если написать книга, то вы будете как автор на амзоне, а это killer штука к вашему резюме. Так что есть еще один вариантик;) (я кстати однажды писал 2 книги одновременно, но это было перед Канадой, я был заряжен на успех!)
источник
2020 May 22
Инжиниринг Данных
Слышали вы про Sales Force Einstein Analytics? В прошлом году Sales Force купил Tableau, соответственно продукты стали интегрироваться. Изначально Einstein это был внутренний BI для платформу SalesForce, теперь замиксовали. Я сам не смотрел.  Если кому интересно (вы в теме и работаете с SF), то вот запись вебинара: https://salesforce.vidyard.com/watch/mYZSEwVcfCPNWhVCQvgTi5 а тут можно учиться
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Интересная у меня лента в google pixel, все новости про , российские компании. Вот про Яндекс.
источник
Инжиниринг Данных
Прислали про data vault на русском
источник
Инжиниринг Данных
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Кстати из интересного, пока все бегут работать в Data Scientists, в Амазон data scientists переходят в SDE. Вчера мне менеджер ответила на очередной крик душу про повышение зарплаты - чувак становись SDE, там больше платят. 🤦‍♂️ Поэтому варианта 2:
1) Быть близко к бинесу, насколько это вообще возможно
2) Быть крутым программистом с Computer Science degree

А если не 1 и не 2, то уже приходиться изобретать. По моим наблюдениям в Северной Америке в среднем на вакансию откликается 50-100 человек, то есть тут уже даже проблема, не в том, чтобы пройти собеседование, а как его вообще на него попасть. Так же, чтобы не говорили про diversity, это работает не так хорошо.

Получается, все старо как мир, нужны личные знакомства.
источник
Инжиниринг Данных
Прикольная штука https://airflow101.python-jitsu.club/ курс по Airflow! Я бы записался, но знаю точно, что не пройду до конца, и потеряю 5к, поэтому не запишусь. На нашем ресурсе datalearn мы тоже затронем Airflow, но без углубления.

Airflow - это такой популярный open source инструмент для интеграции данных (в народе ETL).

Кстати в Amazon его используют, недавно нашел команду, кто от него отказывается, типа сложно поддерживать
источник
Инжиниринг Данных
Тут про роли https://youtu.be/5OkCvQOF3Wg
источник
Инжиниринг Данных
Это прям нереально круто! Есть такой же кейс в Амазон, я даже встречал его в аэропорте Сиэтла. Я считаю это очень важная тема. Например в Северной Америке, люди живут полной жизнью, а в России с этим сложно.

Современные технологии позволяют работать удаленно и эффективно. COVID19 показал, что это уже и не так важно быть в офисе. Для data learn одной из идей, мы хотели бы помогать людям, действительно кому нужна помощь, мы может обучать профессия BI разработчик, дана инженер, аналитик. Для этого нужно несколько составляющих:
1)нуджно донести информацию для желающих (я пытался писать в группах вконтакте и даже написал в одну организацию, никакого отклика)
2)помогать усваивать материал силами сообщество, которое уже есть
3)работадателям меня их мировоззрение и брать на работу людей с disabilities.

Если кто-то знает как быть с 1 и 3, было бы здорово сделать пилотный проект.
источник
2020 May 23
Инжиниринг Данных
Автор сравнивает облачное и традиционное DW, ETL и ETL. Как я понял автор из AWS. И перевел white paper panoply (даже не слышал про такое).
источник
Инжиниринг Данных
Обязательно подпишитесь на youtube 🤗https://www.youtube.com/watch?v=Ei21wxKKCMI
источник