Size: a a a

Инжиниринг Данных

2021 July 20
Инжиниринг Данных
Когда мы создаем аналитическое решение,  часто нам нужно сделать те или иные решения связанные с дизайном и архитектурой аналитического решения, вот ключевые моменты design decisions:
- Verbosity
- Latency
- Completeness
- Access Frequency
- Compliance  and Privacy
- Security
- Developer Efficiency
- Retention
- Cost
- Developer Satisfaction and End User Friendliness  

В процессе создания решения возникают следующие challenges:
- Documentations
- Scale
- SLA
- GDPR and Privacy
- Consistency
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Если в первый год жизни вы не начали изучать темы из книг на картинке, возможно уже поздно!🤣

Следующий этап - Neural Network для беременных и потом для Бабушек и Дедушек.
источник
Инжиниринг Данных
Я всегда говорил - надо 20-30 собеседований завалить, чтобы пройти одно заветное. И уж точно, компании мечты должны быть в конце списка, а не наоборот)) Если что, есть план Б - 80 собеседований провалить - я бы разделил на 40 собеседований в РФ, 20 в Украине и по 10 в Казахстане и Беларусии. И тогда будет вам счастья. Но это для СНГ. А вот для Европы и Северной Америке другая пропорция;)
источник
Инжиниринг Данных
Все так😔 Если вы не смотрели на Netflix - Social Dilemma, очень интересно про нашу зависимость к социальным сетямhttps://www.thesocialdilemma.com/
источник
Инжиниринг Данных
Переслано от Simon Osipov
источник
2021 July 21
Инжиниринг Данных
Протестировал разные кластеры в Databricks (Spark) для задачки с минимальными трансформациями - staging etl. Основная задача - писать в delta lake. Все совпадает с документацией - для простого ETL лучше подойдут маленькие кластера compute optimized. Заметил еще один + такой эластичной среды - для staging я могу использовать один тип кластера, для fact tables - другой, для BI будет 3й тип и для DS 4й. И платить за все это только за активное время работы кластеров. В модуле 7-8 вы сами увидите как это работает.
источник
Инжиниринг Данных
источник
Инжиниринг Данных
30 июля пройдёт Tableau User Group MoscowTableau User Group Moscow 🎉
Будут очень интересные доклады, советую послушать! Например, там выступит замечательней Виталий Ковалёв из нашей команды. Он расскажет как мы издеваемся над дашбордами, чтобы реализовать в них асинхронную загрузку визуализаций. 🤪

Жалко только, что всё опять онлайн, корона уходи! 😷
#ссылка
источник
2021 July 22
Инжиниринг Данных
От читателей я наслышал о проблемах с work life balanced, о нездоровой среде и рабочей атмосфере, где перерабатывать, сидеть по вечерам и выходным это нормально. Я хочу провести опрос и узнать насколь это касается вас или вашей компании.

Перерабатывать - это нормально, если это добровольно, если у нас мало опыта и у нас нет дома семьи, если у нас нет личных дел и личной жизни. Но часто бывает, что все это есть, но нам приходится сидеть на работе. Да еще и чувствовать себя виноватыми за то, что не успели.

Я до сих пор помню как в РФ компаниях на меня коллеги могли посмотреть косо, когда я уходил вовремя или раньше или как мне было не комфортно. Как я отвечал в 11 вечерам на письма коллег и менеджера и думал о том - какой же я молодец, заслужил "звездочку". Но по факту всем плевать и менеджеру и руководству.

За ошибки и проблемы планирования и приоритетов сверху приходится рассплачиваться вам. Если у вас такая среда, то у вас не компетентный менджменд и руководство.

Давайте наведем порядок в аналитических рядах (по возможности) и если у вас на работе беспредел, давай анонимно расскажем в телеграм канале о нем. Присылайте сообщение о вашей ситуации, названии компании и тп, обязательно опубликую и вынесу на обсуждение.

И давайте возьмем за правило - если мы не на on-call (это тех поддержка), нам не платят сверурочные, мы не изучаем новые концепции, то мы шлем все в баню, так как это нормально провести выходные с семьей и друзьями, отключиться от работы, набратиься сил и вдохновения.
источник
Инжиниринг Данных
Вы перерабатываете на работе?
Анонимный опрос
0%
Нет, у меня все ок с work life balance🥰
0%
Бывает, когда поджимает и горят сроки, приходится поднажать, и мне это нравится🤩
0%
У нас на работе все так работают, и это нормально. А что можно подругому?🙄
0%
Оффициалльно мы не должны перерабатывать, но это приветствуется негласно, посидеть и поработать😒
0%
Я уже перерос моменты, когда меня так могли эксплуатировать, я знаю себе цену😎
0%
Открытым текстом просят перерабатывать и часто стресс, что я не успеваю и надо больше работать🤯
0%
Я поднимал вопрос с менеджером, но мне намекнули либо так, либо досвидание😖
0%
Мне вообще побарабану, я сам на себя работаю😋
Проголосовало: 1121
источник
Инжиниринг Данных
источник
Инжиниринг Данных
Management Seat Time — Erika Pullum (Swartz) has a great piece about being a manager, and the concept of 'management seat time'. This isn't about data, per se — though Erika's Substack is filled with great data-related articles, and she cut her teeth managing a fairly large data team. This piece, though, is about the more general experiences of being a manager.

The thing is, reading about how to fire someone is different from doing it. It’s easy to read about the need for clear feedback and nod along, but hard not to soften feedback to someone you like at the moment you’re giving it. The impact of your decisions plays out over a longer timescale and it’s not always easy to see your own mistakes.
источник
Инжиниринг Данных
Одной вакансии уже недостаточно, минимум надо 2. Я например могу быть:
- Data Engineer или BI engineer (основной опыт)
- Преподаватель и ментор (опыт в datalearn и университете)
- Pre Sales Engineer (это что-то вроде демонстрации продукта и решения при продажах)
Но все эти вакансии практически об одном и том же - дата, а нужно наверно иметь совсем разные вещи - Аналитики и Плотник, Дата Инженер и инструктор по горным лыжам и тд.
источник
Инжиниринг Данных
Наш любимый slack был куплен SalesForce, надеюсь будет еще бесплатная версия работать. - Salesforce Closes $27.7 Billion Acquisition of Slack
источник
Инжиниринг Данных
источник
2021 July 23
Инжиниринг Данных
Отличная статья про сравнение менеджерского и инженерного пути. Мы часто думаем, что после старшего инженера/архитектора мы станем менеджером. Но это не так, это совершенная другой путь и требует других навыков.  https://charity.wtf/2017/05/11/the-engineer-manager-pendulum/
источник
2021 July 24
Инжиниринг Данных
Вы точно должны знать что такое lake house (data warehouse + data lake) - расскажу на модуле 6-8. https://databricks.com/blog/2021/05/06/rise-of-the-lakehouse.html
источник
2021 July 26
Инжиниринг Данных
💼 Ищем BI-аналитиков в Яндекс =)

🚕 BI-аналитик в Go целых 3 позиции
Ищем коллег, которые хотят работать на стыке аналитики и визуализации. Вашей задачей будет развивать отчётность одного из направлений: международного бизнеса, финансов или аналитики привлечения пользователей. Предстоит формировать стратегию развития отчётности для подразделения, собирать данные и делать классные отчёты. Больше всего задач именно про дашборды, но придется готовить и данные. Необходимо стать внутренним центром экспертизы по визуализации и Табло внутри команды аналитиков, а мы будем помогать вам советами и менторством.

Нужны классные навыки создания отчётов, сильный SQL и, как преимущество, Питон. Позиция уровня мидл. Описание на сайте.

Присылайте мне в личку CV и небольшой рассказ про себя.

📦 BI-аналитик в Маркет
Задач много, бизнес растет вширь и ввысь. Если не пугают слова e-com, dead stock, SQL optimization, логистическое плечо, UE и другие — СУПЕР!

У нас Tableau, но вы можете знать и другой инструмент, главное — активное понимание принципов и подходов визуальной аналитики и желание переучиться =) Надо будет делиться экспертизой и работать руками, думать продуктово и не бояться выражать свое мнение.

CV и вопросы по позиции присылайте Юре, тим-лиду BI в Маркете.

Условия
Все вакансии новые, мы расширяем наш BI-контур. Основная локация в Москве, но готовы обсудить и другие города. Зарплата обсуждается после интервью. В Яндексе классный соц. пакет, приятные коллеги, премии, опционы и просто интересно.

ТГ — @rbunin
Почта — rbunin@yandex-team.ru
#вакансия
источник
2021 July 27
Инжиниринг Данных
Архитектура и описание решения для создания управленческой отчётности в linkedin. Описание https://engineering.linkedin.com/blog/2021/from-daily-dashboards-to-enterprise-grade-data-pipelines
источник