Size: a a a

Инжиниринг Данных

2021 May 10
Инжиниринг Данных
И Power BI тоже добавил новую фичу, для нее хоть можно найти применение. https://marqueeinsights.com/power-bi-goals-introduction-part-1/
источник
2021 May 11
Инжиниринг Данных
источник
Инжиниринг Данных
На фотки студии Microsoft/Xbox. Я уже познакомился с командами аналитики в половине студий. Ну и все игры поиграл. Недавно ещё заказал новый Xbox Series S, и купил у коллеги руль с педалями Logitech G920. Осталось найти время поиграть, но детям нравится моя новая работа🤙
источник
2021 May 12
Инжиниринг Данных
источник
Инжиниринг Данных
13 мая Steve Wexler расскажет про свою новую (несомневаюсь - крутейшую) книгу - The Big Picture. Регистрация https://us02web.zoom.us/webinar/register/WN_M0CIUP6dSAaL7XDfmpI9UA
источник
Инжиниринг Данных
Есть ещё одна лаба, которую я хочу сделать. 6й модуль будет про аналитические хранилища данных. И Терадата это одна из первых MPP платформ. В лабе я хочу, скачать готовую VM с Терадата, запустить её в VMware, загрузить туда данные через Pentaho (с локальной машины), то есть опять нужно настроить сеть, чтобы локальный и VM были вместе. (У меня есть инструкция). А дальше можно позапускать запросы, чтобы посмотреть на разные фичи MPP базы, которые будут так же актуальны и для AWS Redshift. В общем, если, кто хочет заморочиться, чтобы сделать и описать все в markdown, пишите в комментариях.
источник
2021 May 13
Инжиниринг Данных
Кто-нибудь читал новую книгу на русском? Я кусочек прочитал на хабр, читается легко. https://habr.com/ru/company/piter/blog/556962/
источник
Инжиниринг Данных
Согласно github, datalearn 10 мая был 1 год!
источник
Инжиниринг Данных
А вот Xbox и Halo отмечают 20 лет. Кто-нибудь владел первым Xbox?https://youtu.be/_P4eVUkm4Ow
источник
2021 May 14
Инжиниринг Данных
Урок 5.4 Основы безопасности облачных решений.

Безопасность одна из самых важных и скучных тем, по крайней мере для меня. Очень важно понимать возможности облачных провайдеров и знать основные правила создания облачных решений.  В этом уроке я расскажу про:

📌   Cloud Shared Responsibility Model (Модель общей ответственности в облаке)
📌   Security Terms (Термины безопасности)
📌   Cloud Security Threats (Облачные угрозы безопасности)
📌   Cloud Security Mechanisms

На лабораторной работе мы посмотрим примеры сервисов для безопасности облачных решения и воспользуемся AWS CLI.
источник
Инжиниринг Данных
Ребята в процессе создания лабораторных работ для модуля 5. Уже готовы:

Запуск экземпляра EC2 в частном виртуальном облаке (Virtual Private Cloud - VPC)
В этом практическом занятии у вас будет возможность изучить и понять фундаментальные и вычислительные сервисы, предоставляемые AWS. Мы создадим частное виртуальное облако (Virtual Private Cloud - VPC), подсети в нескольких зонах доступности (Availability Zones - AZs), маршруты (routes) и интернет-шлюз (internet gateway), а также добавим группу безопасности. Эти сервисы являются основой сетевой архитектуры внутри AWS и охватывают такие концепции, как инфраструктура, дизайн, маршрутизация и безопасность.
Автор: @erfolg5862

Создаем статичный веб-сайт на Amazon S3
В этой лабораторной работе мы с вами создадим простой статичный веб-сайт и зададим базовые настройки его конфигурации. Этот пример продемонстрирует, как легко можно создать хостинг для веб-сайта, который будет содержать файлы: HTML, CSS, JavaScript, шрифты и изображения.
автор: @edgar_lakshin

Создаем лямбда функцию в AWS Console
В этом практическом лабораторном сценарии вы напишете лямбда-функцию Node.js, которая проверяет URL-адрес (например, www.amazon.com) и возвращает код состояния, который показывает, работает ли веб-сайт или нет. Во время этой лабораторной работы у вас будет возможность изучить консоль Lambda, код функции, роли выполнения, тестовые события и результаты выполнения. AWS Lambda позволяет писать краткие функции и беспокоиться только о своем коде. Поскольку Lambda является бессерверной, AWS управляет базовой инфраструктурой за вас.www.amazon.com) и возвращает код состояния, который показывает, работает ли веб-сайт или нет. Во время этой лабораторной работы у вас будет возможность изучить консоль Lambda, код функции, роли выполнения, тестовые события и результаты выполнения. AWS Lambda позволяет писать краткие функции и беспокоиться только о своем коде. Поскольку Lambda является бессерверной, AWS управляет базовой инфраструктурой за вас.
Автор: @AlexMadeAnotherOne

И в процессе еще много лабораторных работ по модулю 5, 6 (облачные DW), и 8(big data в облаке).

Хотите, что-то выучить? Лучший вариант это учить других;) Можете тоже добавить лабораторную работу.
источник
Инжиниринг Данных
как же знакомо…🤣
источник
Инжиниринг Данных
Материалы “Cheat Sheet” по подготовки к сертификации по Google Cloud Platform. https://www.startcloudnow.com/google%20cloud.html
источник
2021 May 16
Инжиниринг Данных
Azure Synapse Analytics Playbook
источник
Инжиниринг Данных
IoT аналитика всегда интересна. Примеры решений на Azure Databricks (Spark). IoT проект включает в себя:
- создание Delta Lake (3 слоя Bronze, Silver, Gold)
- создание streaming pipelines
- дашборды на Power BI

Part 1
Part 2
Part 3
источник
Инжиниринг Данных
источник
Инжиниринг Данных
источник
Инжиниринг Данных
источник
Инжиниринг Данных
источник
Инжиниринг Данных
GDPR и Privacy - вызов для дата инжиниринга. Тут нужно либо потратить много времени для дизайна будущей системы, чтобы она отвечала всем требованиям, либо потратить ещё больше времени на модификацию существующей.

NY times рассказывает про свой случай.

В Амазоне я застал время до и после законов GDPR. В один прекрасный момент все наши озера данных (данный в S3 в виде файлов), стали вдруг не complaint. Решение было:
1) перезагружать все данные каждые 90 дней
2) хранить только последние 30 дней
3) хранить только в базе данных Redshift
4)Delta Lake на EMR+Spark

Все вдруг стали очень занятыми и у нас появилось много новой работы))
источник