Size: a a a

Инжиниринг Данных

2019 November 02
Инжиниринг Данных
Супер современное решение
источник
Инжиниринг Данных
50 книг для data science, бесплатно
источник
Инжиниринг Данных
Не нужно боятся роботизации, а вот алгоритмы, которые автоматизируют человеческий труд, это все они!
источник
Инжиниринг Данных
Если вы работает с результатами опросов, эта методичка может быть вам полезна.
источник
2019 November 03
Инжиниринг Данных
Сравнение классических аналитических MPP хранилищ данных. Даже цену за ТБ указали. Опубликовано в 2015 году! Сколько всего изменилось. В это время я первый раз попробовал Redshift и использовал его для маркетингового аналитики (с маркетингом тоже в первый раз работал, модель атрибуции, мобильные приложения и много прочего)
источник
Инжиниринг Данных
Безопасность данных это очень важно. Особенно, если вы используете данные персональные данные personally identifiable information (PII). По умолчания в Amazon Redshift нет встроенной функциональности для маскировки данных. В этой статье описано решение для и использование стороннего продукта для безопасности персональных данных personally identifiable information (PII) https://aws.amazon.com/blogs/big-data/protect-and-audit-pii-data-in-amazon-redshift-with-datasunrise-security/ Есть и другой вариант использовать hash и python UDF функции, чтобы обезличить ваши данные.
источник
2019 November 04
Инжиниринг Данных
источник
2019 November 05
Инжиниринг Данных
Azure сегодня презентовала новый продукт - Azure Synapse Analytics. В общем они решили очевидную проблему, объединили озеро данных Azure Data Lake и хранилище данных Azure SQL Data Warehouse. Все для нашего удобства. https://news.microsoft.com/innovation-stories/ignite-2019-azure-synapse
источник
Инжиниринг Данных
источник
Инжиниринг Данных
В Японии Data Science нет так популярно, как Arificial Intelligence
источник
2019 November 06
Инжиниринг Данных
Бизнес Amazon, это без учета дочерних предприятий, таких как IMDB, Abebooks. Очень интересно узнать как делать с данными и аналитикой обстоят в Solar и Wind Farm
источник
Инжиниринг Данных
источник
Инжиниринг Данных
источник
2019 November 07
Инжиниринг Данных
Сегодня выступал в школе, у них была ярмарка вакансий и я рассказывал про работу в Amazon и Alexa, взял даже сына (ему 7 лет), он показывал как он взаимодойствует с Alexa. 2 счастливчиков выиграли новые устройства, которых еще нет в Канаде. Сын пропустил школу, но явно узнал много нового и теперь сидит рисуют Alexa разные устройства, я его кстати везде беру на все мероприятия, это такое у нас детский MBA:)
источник
Инжиниринг Данных
В Штатах говорят про сильный спад Hadoop: Цитата CEO Snowflake "Slootman:  "I've never seen something crater as fast as Hadoop in all my years in the business. We see whole companies like Cloudera, MapR just falling off a damn cliff. We haven't seen that in technology, it's usually a gradual decline. This is rapid decline."

И правда, Snowflake в себе совмещает озеро данных и хранилище. В Azure есть DataBricks (Spark) вместо HDInsight (Hadoop), в AWS есть Athena, Spectrum, Glue (with Spark), которое можно использовать вместо Elastic Map Reduce (Hadoop), и так же и в Google Cloud Platform. До этого я  писал, что компания Datameer, тоже уходит от Hadoop как основы своего продукта.

Поэтому хорошо знать, что такое Hadoop и основные принципы, но лучше детально изучать Spark.
источник
Инжиниринг Данных
А говорят, что китайцы все копируют))
источник
2019 November 08
Инжиниринг Данных
Всем привет, Валерий (@HardKorr) ведет в Москве несколько митапов, в том числе Moscow School of Business Analysis. Так как скоро я буду в Москве, хотелось собрать митап по аналитике и облакам, где я хотел выступить, заодно про Канаду рассказать и про эмиграцию, работу в Амазоне и тп. И только Валерий согласился все организовать, за что ему большое спасибо!

Так что, если 20 Ноября будете свободны, приходите! Обязательная регистрация.
источник
Инжиниринг Данных
Работаете с данными? Одна из самых популярных библиотек в Python  это Pandas.  В приложении ebook про Pandas. Так же это поможет освоить PySpark.
источник
2019 November 09
Инжиниринг Данных
Linkedin это отличный инструмент маркетинга и самопиара. Как говорится, встречают по одежке, вом вам примеры, сегодня попались:

Enabling Large Enterprises to Unlock Innovation through Cloud Computing
Partnering To Unlock The Power Of Your Data
I help leaders and teams define and accelerate their journey from now to next.
Empowering HR professionals to transform their business through better people decisions
Driving and managing apocalyptic transformation
"Talent wins games, but teamwork and intelligence win championships." Michael Jordan
We help unlock the potential of your business, through financial insights, strategy
Helping Customers Unlock their Data Assets
Driving sustainable, value based infrastructure planning and decision making.
Helping my clients Select, Deploy and Manage Technology
Helping enterprise organizations to increase collaboration
Enabling Data Driven Organizations
Solving the issues of modern day analytics
Helping businesses become data-driven.
Working with the Enterprise to address data challenges that yesterday’s technology cannot solve.
Enabling every organization to be data driven...let's talk!
Creating more profitable streams of revenue through modern day analytics

Выбирайте любой! Уверен есть и русские аналоги, и еще много английский вариантов, мне последний понравился.
источник
Инжиниринг Данных
Google BigQuery - воркшоп, на котором можно узнать основы BigQuery и Облачного Хранилища данных.
источник