Size: a a a

Архитектура данных

2020 November 11

ДЛ

Дмитрий Лишманов... in Архитектура данных
В которой, в теории, можно заставить работать аналитиков, а не разработчиков
источник

ДЛ

Дмитрий Лишманов... in Архитектура данных
Это выводы из "поигрался". Как оно в реальной жизни - не скажу
источник

NN

Nikita N in Архитектура данных
ну да, было бы интересно про продакшен использование послушать)
источник
2020 November 14

e

er@essbase.ru in Архитектура данных
источник
2020 November 15

r

rubonz in Архитектура данных
Nikita N
кто-нибудь пользовался им?
В продакшене юзаем диноду.
источник

r

rubonz in Архитектура данных
Однако у нас не оч много юзкейсов с ней. В основном это забрать данные с реста и отдать данные рестом. На диноде это оч просто сделать.
источник

r

rubonz in Архитектура данных
Дмитрий Лишманов
Но, с другой стороны, если у тебя разнородные источники, то сделать общий view по ним, причём просто - это прям очень круто
Да, это в принципе основное, для чего виртуализация надо.
источник

CO

Chern Oleksander in Архитектура данных
Всем привет, а есть ли люди которые работает в фарм компаниях, есть точечный вопрос про введение строгой документации для регистрации продуктов
источник

LV

Leonid Vygovskiy in Архитектура данных
По denodo. Мы будем доклад по ним делать. Если пустим в публичную сферу, скину сюда.
источник

LV

Leonid Vygovskiy in Архитектура данных
И если есть какие-то вопросы по ней, пишите сюда или в личку. Попробую достать ответы.
источник
2020 November 16

e

er@essbase.ru in Архитектура данных
источник
2020 November 17

I

Ilya in Архитектура данных
Что именно интересует? Можем в пм пообщаться
источник
2020 November 18

e

er@essbase.ru in Архитектура данных
Danny Ma:.

-----

I'm a #DataScientist and I am SICK of buzzwords and popular catch phrases so I decided to translate them in simple terms.

Artificial Intelligence = linear regression & decision trees

Smart Algorithms = random forest

Next-Gen machine learning = boosted trees

AutoML = import autosklearn

Intelligent Automation = Windows scheduler, crontab

MLOps = docker

Analytics at scale = no more excel

Customer-centric data lake = we have customer_id in our database tables

Serverless Architecture = I have no idea what a server is

Cloud APIs = my dev-ops guy made me click some link

Advanced Analytics = SQL

DataViz Guru = library(ggplot2)

Data Consultant = often draws convenient conclusions from data

Advanced ML/DL = Python

Image Recognition = MNIST

NLP Experts = transfer learning on GTP-3/Bert

Reproducible experiments = jupyter notebooks

Maintain source code = git add . && git commit -m "yolo" && git push origin master

Distributed Analytics = no more MySQL on a laptop

Experimentation Framework = z-tests

Advanced Statistics = random control groups

Customer loyalty focus = we spam them with emails

Centre of Excellence = fancy team name to justify payrises

HR analytics = people leave, we didn't pay them enough

Do you agree? Did I miss anything?
источник

MV

Mitya Volodin in Архитектура данных
er@essbase.ru
Danny Ma:.

-----

I'm a #DataScientist and I am SICK of buzzwords and popular catch phrases so I decided to translate them in simple terms.

Artificial Intelligence = linear regression & decision trees

Smart Algorithms = random forest

Next-Gen machine learning = boosted trees

AutoML = import autosklearn

Intelligent Automation = Windows scheduler, crontab

MLOps = docker

Analytics at scale = no more excel

Customer-centric data lake = we have customer_id in our database tables

Serverless Architecture = I have no idea what a server is

Cloud APIs = my dev-ops guy made me click some link

Advanced Analytics = SQL

DataViz Guru = library(ggplot2)

Data Consultant = often draws convenient conclusions from data

Advanced ML/DL = Python

Image Recognition = MNIST

NLP Experts = transfer learning on GTP-3/Bert

Reproducible experiments = jupyter notebooks

Maintain source code = git add . && git commit -m "yolo" && git push origin master

Distributed Analytics = no more MySQL on a laptop

Experimentation Framework = z-tests

Advanced Statistics = random control groups

Customer loyalty focus = we spam them with emails

Centre of Excellence = fancy team name to justify payrises

HR analytics = people leave, we didn't pay them enough

Do you agree? Did I miss anything?
🤣 прикольно
источник

Н

Николай in Архитектура данных
er@essbase.ru
Danny Ma:.

-----

I'm a #DataScientist and I am SICK of buzzwords and popular catch phrases so I decided to translate them in simple terms.

Artificial Intelligence = linear regression & decision trees

Smart Algorithms = random forest

Next-Gen machine learning = boosted trees

AutoML = import autosklearn

Intelligent Automation = Windows scheduler, crontab

MLOps = docker

Analytics at scale = no more excel

Customer-centric data lake = we have customer_id in our database tables

Serverless Architecture = I have no idea what a server is

Cloud APIs = my dev-ops guy made me click some link

Advanced Analytics = SQL

DataViz Guru = library(ggplot2)

Data Consultant = often draws convenient conclusions from data

Advanced ML/DL = Python

Image Recognition = MNIST

NLP Experts = transfer learning on GTP-3/Bert

Reproducible experiments = jupyter notebooks

Maintain source code = git add . && git commit -m "yolo" && git push origin master

Distributed Analytics = no more MySQL on a laptop

Experimentation Framework = z-tests

Advanced Statistics = random control groups

Customer loyalty focus = we spam them with emails

Centre of Excellence = fancy team name to justify payrises

HR analytics = people leave, we didn't pay them enough

Do you agree? Did I miss anything?
Омг, он всех сдал :)
источник

MV

Mitya Volodin in Архитектура данных
Тут ещё не хватает

Data Lake - xls in hdfs instead of email 😅
источник

VK

Victoria Krasnova in Архитектура данных
Mitya Volodin
Тут ещё не хватает

Data Lake - xls in hdfs instead of email 😅
👍
источник

Н

Николай in Архитектура данных
Mitya Volodin
Тут ещё не хватает

Data Lake - xls in hdfs instead of email 😅
источник
2020 November 19

e

er@essbase.ru in Архитектура данных
Может кто порекомендует курсы по spark ? Или толковую книжку ?
источник

NN

No Name in Архитектура данных
er@essbase.ru
Может кто порекомендует курсы по spark ? Или толковую книжку ?
Пока лучше definitive guide, кажется, ничего не написали. Курсы в основном, на мой взгляд, УГ, но это если ищете что-то продвинутое. Для начального уровня почти любые подойдут. Правда, в основном они на питоне, на скале реже встречаются.
источник