Size: a a a

2017 April 27

PK

Pavel Klemenkov in Data Engineers
источник
2017 April 28

PK

Pavel Klemenkov in Data Engineers
🔝Ivan Popovich 🔝
они против scala, печаль 😔
Мы не против Скалы. Я сам её изучаю, мне нравится. Дело в том, что у нас эксперименты в прод тащат те, кто их делает. Поэтому на Питоше и удобней и разработка быстрей.
источник

F

Farruh in Data Engineers
Кроме фейсбука, еще где нибудь можно трансляцую посмотреть?
источник

🔝P

🔝Ivan Popovich 🔝 in Data Engineers
Pavel Klemenkov
Мы не против Скалы. Я сам её изучаю, мне нравится. Дело в том, что у нас эксперименты в прод тащат те, кто их делает. Поэтому на Питоше и удобней и разработка быстрей.
Если отбросить предубеждения, то в вашем кейсе действительно питон более лучший выбор
источник

PK

Pavel Klemenkov in Data Engineers
Запись есть, выложим.
источник

NK

ID:1373407 in Data Engineers
Pavel Klemenkov
Запись есть, выложим.
источник

F

Farruh in Data Engineers
Pavel Klemenkov
Запись есть, выложим.
Будем ждать, спасибо!
источник

NK

ID:1373407 in Data Engineers
думал  увижу  у вас в докладе рассказ про эту штуку)
источник

NK

ID:1373407 in Data Engineers
Друзья, всем привет! Нам поступает много вопросов о том, где можно посмотреть запись вчерашнего митапа, отвечаем, здесь - https://www.facebook.com/afishamansarda/videos/1537521079605272/ Просмотр видео доступен и для незарегистрированных пользователей. Презентации мы тоже обязательно выложим чуть позже в общих доступ и напишем вам про это.
источник

VM

Victor Mikhaylov in Data Engineers
👍
источник

NK

ID:1373407 in Data Engineers
Презентации - https://www.slideshare.net/RamblerML
Бенчмарк популярных библиотек машинного обучения на датасете Criteo - https://git.io/v9sNz
источник
2017 May 03

NK

ID:1373407 in Data Engineers
При работе с паркетом из спарка, есть какой-нибудь вменяемый способ избегать файлов которые хайв не убрал за собой ( стейджинг и прочее) ? Имел кто-нибудь опыт?
источник

t

tenKe in Data Engineers
ага
источник

t

tenKe in Data Engineers
кроном чисти старые файлы
источник

t

tenKe in Data Engineers
можно без остановки джобы
источник

MB

Maxim Borschev in Data Engineers
Начинаю поиск специалиста на позицию Data Engineer с переездом на Кипр, Лимасол, крупная финтех-компания.
Условия обсуждаю в личке, в skype: borschevm Резюме просьба скидывать на почту: maxim.goodjob@gmail.com,

Задачи:
- интеграция источников данных с хранилищем Hadoop
- разработка ELT-процедур
- проектирование архитектуры хранения и обработки данных
- подготовка, очистка, обеспечение качества данных
- визуализация данных
- разработка production-решений на основе готовых прототипов
- исследование новых технологий и инструментов работы с данными

Обязательные требования:
- опыт разработки приложений в экосистеме Hadoop от 2 лет
- глубокое понимание моделей распределённых вычислений
- опыт разработки на Java от 3 лет
- опыт работы с Linux
- опыт работы с реляционными СУБД (мы работаем с PostgreSQL)
- понимание алгоритмов и структур данных
- опыт разработки высоконагруженных систем

Будет плюсом:
- опыт программирования на Python, Erlang, PHP
- опыт решения задач с использованием машинного обучения
- интерес к функциональному программированию
- опыт работы с NoSQL базами данных (ClickHouse)

#вакансия #dataengineer #hadoop #postgre #linux #cyprus
источник

NK

ID:1373407 in Data Engineers
Maxim Borschev
Начинаю поиск специалиста на позицию Data Engineer с переездом на Кипр, Лимасол, крупная финтех-компания.
Условия обсуждаю в личке, в skype: borschevm Резюме просьба скидывать на почту: maxim.goodjob@gmail.com,

Задачи:
- интеграция источников данных с хранилищем Hadoop
- разработка ELT-процедур
- проектирование архитектуры хранения и обработки данных
- подготовка, очистка, обеспечение качества данных
- визуализация данных
- разработка production-решений на основе готовых прототипов
- исследование новых технологий и инструментов работы с данными

Обязательные требования:
- опыт разработки приложений в экосистеме Hadoop от 2 лет
- глубокое понимание моделей распределённых вычислений
- опыт разработки на Java от 3 лет
- опыт работы с Linux
- опыт работы с реляционными СУБД (мы работаем с PostgreSQL)
- понимание алгоритмов и структур данных
- опыт разработки высоконагруженных систем

Будет плюсом:
- опыт программирования на Python, Erlang, PHP
- опыт решения задач с использованием машинного обучения
- интерес к функциональному программированию
- опыт работы с NoSQL базами данных (ClickHouse)

#вакансия #dataengineer #hadoop #postgre #linux #cyprus
о, кликхаус входу, вы с вертикой его сравнивали?
источник

MB

Maxim Borschev in Data Engineers
да
источник

MB

Maxim Borschev in Data Engineers
В итоге его выбрали.
источник

PK

Pavel Klemenkov in Data Engineers
Не удивиительно, вертика же бешенные миллионы стоит
источник