Телеграмм чат группы hadoopusers страница 3231

каждый иквалз проверяете?

Иван Калининский... in Data Engineers

19:37пожаловаться #1

ИК

@limon0v

Иван Калининский... in Data Engineers

19:38пожаловаться #2

ИК

Переслано от Renarde

кроме шуток, мне кажется что люди начисто перестали пользоваться возможностями pet-project.

Вот идея - реализуйте чтение стрима изменений на википедии с задержкой не более 2 минут.
Данные сложите в s3-like систему, для стриминга - spark structured streaming, стрим написать на Scala.
Далее реализуйте следующий стрим, который читает данные из s3-like хранилки, и отправляет текст в rapid API для определения positive/negative intent. После определения интентов, запишите count-статистику в ClickHouse и настройте витринку поверх (скажем, на SuperSet) для визуалиации результатов.

19:38пожаловаться #3

честно говоря не понимаю откуда такой наезд

19:38пожаловаться #4

почему код на скале не надо ревьюить

19:38пожаловаться #5

Переслано от Alexey Evdokimov

вообще никому не нужное говно

19:38пожаловаться #6

Переслано от Alexey Evdokimov

х его з кто их и зачем будет юзать. из коллег мне пока никто внятно не пояснил на куя оно вообще

19:38пожаловаться #7

Переслано от Alexey Evdokimov

из других энтерпрайзщиков я имею в виду

19:38пожаловаться #8

почему для кода на скале не надо писать интеграционные тесты

19:38пожаловаться #9

ну потому что как минимум вы получаете правильно описаную модель, для которой реализован иквалз, хешкод

19:39пожаловаться #10

и операции примитивы , с которыми работает спарк в виде аттернматчинга

19:39пожаловаться #11

короче бесполезная какая-то полемика. я реально не понимаю такую зацикленность на скале

19:40пожаловаться #12

а далее, автовывод кодеков на все про все , что не допусукает человечсеской ошибки при изменении модели

19:40пожаловаться #13

Alexey Evdokimov

короче бесполезная какая-то полемика. я реально не понимаю такую зацикленность на скале

да причем тут скала, вам рекорды и в джаве не нужны судя по вашим комментариям

19:41пожаловаться #14

ну и то что больше кода - больше ошибок )

19:41пожаловаться #15

у нас модели, сделанной чьими-то руками, нет. и схемы данных нет, она на лету генерится из дефинишена процесса

19:41пожаловаться #16

нечему ломаться

19:42пожаловаться #17

ну это у вас просто тест не валится интеграционный

19:42пожаловаться #18

Anton Zadorozhniy in Data Engineers

Alexey Evdokimov

короче бесполезная какая-то полемика. я реально не понимаю такую зацикленность на скале

вы стримсы или дженерики используете в яве, или пишете строго на 1.4 совместимой? вот возможности скалы по сравнению с джавой это как дженерики на стероидах

19:42пожаловаться #19

Anton Zadorozhniy

я что спорю. не всем оно нужно. неужели так трудно понять?