Size: a a a

2021 February 01

D

Dmitry in Data Engineers
Mi
- Scala не критична, но скорее всего так или иначе надо будет с ней сталкиваться, читать, либо учиться писать. Много где ищут джавистов с целью их посадить на скалу.
- Количество программирования зависит от того что ты под этим подразумеваешь и зависит от проекта. Я бы сказал меньше процентов на 30 максимум (если вообще меньше)
Спасибо! Просто в веб-разработке с devops техниками сталкиваешься не так часто, а для дата инженера это значительный объем функционала. Я правильно понимаю? Насколько нужно сильно знать Kafka, Hive, Hadoop? Достаточно ли хорошо разобраться со Spark, чтобы можно было войти в эту специализацию?
источник

D

Dmitry in Data Engineers
Oleg אולג
Мне кажется джависту не так долго учить скалу, если не вдаваться
Я учу где-то с прошлого сентября. Правда, сначала пришлось разбираться немного с теорией ФП / Haskell, а потом углубляться в Scala. Не самый простой язык, конечно, и намного сложнее, чем Java, и тем более Python. Но и мощнее, и более выразительный в плане ФП.
источник

D

Dima in Data Engineers
Всем привет
Возникла проблема с добавлением листа диктов в биг квери, подскажите как это можно сделать без костылей? и можно ли вообще, если можно -то подскажите в какую сторону смотреть
схема таблицы:
   schema = [
           bigquery.SchemaField('field', 'INTEGER', mode='NULLABLE'),
           bigquery.SchemaField('another_field', 'RECORD', mode='NULLABLE', fields = [
               bigquery.SchemaField('key', 'STRING', mode='NULLABLE'),
               bigquery.SchemaField('value', 'INTEGER', mode='NULLABLE')])
       ]
мапа, которую не могу добавить:
{ 'field': 3,
'another_field': [{'key': 'smth1', 'value': 3},
 {'key': 'smth2', 'value': 3},
 {'key': 'smth3', 'value': 3},
 {'key': 'smth4', 'value': 3},
]}
источник

DZ

Dmitry Zuev in Data Engineers
Dima
Всем привет
Возникла проблема с добавлением листа диктов в биг квери, подскажите как это можно сделать без костылей? и можно ли вообще, если можно -то подскажите в какую сторону смотреть
схема таблицы:
   schema = [
           bigquery.SchemaField('field', 'INTEGER', mode='NULLABLE'),
           bigquery.SchemaField('another_field', 'RECORD', mode='NULLABLE', fields = [
               bigquery.SchemaField('key', 'STRING', mode='NULLABLE'),
               bigquery.SchemaField('value', 'INTEGER', mode='NULLABLE')])
       ]
мапа, которую не могу добавить:
{ 'field': 3,
'another_field': [{'key': 'smth1', 'value': 3},
 {'key': 'smth2', 'value': 3},
 {'key': 'smth3', 'value': 3},
 {'key': 'smth4', 'value': 3},
]}
Так не рекорд а repeatable[record]
источник

D

Dima in Data Engineers
Dmitry Zuev
Так не рекорд а repeatable[record]
спасибо
источник

AE

Anastasiya Esiunina in Data Engineers
Иван Калининский
Час это многовато, я видел, партиции по часам (ааааа!!) за пару лет несколько часов обновлялись, но отработали

После этого случая я пробовал перевести на параллельное выполнение alter table add/drop partition (scala/Spark), на больших объёмах было примерно до полутора раз быстрее, но функция заметно сложнее, чем msck repair, на который можно положиться в любом случае, поэтому не стал заморачиваться и удалил эту ветку. Внутреннюю реализацию msck repair не менял, не видел, не знаю
тоже не стала замарачиваться. минута ушла на добавление партиций ....спасибо
источник

T

T in Data Engineers
Anastasiya Esiunina
подскажите, кто-нибудь, как-нибудь тюнил msck repair table в hive? час висит, партиции по дням за 4 года, не знаю много ли это..
У меня было такое с glue в итоге переписал на add partition
источник

ПФ

Паша Финкельштейн... in Data Engineers
Oleg אולג
Мне кажется джависту не так долго учить скалу, если не вдаваться
Прости, а почему у тебя тут ник Олег Олег?
источник

Oleg אולג in Data Engineers
Паша Финкельштейн
Прости, а почему у тебя тут ник Олег Олег?
Лама лё :)
источник

ПФ

Паша Финкельштейн... in Data Engineers
Но блин, можно было просто Oleg написать же )))
источник
2021 February 02

GP

Grigory Pomadchin in Data Engineers
Паша Финкельштейн
Но блин, можно было просто Oleg написать же )))
😄 чо ты у сюткина не просишь пояснить за ник?
источник

Oleg אולג in Data Engineers
Вон у человека выше вообще Т ник
источник

GP

Grigory Pomadchin in Data Engineers
+
источник

ПФ

Паша Финкельштейн... in Data Engineers
Извините. Я просто только начинаю читать на иврите и мне он теперь всюду в глаза бросается
источник

Oleg אולג in Data Engineers
Паша Финкельштейн
Извините. Я просто только начинаю читать на иврите и мне он теперь всюду в глаза бросается
Раньше было просто на иврите, но не все понимали. А просто Oleg скучно )
источник

T

T in Data Engineers
Oleg אולג
Вон у человека выше вообще Т ник
Потому что я дженерик 😂
источник

ВА

Ветеран Андреич... in Data Engineers
T
Потому что я дженерик 😂
А ну скажи в рантайме кто ты
источник

GP

Grigory Pomadchin in Data Engineers
Ветеран Андреич
А ну скажи в рантайме кто ты
Object
источник

T

T in Data Engineers
Эх опередил
источник

R

Renarde in Data Engineers
источник