Size: a a a

2020 March 20

M

Mi in Data Engineers
Но не скажу что я прям кровь из носа пытался
источник

M

Mi in Data Engineers
Хотелось более оптимально копировать данные темповые из hdfs в s3
источник

M

Mi in Data Engineers
Потому что иногда s3 не справлялся из-за количества файлов
источник

GP

Grigory Pomadchin in Data Engineers
а ты в рамках джобы какотйо или как? в плане зачем ее из кода вызывать это же cli утилитка
источник

M

Mi in Data Engineers
Grigory Pomadchin
а ты в рамках джобы какотйо или как? в плане зачем ее из кода вызывать это же cli утилитка
В рамках джобы написанной на джаве
источник

DZ

Dmitry Zaytsev in Data Engineers
Ilgiz Akhmedzhanov
Со всех источников трубят, мол: "Все на удалёнку, что делать на удалёнке, как организовать работу 100000 сотрудников на удалёнке" и т.д.
А что, серьёзно компании начали людей из офисов выводить? (я студентик, я не знаю)
Наша тоже, уже почти
источник

G

George in Data Engineers
Grigory Pomadchin
в джобс с этим лучше переместись)
а можно ссылку?)
источник

ММ

Мария Морозова in Data Engineers
В моем Московском офисе с 16 марта всем "офисным" сотрудникам очень рекомендовали перейти на удаленную работу из дома. Разрешили даже взять домой рабочий комп. Некоторые перешли. С малейшими признаками заболевания в офис сказали однозначно не появляться.
источник

DM

Daniel Matveev in Data Engineers
Мария Морозова
В моем Московском офисе с 16 марта всем "офисным" сотрудникам очень рекомендовали перейти на удаленную работу из дома. Разрешили даже взять домой рабочий комп. Некоторые перешли. С малейшими признаками заболевания в офис сказали однозначно не появляться.
с этим можно и в джобсах
источник

DM

Daniel Matveev in Data Engineers
давайте останемся здесь при технических обсуждениях (те кто выживут)
источник

IA

Ilgiz Akhmedzhanov in Data Engineers
Data jobs
Data Engineers related вакансии и обсуждение
Фид: https://t.me/datajobschannel
Для связи: @krivdathetriewe @pomadchin @optician_owl
https://t.me/datajobs
источник

GP

Grigory Pomadchin in Data Engineers
George
а можно ссылку?)
см описание; там набор ссылок, возможно полезный, есть) @datajobs
источник

A

Aleksandr in Data Engineers
Привет. Проблема следующая - читаю спарком csv и записываю в паркет. В csv есть некоторые колонки, которые содержат пробелы в названии колонки, а паркет ломается, при попытке записать это. Как с этим бороться?
источник

РП

Роман Пашкевич in Data Engineers
На правах офтопа. Оторвать руки тем кто делает названия колонок с пробелами.
источник

РП

Роман Пашкевич in Data Engineers
Имхо, надо как то заменить пробелы на например "_"
источник

MV

Mitya Volodin in Data Engineers
Aleksandr
Привет. Проблема следующая - читаю спарком csv и записываю в паркет. В csv есть некоторые колонки, которые содержат пробелы в названии колонки, а паркет ломается, при попытке записать это. Как с этим бороться?
Игнорировать названия колонок, читать отдельно header и обрабатывать, потом читать тело.
Либо всё делать вместе - как удобней
источник

OI

Oleg Ilinsky in Data Engineers
Роман Пашкевич
На правах офтопа. Оторвать руки тем кто делает названия колонок с пробелами.
ну можно туда ещё спецсимволы добавлять) тоже веслый результат получается
источник

OI

Oleg Ilinsky in Data Engineers
источник

MV

Mitya Volodin in Data Engineers
Роман Пашкевич
На правах офтопа. Оторвать руки тем кто делает названия колонок с пробелами.
Да такого полно. С качеством данных почти никогда идеально не бывает
источник

MV

Mitya Volodin in Data Engineers
Это ещё спасибо что без кириллицы
источник