Size: a a a

2019 December 06

ЕГ

Евгений Глотов in Data Engineers
Dmitry P
Всем привет. Вопрос по SparkSQL. А можно ли при чтении некоторого кол-ва json'ов в датафрейм сделать так чтобы датафрейм содержал только те поля, которые указаны в схеме? Хочется отбросить ненужное.
просто заселектить то, что нужно - спарк вычитывает джисон как датафрейм структур, в которые могут быть вложены структуры, дальше "select поле.уточнение1.уточнение2 as то_что_нужно" в помощь
источник

AT

Andrei Tupitcyn in Data Engineers
Dmitry P
Всем привет. Вопрос по SparkSQL. А можно ли при чтении некоторого кол-ва json'ов в датафрейм сделать так чтобы датафрейм содержал только те поля, которые указаны в схеме? Хочется отбросить ненужное.
что мешает spark.read.json(path).select(field1) ... ?
источник

DP

Dmitry P in Data Engineers
Все гениальное просто) Спасибо за наводку ребят)
источник

AP

Anton Pilipenko in Data Engineers
Dmitry Zuev
ну что, вышло с нью тайпами?
Ну я как бэ скала не оч знаю - читаю что вы с Гришей намутили и медленно охреневаю =) так что если ответить на вопрос - нет не получилось. Надо читать и осознавать :) но спасибо. Правда
источник

GP

Grigory Pomadchin in Data Engineers
Dmitry Zuev
Ааа, я думал шейплезевый завел
они генерируют макросами просто коершены для каждого типа; например ты создал ньютайп
и он сразу получает кучу преобразований типа Repr => Ops; F[Repr] => F[Ops]; и так далее, причем Repr и Ops конкретные всегда; поэтому компилятор подхватывает их и понимает что их нужно использовать
источник

DZ

Dmitry Zuev in Data Engineers
Я так и думал, вроде там в доке все экспенды есть
источник

GP

Grigory Pomadchin in Data Engineers
Dmitry Zuev
Я так и думал, вроде там в доке все экспенды есть
источник

GP

Grigory Pomadchin in Data Engineers
т.е. если руками такое написать, он выводит
источник

GP

Grigory Pomadchin in Data Engineers
Dmitry Zuev
Я так и думал, вроде там в доке все экспенды есть
а, слушай; я сделал общий случай без генерации
источник

GP

Grigory Pomadchin in Data Engineers
источник

DZ

Dmitry Zuev in Data Engineers
Не томи
источник

DZ

Dmitry Zuev in Data Engineers
Grigory Pomadchin
а, слушай; я сделал общий случай без генерации
Показывай
источник

GP

Grigory Pomadchin in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
ну например так
источник

GP

Grigory Pomadchin in Data Engineers
@krivdathetriewe ты хотел чтоб кодеки для нютайпов шаплезовые выводились; работает
источник

GP

Grigory Pomadchin in Data Engineers
думаю это и с теггед тайпами работать будет
источник

GP

Grigory Pomadchin in Data Engineers
ну и кстати вместо своего тонкого коерсибла можно конечно же использовать шаплезовый изо (который Generic) но тут уж кому как удобнее
источник

OP

O. Petr in Data Engineers
В спарке при каких либо ошибках экзекьютор может переехать на другую машину ?
источник

A

Alex in Data Engineers
Упал - рестартанулся
источник

A

Alex in Data Engineers
Динамик алокации на простое заглушина неиспользуемые, потом подняла как появились задачи
источник