Size: a a a

2021 August 20

ЕГ

Евгений Глотов... in Moscow Spark
не понял, а чем int от инт отличается?)
источник

ЕГ

Евгений Глотов... in Moscow Spark
конечно он читает это как инт, а как что ещё?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Как стринг?
источник

ЕГ

Евгений Глотов... in Moscow Spark
А, соседний тред прочитал, понял)
источник

K

KrivdaTheTriewe in Moscow Spark
простите)  ночные баги радуют
источник

K

KrivdaTheTriewe in Moscow Spark
до опредленного момента, схема инференс выводил стринг, потом начало выводить как инт
источник

K

KrivdaTheTriewe in Moscow Spark
я планирую проверить гипотезу одну , и расскажу о ней позже)
источник

ЕГ

Евгений Глотов... in Moscow Spark
Вжух - и таск упал)
источник

ИК

Иван Калининский... in Moscow Spark
Зачем делать такие партиции? Дата должна быть с разделителями "-", иначе пользователи будут недовольны. Ну или я буду недоволен, когда увижу такое ещё раз. Да, уже видел и с этим пришлось работать((
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Вангую что там появилась почему-то неправильно именованная директория и инференс это увидел
источник

А

Алексей in Moscow Spark
в сап системах дата хранится как строка в формате yyyymmdd, оно потом расползается везде
источник

ИК

Иван Калининский... in Moscow Spark
Спасибо, теперь ясно, кто так проектирует
источник

ИК

Иван Калининский... in Moscow Spark
так было бы, если бы всегда был Int, а потом стал String. Скорее неправильная партиция пропала. Но мы многое не знаем, может там каскад трансформаций?
источник

ИК

Иван Калининский... in Moscow Spark
Просто получается, что это не дата, с которой можно сразу работать, не строка, которую можно автоматически привести к дате, не число, имеющее смысл. Только отсортировать и можно, остальное везде неудобно
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А, блин, сначала был стринг... Но да, тогда сложнее диагностировать, вероятно пропала неправильная патриция, да
источник

А

Алексей in Moscow Spark
чем лучше строка в yyyy-mm-dd? Только тем, что ее проще читать?
источник

ИК

Иван Калининский... in Moscow Spark
spark ее инферит автоматически, можно работать как с датой)
источник

N

Nikita Blagodarnyy in Moscow Spark
помнится раньше вроде Hive не умел то ли в арифметику дат над партициями то ли партции по дате и приходилось делать их интом, чтобы накладывать part_field > 20200101 and part_field < 20200103
источник

N

Nikita Blagodarnyy in Moscow Spark
чтобы прунинг работал
источник

ИК

Иван Калининский... in Moscow Spark
возможно, но хайв у нас сейчас во-первых не основной, во-вторых именно такой формат требуется в нашем проекте
источник