Size: a a a

2021 October 23

ПФ

Паша Финкельштейн... in Moscow Spark
Скорее всего ваш udf ничего не обгонит если только не какой-то специфический случай
источник

N

Nikita Blagodarnyy in Moscow Spark
Использовать средства полнотекстового поиска. Еластик, люсен, соляр.
источник

МК

Мария Колесникова... in Moscow Spark
Пока не получилось) потому что запускала на всём DF, у меня задача вообще до конца не досчиталась)
источник

МК

Мария Колесникова... in Moscow Spark
Спасибо! Пошла гуглить))
источник

NN

No Name in Moscow Spark
Глянь ещё вот сюда

https://github.com/phymbert/spark-search
источник

AS

Andrey Smirnov in Moscow Spark
у нас 2.4.7 на 2.11, но сложностей я не помню
источник
2021 October 25

CO

Chern Oleksander in Moscow Spark
всем привет, а не кто не сталкивался, при записи

datasink2 = (
   new_df
   .repartition(1)
   .write
   .mode("overwrite")
   .format("json")
   .save('s3://analyst-public/winners/')
   )
не пишет в конце строки запятую ((

AWS glue pyspark
источник

GP

Grigory Pomadchin in Moscow Spark
он пишет по жейсону на строчке
источник

GP

Grigory Pomadchin in Moscow Spark
1: jsonline
2: jsonlne

n: jsonline
источник

GP

Grigory Pomadchin in Moscow Spark
это валидный жейсон
источник

GP

Grigory Pomadchin in Moscow Spark
если тебе хочется это все првератить в коллекцию жейсонов, то тебе надо делать коллект на драйвер этих строк и конвретить в коллекцию
источник

CO

Chern Oleksander in Moscow Spark
а можно как-то сделать запятую, без пробега по строкам ? ((
источник

GP

Grigory Pomadchin in Moscow Spark
ты уверен что оно тебе нужно?
источник

CO

Chern Oleksander in Moscow Spark
разрабы жалуются ((
источник

GP

Grigory Pomadchin in Moscow Spark
new_df.as[String].collect.mkString("[", ",", "]")
источник

GP

Grigory Pomadchin in Moscow Spark
только ты сам уже сохраняй жейсон)
источник

GP

Grigory Pomadchin in Moscow Spark
колектишь строки на драйвер и конкатенируешь в одну)
источник

CO

Chern Oleksander in Moscow Spark
Оки, спасибо
источник

CO

Chern Oleksander in Moscow Spark
а что такое волектить?
источник

GP

Grigory Pomadchin in Moscow Spark
колектишь*)
источник