Size: a a a

2021 November 18

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
да я последние дни осознаю сколько тонкостей всяких) .. вот даже просто скачать спарком csv, это уже не так как у всех..
источник

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
источник

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
смотрю:

jdbcDF.write \
   .format("jdbc") \
   .option("url", "jdbc:postgresql:dbserver") \
   .option("dbtable", "schema.tablename") \
   .option("user", "username") \
   .option("password", "password") \
   .save()
источник

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
подумал что мой вариант, переделал:
источник

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
df.write \
       .format("jdbc") \
       .option("url", f"jdbc:postgresql://{host}:{port}/{db_name}") \
       .option("dbtable", f"{schema_write}.{table_name}") \
       .option("user", f"{username}") \
       .option("password", f"{password}") \
       .option("driver", 'org.postgresql.Driver') \
       .save()
источник

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
но я не уверен прям во всех переделках.. имя схемы? имя таблицы? всё на местах?
источник

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
спасибо, кажется надо файлик пересобрать.. новая ошибка на это намекает. глазами найти не смогли %(
источник

AP

Anton Pilipenko in Moscow Spark
Самое простое - посмотреть запрос со стороны БД который приходит и станет ясно что не так.
источник

AP

Anton Pilipenko in Moscow Spark
Залей в локальный постгрес что в докере поднять можно за примерно 5 секунд да и все.
источник
2021 November 19

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
так у меня в облаках постгрес поднят, я там губу уже раскатал, чтоб туда сохранять) но Александру моя идея походу не понравилась) а локально у меня аирфлоу с постгресом собраны.. я бы умел постгресом пользоваться ещё О_о
источник

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
я установил там в юпитерхабе пайспарк.. ошибку эту же словил.. теперь не понятно как подойти к посгресу) который там стоит.. как создавать схему я не знаю.. только табличку в сехме проходил)
источник

rG

rpuropuu Greeg'O'Rii... in Moscow Spark
Всё получилось)

надо было вот так
.option("dbtable", f"public.{table_name}") \

а я туда опять схему передавал..
источник

MD

Mila Dahle in Moscow Spark
где вы увидели вопрос?
источник
2021 November 20

МК

Михаил Королев... in Moscow Spark
коллеги-специалисты, такой вопрос: спарк стриминг (DStream), файловый источник. Где спарк хранит информацию об уже обработанных файлах? Как сделать так, чтобы он повторно обработал файлы?

Код ниже приведу (там три строки), результат - еще ниже
источник

МК

Михаил Королев... in Moscow Spark
код:
sc = SparkContext("local[2]", "NetworkWordCount")
ssc = StreamingContext(sc, 10)

lines = ssc.textFileStream("/tmp/file_stream.source")

lines.pprint()

ssc.start()
ssc.awaitTermination()
источник

МК

Михаил Королев... in Moscow Spark
файлы - в HDFS
источник

МК

Михаил Королев... in Moscow Spark
спарк 2.4.0
источник

МК

Михаил Королев... in Moscow Spark
вчера положил два файла в директорию, они были обработаны
источник

МК

Михаил Королев... in Moscow Spark
остановил приложение (CTRL+C, запускал спарк-сабмитом)
источник

МК

Михаил Королев... in Moscow Spark
сегодня после запуска файлы не обрабатываются
источник