Телеграмм чат группы moscowspark страница 330

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

2020 May 08

AS

Andrey Smirnov in Moscow Spark

Vitaly Khudobakhshov

В тулбаре в IDEA есть кнопка, которая ведёт в настройки модуля, куда можно добавить недостающие зависимости, которые не удалось синхронизировать автоматически из цеппелина

а где эта волшебная кнопка, мне каждый jar добавлять руками?

источник

14:56пожаловаться #1

NA

Nikita Ashikhmin in Moscow Spark

всем привет

источник

15:01пожаловаться #2

NA

Nikita Ashikhmin in Moscow Spark

на скриншоте плюсик справа от зависимостей

источник

15:01пожаловаться #3

NA

Nikita Ashikhmin in Moscow Spark

источник

15:02пожаловаться #4

NA

Nikita Ashikhmin in Moscow Spark

источник

15:03пожаловаться #5

NA

Nikita Ashikhmin in Moscow Spark

Если один раз зависимость добавили для коннекшена, то она сохранится. Она сохранится для пары коннекшен, проект

источник

15:04пожаловаться #6

AS

Andrey Smirnov in Moscow Spark

Nikita Ashikhmin

спасибо, сработало!

источник

15:13пожаловаться #7

AS

Andrey Smirnov in Moscow Spark

но все равно было бы неплохо если spark.jars.packages хотя бы синхронизировались

источник

15:16пожаловаться #8

VK

Vitaly Khudobakhshov in Moscow Spark

но все равно было бы неплохо если spark.jars.packages хотя бы синхронизировались

Подумаем, как все можно улучшить

источник

15:46пожаловаться #9

DC

Dany Chepenko in Moscow Spark

Подскажите, в спраке ловлю ошибку java.lang.IllegalArgumentException: Field "col1" does not exist когда создаю пайплайн и пытаюсь зафитить дату.
При этом, когда смотрю на схему - нужную колнку вижу. Дату читаю из csv.

val data = this.spark.read
  .format("csv")
  .option("header", "true")
  .option("mode", "DROPMALFORMED")
  .load(this.taskConfig.training.db + this.taskConfig.training.table)

Куда смотреть - схеам выглядит валидной
Полный код https://stackoverflow.com/questions/61678952/scala-spark-error-java-lang-illegalargumentexception-field-col1-does-not-exi

Scala Spark error: java.lang.IllegalArgumentException: Field "col1" does not exist

I try to fit xgboost model via spark. Here is my minimal reproducible implementation. task-config contains the fields to be parsed and model parameters.

private var spark: SparkSession = _
pri...

источник

16:36пожаловаться #10

R

Roman in Moscow Spark

Какой разделитель колонок в csv? Не таб случаем?

источник

17:42пожаловаться #11

DC

Dany Chepenko in Moscow Spark

Какой разделитель колонок в csv? Не таб случаем?

Таб, да

источник

18:51пожаловаться #12

R

Roman in Moscow Spark

Надо явно указать, когда читаешь, разделитель таб

источник

19:34пожаловаться #13

R

Roman in Moscow Spark

Из твоего стэковерфлоу:
Array(StructField(col1 col2 col3 ...)

источник

19:36пожаловаться #14

R

Roman in Moscow Spark

Все колонки в одной

источник

19:36пожаловаться #15

2020 May 09

DC

Dany Chepenko in Moscow Spark

Надо явно указать, когда читаешь, разделитель таб

Ага, помогло, но другая ошибка возникла Exception in thread "main" java.lang.IllegalArgumentException: Data type StringType is not supported.

источник

22:11пожаловаться #16

2020 May 11

AS

Andrey Smirnov in Moscow Spark

вопрос: а как сохранить посчитанную svd на диск и потом загрузить обратно?

источник

18:23пожаловаться #17

OI

Oleg Ivchenko in Moscow Spark

вопрос: а как сохранить посчитанную svd на диск и потом загрузить обратно?

А в каком виде она посчиталась? RDD / DF?

источник

18:28пожаловаться #18

AS

Andrey Smirnov in Moscow Spark

А в каком виде она посчиталась? RDD / DF?

org.apache.spark.mllib.linalg.SingularValueDecomposition[org.apache.spark.mllib.linalg.distributed.RowMatrix,org.apache.spark.mllib.linalg.Matrix]
видимо rdd

источник

18:29пожаловаться #19

OI

Oleg Ivchenko in Moscow Spark

org.apache.spark.mllib.linalg.SingularValueDecomposition[org.apache.spark.mllib.linalg.distributed.RowMatrix,org.apache.spark.mllib.linalg.Matrix]
видимо rdd

Если RDD, то просто persist() со StorageLevel DISK_ONLY.

источник

18:30пожаловаться #20