Size: a a a

2021 September 01

VE

Vladimir Elfimov in Moscow Spark
Пробовал по отдельности, тоже интересен кейс
источник

LT

Leonid Tsyplenkov in Moscow Spark
В общем, моя цель - обучить в Databricks модель, зарегистрировать ее в ML Flow, а в предикте ходить на бд
источник

LT

Leonid Tsyplenkov in Moscow Spark
Потому что стоит задача text2sql, перевода вопроса на естественном языке в sql запрос
источник

LT

Leonid Tsyplenkov in Moscow Spark
И в идеале мне надо, чтобы модель генерировала запрос и отдавала мне результат запроса
источник

NN

No Name in Moscow Spark
А у бриксов нет разве нормальной доки?
Насколько я знаю, это ж все их поделия, и явно умеют хорошо дружить, особенно на их платформе.
источник

LT

Leonid Tsyplenkov in Moscow Spark
Вот тут-то и вмешивается Спарк
источник

LT

Leonid Tsyplenkov in Moscow Spark
Просто так не работает
def predict(self, context, model_input):
 
    s = self.model.predict([model_input])[0][0]
    r = spark.sql(s).toPandas() 
    if len(r.columns)>1:
      return r[['swo_category', 'profit']]
    else:
      return r
   
источник

LT

Leonid Tsyplenkov in Moscow Spark
Возвращает исключение
Exception: It appears that you are attempting to reference SparkContext from a broadcast variable, action, or transformation. SparkContext can only be used on the driver, not in code that it run on workers. For more information, see SPARK-5063.
источник

ЕГ

Евгений Глотов... in Moscow Spark
Регистрация в млфлоу это скорее формальный процесс, он не связан с самой моделью, её из артефакта как-то можно по-кривому вытащить только
источник

LT

Leonid Tsyplenkov in Moscow Spark
Не понял, почему?
источник

LT

Leonid Tsyplenkov in Moscow Spark
Если возвращать в предикте сам запрос, то все работает, и я могу дергать модель через rest api
источник

ЕГ

Евгений Глотов... in Moscow Spark
А "s" это что?
источник

LT

Leonid Tsyplenkov in Moscow Spark
Криво поправил
источник

LT

Leonid Tsyplenkov in Moscow Spark
В model я отправляю обученную seq2seq модель
источник

ЕГ

Евгений Глотов... in Moscow Spark
Ну то есть какой-то механизм выкачивания модели в питон объект есть, дальше млфлоу ни при чём
источник

LT

Leonid Tsyplenkov in Moscow Spark
Нет, ошибка именно в логировании модели mlflow
источник

ЕГ

Евгений Глотов... in Moscow Spark
Перед [0][0] не нужно коллект поставить?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Результат предикта это же датафрейм?
источник

LT

Leonid Tsyplenkov in Moscow Spark
Не знаю, что имеется в виду, но опять же, без строчки со spark.sql все работает
источник

ЕГ

Евгений Глотов... in Moscow Spark
Зачем его в спарк скл засовывать
источник