Size: a a a

2022 January 30

GP

Grigory Pomadchin in Moscow Spark
ну там отличия изза того что у меня хайв удфы зареганые посредством скула
спарк их подругому вычисляет) через лифт удфов в свои экспры
источник

GP

Grigory Pomadchin in Moscow Spark
не понимаю почему доступ по ждбс не связан с трифт сервером?
источник

k

kvadratura in Moscow Spark
там можно лимит выставит на макс. размер результата. таким образом, никто не будет абюзить и использовать в качестве bulk export - будут в FS сохранять, как и положено
источник

GP

Grigory Pomadchin in Moscow Spark
да
источник

D

Dmitry in Moscow Spark
связан. зато не связан с планом, выполнением на экзекьюторах, udf и всем прочим, что происходит до того как датасет отправляется на потребителя
источник

GP

Grigory Pomadchin in Moscow Spark
ну связан только тем что хайв удфы использовал; согласен оно сбоку приплетено
источник

GP

Grigory Pomadchin in Moscow Spark
но это просто как пруф того что у бриксов там просто трифт сервер
источник

GP

Grigory Pomadchin in Moscow Spark
настроенный под нужды
источник

k

kvadratura in Moscow Spark
тестировал на 100 одновременных запросах. но result size был у них мелкий. намереннно, т. к. мы не собирались поддерживать огромный result size через select-ы
источник

D

Dmitry in Moscow Spark
и смысл ? может десятку клиентов это поможет, но сотня вместе все равно вырубят
источник

k

kvadratura in Moscow Spark
пришел к выводу, что trino лучше работает на простых запросах, а вот на развесистых у trino и спарка throuput сопоставим
источник

k

kvadratura in Moscow Spark
выдать thriftserver-у памяти 15 ГБ - и 100 коннекшнов вполне держит

я не говорю, что это хорошее решение для табла какого-нибудь. а вот для spark dbt  - вполне годно
источник

D

Dmitry in Moscow Spark
трифт просто прокачивает датасеты, ему ни ваши udf ни спарк не нужны, он сам по себе
источник

GP

Grigory Pomadchin in Moscow Spark
ладно я думаю мы (я) о разном (другом)
источник

D

Dmitry in Moscow Spark
я и говорю, вы попутали какие-то куски спарка с трифт, который научили для спарка отдавать по jdbc, но это не часть спарка, а примочка сбоку
источник

GP

Grigory Pomadchin in Moscow Spark
я совершенно понимаю

мой посыл был, что трифт сервер для общения клиентов по ждбс живая идея и используется нормально датабриксами
источник

GP

Grigory Pomadchin in Moscow Spark
и что у вас не взлетело изза мисконфигурации
источник

k

kvadratura in Moscow Spark
вы оба правы крч 😁
источник

GP

Grigory Pomadchin in Moscow Spark
да
источник

GP

Grigory Pomadchin in Moscow Spark
мы о разном просто
источник