Телеграмм чат группы julialanguage страница 815

Кто знает как называется метод хантинга от Гугла когда спрашивающему очень специфический запрос, например про хаскель, предлагают викторину пройдя которую попадаешь к ним на работу?

источник

20:47пожаловаться #4

2021 January 21

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

Alexandr

Оно может быть интересно прежде всего единым языком обработки данных вне зависимости от их объема. Собственно наметки попсового проекта есть, пока не очень четкие. Что-то вроде комбинации airflow с zeppelin. Т.е. в очень приблизительном виде - DAG, в котором каждый узел это код на джулии, который на вход принимает либо DataFrame либо таблицу в локальном сторадже и на выход отдает их же. Плюс входные узлы, которые позволяют загонять данные из внешних источников. И возможность писать код/строить дашборды и т.д. и т.п. в этом окружении. Т.е. настраиватеся окружение с подготовленными данными. Любой процесс преобразования данных можно сохранить в ноду DAGа на будущее, попутно решив будет ли это View(т.е. будет выполняться каждый раз) или выход будет по расписанию сохраняться в локальный сторадж.

Ммм... у меня есть пара мыслей и проект, который я писал с пайплайнами экономических данных на питоне, типа такой ETL на датафреймах. На проекте я понял, что даннве доожны быть очень большие, разнородные и уникалтные, чтобы оправдать разработку нового инструмента.

источник

00:21пожаловаться #5

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

Чего не хватало также, как я понимаю, это типизации фрейма pandas: чтобы хорошо тащить пайплайн нужно информацию о типах колонок сохранять/применять, иначе каша

источник

00:23пожаловаться #6

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

Не знаю как насчет airflow но мне не хватает какого-то DSL мол взять тот файл, препарировать так, положить туда, валидировать так-то

источник

00:25пожаловаться #7

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

По частям это все получается - а единообразно нет

источник

00:26пожаловаться #8

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

Насчет даных - какой вопрос? Нужны какие-то примеры из проектов, сборки из открытых источников

источник

00:27пожаловаться #9

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

Alexandr

Поэтому я и не хочу писать чистый AirFlow - хочется чтобы у него был красивый выход сразу, т.е. это должен быть BI инструмент. Объем работ получается здоровый и это пугает, да

И пайплайн, и хранение, и BI сразу? Может в это что-то есть, но как-то непривычно и непонятно как будет с производительностью

источник

00:31пожаловаться #10

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

https://notamonadtutorial.com/soss-probabilistic-programming-with-julia-6acc5add5549?s=09

Medium

Soss: Probabilistic Programming with Julia

An interview with its creator, Chad Scherrer

источник

00:32пожаловаться #11

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

Отдельной строкой, про вероястное моделирование блог читаю, интересно обсудить, может кто-то использует Turing.jl или аналоги?

источник

00:34пожаловаться #12

Vladimir Samoylov in Язык программирования Julia / Julia programming language

Евгений Погребняк

Ребята, вы пишете ровно про Dataiku https://www.dataiku.com/
Пользуюсь уже три года на разных задачах и в индустриальных приложениях и в финтехе. Скажу честно, с точки зрения удобства решения целевой бизнес задачи лучше я пока ничего не видел.

Dataiku

Dataiku | Your Path to Enterprise AI

Dataiku's single, collaborative platform powers both self-service analytics and the operationalization of machine learning models in production.

источник

00:42пожаловаться #13

ЕП

Евгений Погребняк... in Язык программирования Julia / Julia programming language

Vladimir Samoylov

Dataiku

Dataiku | Your Path to Enterprise AI

Dataiku's single, collaborative platform powers both self-service analytics and the operationalization of machine learning models in production.

👍

источник

00:58пожаловаться #14

Alexandr in Язык программирования Julia / Julia programming language

Евгений Погребняк

Ну вот у меня по работе они как раз большие. А по поводу разнородности и уникальности - не уверен что она нужна для оправданности, может быть даже наоборот. Опять таки идею я пока для себя полностью не сформуловал, так отрывки.
Вот лично у меня часто встают задачи типа посчтитать конверсию для когорты пользователей из события А(одна таблица в кликхаузе) в событие B(другая таблица в кликхаузе) в течении какого-то времени (т.е. не просто select from B where id in (select id from A), а событие в B должно произойти после события в A в течении N дней).
При этом эта задача воспроизводится во всевозможных вариациях - когда-то сама когорта пользователей получается не тривиальным образом (например приходит не из клика, а из какой-то выгрузки id, или является результатом кластеризации). Когда-то события в которые нужно посчитать конверсию это результат сложного запроса.
И мне было бы очень удобно один раз написать код, который это делает по указанным входным данным, а потом в идеале в графическом интерфейсе при поступлении очередной хотелки менеджеров просто связать его с конкретными входными данными, на его выход навесить какие-то варианты стандарных аггрегаций/фильтраций, возможно настроить сохранение в локальный сторадж и тут же отправить на вход дашборда.

источник

01:48пожаловаться #15

Petr Val in Язык программирования Julia / Julia programming language

Евгений Погребняк

Пробую немного Turing. По-моему, он наиболее перспективен и наиболее активно развивается (если брать PPL на Julia)

источник

09:46пожаловаться #16

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language

А что насчёт Gen.jl?

источник

09:48пожаловаться #17