Size: a a a

2020 March 11

MJ

Muhammad Jon in catboost_ru
Владислав Сафоничев
Друзья, всем привет, хотел бы попробовать бибилотечку для мультиклассификации текстов, в документации нашел только про токензицию и словари, примеров с тестовыми данными я не нашел. Собственно вопрос: нужен ли какой-то препроцессинг для текстов (кроме токенизации, естественнно) и доступна ли мультиклассификация (полистал чат, вроде кто-то писал, что пока только бинарная классификация для текста доступна)
CatBoost можно использовать в своём пайплайне для токенизации. Рекомендую рассмотреть в сторону gensim.Doc2Vec и fasttext.cc
источник

AD

Anna Veronika Dorogush in catboost_ru
В этом году мы снова проводим open-source спринты, они пройдут 28 марта в офисе Яндекса на Льва Толстого: https://events.yandex.ru/events/otkrytyj-kod-v-yandek-28-03-2020. Приходите!
Открытый код в Яндексе. Спринты по CatBoost и ClickHouse
Метод машинного обучения [CatBoost](https://catboost.ai/ "CatBoost") и аналитическая СУБД [ClickHouse](https://clickhouse.tech "ClickHouse") — технологии Яндекса с открытым исходным кодом. Поучаствовать в их разработке может любой желающий.

28 марта мы вновь проведём для разработчиков встречу в формате спринтов. Участники будут группами по 2–3 человека или индивидуально решать небольшие задачи. Вы посмотрите, как ведётся разработка CatBoost и ClickHouse, узнаете структуру их кода, научитесь писать и запускать тесты. И, мы надеемся, внесёте изменения, которые войдут в один из ближайших релизов.

Сперва мы на простом примере покажем, как решить задачу и опубликовать её на GitHub. Затем приступим к практике. Вы выберете задания из предложенного списка и начнёте работу над ними. Разобраться со сложностями помогут разработчики CatBoost и ClickHouse. В конце мы подведём итоги и наградим победителей.

Задачи отличаются по сложности. У каждой будет подробное описание, каждую можно полностью решить за отведённое время.…
источник

ВС

Владислав Сафоничев in catboost_ru
Muhammad Jon
CatBoost можно использовать в своём пайплайне для токенизации. Рекомендую рассмотреть в сторону gensim.Doc2Vec и fasttext.cc
Спасибо, знаком с этими библиотеками, давно себя зарекомендовали в сообществе, просто хотел попробовать catboost в плане классификации по (мульти)категориям)
источник

G

GenRockeR in catboost_ru
коллеги, а кто-либо добавлял catboost  в классификаторы в Splunk Machine Learning Toolkit ? там уже есть Gradient Boosting и Random Forest. Хотелось бы сравнения классификации
источник
2020 March 12

N

Norx in catboost_ru
Lagrangian Neural Networks

In contrast to Hamiltonian Neural Networks, these models do not require canonical coordinates and perform well in situations where generalized momentum is difficult to compute

Code: https://github.com/MilesCranmer/lagrangian_nns

Paper: https://arxiv.org/abs/2003.04630v1
источник

HH

HZK HZKtoevich in catboost_ru
Так понимаю Кэтбуст может работать напрямую со стринг
источник

HH

HZK HZKtoevich in catboost_ru
Нету необходимости преобразования через one hot encoding
источник

HH

HZK HZKtoevich in catboost_ru
?
источник

AD

Anna Veronika Dorogush in catboost_ru
HZK HZKtoevich
Так понимаю Кэтбуст может работать напрямую со стринг
да
источник

HH

HZK HZKtoevich in catboost_ru
А то с XgBoost мучения еще те 😁
источник
2020 March 13

ОГ

Олег Гафуров in catboost_ru
Друзья, всем привет!
Ищу контакты с теми, кто заинтересован начать свой стартап или подключится к новой технологии. Нужны специалиста пишущие на Phiton.
Есть отличная Тема для развития.
источник

HH

HZK HZKtoevich in catboost_ru
Жаль, я не специалист глубокого уровня
источник

HH

HZK HZKtoevich in catboost_ru
😁
источник

AU

Aleksei Ustimenko in catboost_ru
На Phiton, боюсь, мало специалистов будет
источник

p

pin in catboost_ru
Олег Гафуров
Друзья, всем привет!
Ищу контакты с теми, кто заинтересован начать свой стартап или подключится к новой технологии. Нужны специалиста пишущие на Phiton.
Есть отличная Тема для развития.
Только не phiton, а python.
источник

AD

Anna Veronika Dorogush in catboost_ru
Олег Гафуров
Друзья, всем привет!
Ищу контакты с теми, кто заинтересован начать свой стартап или подключится к новой технологии. Нужны специалиста пишущие на Phiton.
Есть отличная Тема для развития.
За предложения о работе, рекламу и другой спам, не относящийся к теме, будем банить. В этот раз не трогаю, тк в описании группы этой информации не было.
источник

S

Stephan in catboost_ru
Anna Veronika Dorogush
В этом году мы снова проводим open-source спринты, они пройдут 28 марта в офисе Яндекса на Льва Толстого: https://events.yandex.ru/events/otkrytyj-kod-v-yandek-28-03-2020. Приходите!
Открытый код в Яндексе. Спринты по CatBoost и ClickHouse
Метод машинного обучения [CatBoost](https://catboost.ai/ "CatBoost") и аналитическая СУБД [ClickHouse](https://clickhouse.tech "ClickHouse") — технологии Яндекса с открытым исходным кодом. Поучаствовать в их разработке может любой желающий.

28 марта мы вновь проведём для разработчиков встречу в формате спринтов. Участники будут группами по 2–3 человека или индивидуально решать небольшие задачи. Вы посмотрите, как ведётся разработка CatBoost и ClickHouse, узнаете структуру их кода, научитесь писать и запускать тесты. И, мы надеемся, внесёте изменения, которые войдут в один из ближайших релизов.

Сперва мы на простом примере покажем, как решить задачу и опубликовать её на GitHub. Затем приступим к практике. Вы выберете задания из предложенного списка и начнёте работу над ними. Разобраться со сложностями помогут разработчики CatBoost и ClickHouse. В конце мы подведём итоги и наградим победителей.

Задачи отличаются по сложности. У каждой будет подробное описание, каждую можно полностью решить за отведённое время.…
Мероприятие переносится?)
источник

AD

Anna Veronika Dorogush in catboost_ru
Anna Veronika Dorogush
В этом году мы снова проводим open-source спринты, они пройдут 28 марта в офисе Яндекса на Льва Толстого: https://events.yandex.ru/events/otkrytyj-kod-v-yandek-28-03-2020. Приходите!
Открытый код в Яндексе. Спринты по CatBoost и ClickHouse
Метод машинного обучения [CatBoost](https://catboost.ai/ "CatBoost") и аналитическая СУБД [ClickHouse](https://clickhouse.tech "ClickHouse") — технологии Яндекса с открытым исходным кодом. Поучаствовать в их разработке может любой желающий.

28 марта мы вновь проведём для разработчиков встречу в формате спринтов. Участники будут группами по 2–3 человека или индивидуально решать небольшие задачи. Вы посмотрите, как ведётся разработка CatBoost и ClickHouse, узнаете структуру их кода, научитесь писать и запускать тесты. И, мы надеемся, внесёте изменения, которые войдут в один из ближайших релизов.

Сперва мы на простом примере покажем, как решить задачу и опубликовать её на GitHub. Затем приступим к практике. Вы выберете задания из предложенного списка и начнёте работу над ними. Разобраться со сложностями помогут разработчики CatBoost и ClickHouse. В конце мы подведём итоги и наградим победителей.

Задачи отличаются по сложности. У каждой будет подробное описание, каждую можно полностью решить за отведённое время.…
В связи с риском распространения коронавируса мы приняли решение перенести опенсорс эвент на неопределенный срок. Будьте здоровы!
источник

ВС

Виктор Салимгареев in catboost_ru
айтишники априори не могут заболеть, тк никуда из дома не выходят
источник

Аa

Андрей amber4eg in catboost_ru
Это и называется overfit
источник