Size: a a a

Data Science Kazakhstan (DS/ML kz)

2020 April 23

I

Iv in Data Science Kazakhstan (DS/ML kz)
Кir
молодцы! и Иван тоже скромный

вопрос - что делаете со снимок перед анализом, какая предобработка и какие библиотеки используются? OpenCV?
вообще зависит от снимков, целей и т.д. для классификации достаточно просто ресайзнуть, для других задач могут подходить более извращенные превращения.
источник

К

Кir in Data Science Kazakhstan (DS/ML kz)
ресайз не повлияет на потерю признаков? номализация опять же?
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Есть еще  конвертация из dicom формата.
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
Кir
ресайз не повлияет на потерю признаков? номализация опять же?
для этого исследуется изменение метрики на размерном ряде типа 224-336-448-512
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
или другом
источник

I

Iv in Data Science Kazakhstan (DS/ML kz)
если при сжатии падает не сильно - то зачем платить больше?
источник

N

Nurmukhamed in Data Science Kazakhstan (DS/ML kz)
Подскажите, пожалуйста. Когда-то в группе видел тулзу для нормализации казахских слов. Есть ссылка?
источник

IS

Iska Shaikh in Data Science Kazakhstan (DS/ML kz)
ID:0
Подгон для тех, кто занимается обработкой текстов на казахском: Ильнар Салимзянов зарелизил Apertium++ Kaz

https://github.com/taruen/apertiumpp/tree/master/apertiumpp-kaz

Это почищенная и существенно расширенная версия морфологизатора для казахского языка Apertium-kaz.

Казахский язык обладает развитой системой морфологических форм: "Қанағаттандырылмағандықтарыңыздан" = "из-за того, что вы не были удовлетворены". Поэтому разбивка слов на морфемы часто помогает при обработке текстов на казахском.
вот это?
источник

IU

Irina Ualiyeva in Data Science Kazakhstan (DS/ML kz)
Nurmukhamed
Подскажите, пожалуйста. Когда-то в группе видел тулзу для нормализации казахских слов. Есть ссылка?
Apertium
источник

N

Nurmukhamed in Data Science Kazakhstan (DS/ML kz)
Спасибо!
источник

N

Nurmukhamed in Data Science Kazakhstan (DS/ML kz)
🐍😢
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Z
ResNeSt: Split-Attention Networks - убийца эфишнтнетов
почитал пейпер, что смутило. Они используют всякие танцы с бубном вокруг LR, mixup трейнинг и еще всякие ауги. Где гарантия, что просто вся архитектура не заточена, что б стать топ 1 на imagenet, а в других задачах не будет провала?
источник

S

Sneddy in Data Science Kazakhstan (DS/ML kz)
Data Scientist, Руководитель подразделения в Халык Банк

Сочетает в себе две роли:
·         Работает в продуктовой команде, решающей проблемы клиентов - малых бизнесов
·         Создает в банке компетенцию по работе с данными

Должностные обязанности:
·         Экспертная поддержка владельцев продукта и дизайнеров при проектировании клиентских путей (основные юз-кейсы связаны с рисками, ценообразованием и customer value management)
·         Работа в продуктовых командах в качестве senior data scientist на самых сложных участках, требующих экспертных знаний
·         Обучение, менторство и контроль качества работы data scientists, работающих в продуктовых командах малого бизнеса

Требования к соискателю:
·         Опыт работы в сфере анализа данных, включая опыт в статистическом моделировании и машинном обучении для решения бизнес задач
·         Опыт в наставничестве людей
·         Успешный опыт реализации проектов в быстро меняющейся обстановке
·         Высокий уровень знаний SQL, Python и R
·         Знание и умение применять предметно-ориентированное проектирование в разработке ПО или данных в масштабе предприятия

Условия:
Оклад  600 000 - 1 000 000 KZT
Ежеквартальные бонусы

Резюме высылать на адрес halykbank.cv@gmail.com
источник

К

Кir in Data Science Kazakhstan (DS/ML kz)
лирическое отступление: мы все тут верим в эффективность ml/dl, знаем про достижения google в переводах текста, но пока ещё встречаются перлы, вот два дня назад был опубликован мультфильм на японском языке, включите субтитры на русском :))))
https://youtu.be/Fgnht98GaSI
источник

Z

Z in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
почитал пейпер, что смутило. Они используют всякие танцы с бубном вокруг LR, mixup трейнинг и еще всякие ауги. Где гарантия, что просто вся архитектура не заточена, что б стать топ 1 на imagenet, а в других задачах не будет провала?
Resnest далеко не первый, так как в последнее время активно размножается семейка efficientnet-ов. Вопрос в том, чем остальные архитектуры, которые используют те же трюки вроде mixup, autoaugment не оверфитятся на imagenet? Преимущество resnestов, по их словам, еще в том, что можно просто поменять ResNet backbone на ResNest, который даст прирост в ~3%, на object detection и segmentatino задачах. Но все же, это не отменяте того, что самим нужно тестить все это. Например, иногда большие еффнеты перформят хуже чем маленькие.
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Z
Resnest далеко не первый, так как в последнее время активно размножается семейка efficientnet-ов. Вопрос в том, чем остальные архитектуры, которые используют те же трюки вроде mixup, autoaugment не оверфитятся на imagenet? Преимущество resnestов, по их словам, еще в том, что можно просто поменять ResNet backbone на ResNest, который даст прирост в ~3%, на object detection и segmentatino задачах. Но все же, это не отменяте того, что самим нужно тестить все это. Например, иногда большие еффнеты перформят хуже чем маленькие.
Ну вообщем я вкорячил resnest в пайплайн. Запустил учиться, глянем что будет.

resnest да легко подменяется)
источник

Z

Z in Data Science Kazakhstan (DS/ML kz)
👍😎
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Но я на классификации
источник

Z

Z in Data Science Kazakhstan (DS/ML kz)
Поделишься результатами потом)
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Z
Поделишься результатами потом)
Ага, думаю завтра или на выходных
источник