Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 February 22

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
похоже на нормальное, потому что самое верхнее по середине, но справа жирная фигня какая-то , не пойму, то ли нормальное то ли ненормальное
Есть формальные тесты на форму распределения, например kolmogorov-smirnov
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
так надёжнее, чем глазками проверять)
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Есть формальные тесты на форму распределения, например kolmogorov-smirnov
Хм...
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А есть программа в которую данные залил и она сама скажет какое распределение ? Нормальное или ненормальное ?
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
А есть программа в которую данные залил и она сама скажет какое распределение ? Нормальное или ненормальное ?
Я загуглил "online kolmogorov smirnov test", вот первый же результат
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А вообще, чувак, я понимаю, что сообщество у нас дружелюбное, но неужели сложно самому в гугл сначала залезть?
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Я залез залез..
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
После того как вы сказали что есть тест Колмогорова Смирнова, я про такой не помнил
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Как сказали - сразу загуглил , и спасибо что подсказали
источник

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
После того как вы сказали что есть тест Колмогорова Смирнова, я про такой не помнил
Ну кроме KS есть ещё миллион tests for normal distribution, такой запрос тоже можно было сделать)
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Ну кроме KS есть ещё миллион tests for normal distribution, такой запрос тоже можно было сделать)
....я думал всегда что надо как-то на глаз смотреть..)..но да, нужно было спросить гугл : программа для определения нормальности выборки , что-то типо того, согласен
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
не знаю, все равно до конца в голове не складывается.
Вот такая схема, если натренировать с буквами, какое у вас было бы ожидание, сработает на предикции слов или нет ?
Подожди, ты на вход даёшь, картинку слова, получаешь букву?
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Чтобы детектить буквы, разбей слово на буквы и детекти буквы. 🤓
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vadim Chashechnikov
Подожди, ты на вход даёшь, картинку слова, получаешь букву?
да. Но я как бы и тренировал только буквы. Я пока пришел к выводу, что так как тренировал только центрированные буквы, то там attention вообще ничему не научился.
Я проверил эту гипотезу протестировав следующий случай на их оригинальной модели.

Взял слово из этих датасета, вырезал одну букву, и сделал ее "на весь экран", и их модель не смогла определить слово в размер одной буквы, хоть это sub_image картинки, которая у них в тренинге была.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Vadim Chashechnikov
Чтобы детектить буквы, разбей слово на буквы и детекти буквы. 🤓
вся тема, что даже они в своем подходе пишут, что нафиг разбивать на буквы даже чтобы тренить, что словами учить проще, потому что даты в мире больше.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
то есть задача разбития на буквы та еще )
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
да. Но я как бы и тренировал только буквы. Я пока пришел к выводу, что так как тренировал только центрированные буквы, то там attention вообще ничему не научился.
Я проверил эту гипотезу протестировав следующий случай на их оригинальной модели.

Взял слово из этих датасета, вырезал одну букву, и сделал ее "на весь экран", и их модель не смогла определить слово в размер одной буквы, хоть это sub_image картинки, которая у них в тренинге была.
я думаю, что у меня также только наоборот, раз я натренировал только буквы и только в центре изображения.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
я думаю, что у меня также только наоборот, раз я натренировал только буквы и только в центре изображения.
попробую разбросать, натренить и посмотреть, эта была ли причина, то есть проблема в атрофированном detection, либо другая. Иначе придется сидеть слова лейбелить )))
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну либо действительно думать как на буквы разделить
источник

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Думаю, легче найти датасет для слов... А в чем общая задача/цель? Просто ты описал свой процесс, но непонятно что в итоге надо? MNIST уже решенная задача вроде....
источник