Телеграмм чат группы bigdata_ru страница 2519

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

4737 membersпожаловаться на группу

2021 February 22

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

k k

похоже на нормальное, потому что самое верхнее по середине, но справа жирная фигня какая-то , не пойму, то ли нормальное то ли ненормальное

Есть формальные тесты на форму распределения, например kolmogorov-smirnov

источник

00:57пожаловаться #1

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

так надёжнее, чем глазками проверять)

источник

00:57пожаловаться #2

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Есть формальные тесты на форму распределения, например kolmogorov-smirnov

Хм...

источник

00:57пожаловаться #3

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

А есть программа в которую данные залил и она сама скажет какое распределение ? Нормальное или ненормальное ?

источник

00:58пожаловаться #4

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

k k

А есть программа в которую данные залил и она сама скажет какое распределение ? Нормальное или ненормальное ?

Я загуглил "online kolmogorov smirnov test", вот первый же результат

источник

01:00пожаловаться #5

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

А вообще, чувак, я понимаю, что сообщество у нас дружелюбное, но неужели сложно самому в гугл сначала залезть?

источник

01:00пожаловаться #6

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Я залез залез..

источник

01:02пожаловаться #7

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

После того как вы сказали что есть тест Колмогорова Смирнова, я про такой не помнил

источник

01:03пожаловаться #8

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Как сказали - сразу загуглил , и спасибо что подсказали

источник

01:03пожаловаться #9

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

k k

После того как вы сказали что есть тест Колмогорова Смирнова, я про такой не помнил

Ну кроме KS есть ещё миллион tests for normal distribution, такой запрос тоже можно было сделать)

источник

01:04пожаловаться #10

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ну кроме KS есть ещё миллион tests for normal distribution, такой запрос тоже можно было сделать)

....я думал всегда что надо как-то на глаз смотреть..)..но да, нужно было спросить гугл : программа для определения нормальности выборки , что-то типо того, согласен

источник

01:09пожаловаться #11

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

не знаю, все равно до конца в голове не складывается.
Вот такая схема, если натренировать с буквами, какое у вас было бы ожидание, сработает на предикции слов или нет ?

Подожди, ты на вход даёшь, картинку слова, получаешь букву?

источник

01:37пожаловаться #12

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Чтобы детектить буквы, разбей слово на буквы и детекти буквы. 🤓

источник

01:39пожаловаться #13

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Подожди, ты на вход даёшь, картинку слова, получаешь букву?

да. Но я как бы и тренировал только буквы. Я пока пришел к выводу, что так как тренировал только центрированные буквы, то там attention вообще ничему не научился.
Я проверил эту гипотезу протестировав следующий случай на их оригинальной модели.

Взял слово из этих датасета, вырезал одну букву, и сделал ее "на весь экран", и их модель не смогла определить слово в размер одной буквы, хоть это sub_image картинки, которая у них в тренинге была.

источник

01:40пожаловаться #14

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Чтобы детектить буквы, разбей слово на буквы и детекти буквы. 🤓

вся тема, что даже они в своем подходе пишут, что нафиг разбивать на буквы даже чтобы тренить, что словами учить проще, потому что даты в мире больше.

источник

01:41пожаловаться #15

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

то есть задача разбития на буквы та еще )

источник

01:41пожаловаться #16

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

да. Но я как бы и тренировал только буквы. Я пока пришел к выводу, что так как тренировал только центрированные буквы, то там attention вообще ничему не научился.
Я проверил эту гипотезу протестировав следующий случай на их оригинальной модели.

Взял слово из этих датасета, вырезал одну букву, и сделал ее "на весь экран", и их модель не смогла определить слово в размер одной буквы, хоть это sub_image картинки, которая у них в тренинге была.

я думаю, что у меня также только наоборот, раз я натренировал только буквы и только в центре изображения.

источник

01:41пожаловаться #17

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

я думаю, что у меня также только наоборот, раз я натренировал только буквы и только в центре изображения.

попробую разбросать, натренить и посмотреть, эта была ли причина, то есть проблема в атрофированном detection, либо другая. Иначе придется сидеть слова лейбелить )))

источник

01:42пожаловаться #18

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

ну либо действительно думать как на буквы разделить

источник

01:43пожаловаться #19

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Думаю, легче найти датасет для слов... А в чем общая задача/цель? Просто ты описал свой процесс, но непонятно что в итоге надо? MNIST уже решенная задача вроде....

источник

01:44пожаловаться #20