Телеграмм чат группы datasciencechat страница 7092

Size: a a a

Data Science Chat

5162 membersпожаловаться на группу

2021 September 25

Nud1e in Data Science Chat

Ну а если апроксимировать по xmin, ymin, xmax, ymax в прямоугольник?

источник

21:11пожаловаться #1

ЯН

Ярослав Н in Data Science Chat

Ну фигня выходит, попробовали.
Там на одной камере зона где надо делать детект в форме буквы "т" , и область где не надо детектить получается большая и оттуда идут ложные тревоги

источник

21:21пожаловаться #2

MО

Miss Очепятка... in Data Science Chat

Вот вам ссылка для новичков:
https://livebook.manning.com/book/deep-learning-for-vision-systems/chapter-1

Manning

1 Welcome to computer vision · Deep Learning for Vision Systems

Components of the vision system · Applications of computer vision · Understanding the computer vision pipeline · Preprocessing images and extracting features · Using classifier learning algorithms

источник

21:43пожаловаться #3

MО

Miss Очепятка... in Data Science Chat

Там просто берется картинка пользователь выделяет прямоугольники. Сохраняются координаты прямоугольников.
Потом это все вырезается и маштабируется под стандартный размер получается куча кружок или птичек с разных ракурсов. Так же подбираются образцы для отрицательного подкрепления (не кружка/ не птичка) Это отдается на обучение НС. Где НС учится отличать птичку от не птички.
А далее тренировочные изображения отдаются на распознавания. Есть два подхода это скользящим окном или плиткой. Скользящим окном перебираются все координаты и копируются квадратики из большого изображения в маленькое. Которое подается в НС которая классифицирует птичка или не птичка. Если птичка то координата запоминается.
Медленный способ. Поэтому придумали использовать не скользящее окно, а сразу разделить все изображение сеткой на одинаковые квадраты - как плитка в ванной. И каждый такой кусочек подается на НС. На выходе выдаются координаты центра.
Для распознавания разных масштабов придумали Intersection over union (IoU) . Соседние координаты плитки группируются. Центр вычисляется как центр тяжести.
Используя точность предсказания оценивается точность укрупненного объекта. Затем ищутся локальные максимумы что-бы отфильтровать дублирующие ректы.

источник

22:07пожаловаться #4

MО

Miss Очепятка... in Data Science Chat

Очевидно самый простой способ. Очерчиваете AABB-rect вокруг вашего контура. Вырезаете нужный кусок или используете ROI подаете на распознавание. Полученные результаты просто фильтруете PointInPolygon
Или можно все лишнее закрасить белым или черным цветом

источник

22:10пожаловаться #5

ЯН

Ярослав Н in Data Science Chat

Можно доп комментарии, пожалуйста.
Что такое ROI?

источник

22:17пожаловаться #6

АШ

Арсений Шахматов... in Data Science Chat

регион интереса

источник

22:19пожаловаться #7

MО

Miss Очепятка... in Data Science Chat

Region Of Interesеt регион интереса или если сказать проще картинка в картинке. Фишка OCV которая позволяет не делать лишнее копирование.
https://robocraft.ru/blog/computervision/289.html

robocraft.ru

12. OpenCV шаг за шагом. ROI - интересующая область изображения / Компьютерное зрение / RoboCraft. Роботы? Это просто!

1. OpenCV шаг за шагом. Введение. 2. Установка. 3. Hello World. 4. Загрузка картинки. 5. Вывод видео 6. Ползунок

источник

22:20пожаловаться #8

АМ

Артур Мудрик... in Data Science Chat

Объяснение здорового человека, уф, огонь! Да, первый способ очевидный, так же очевидно, что он медленный пипецки.

источник

22:21пожаловаться #9

ЯН

Ярослав Н in Data Science Chat

Понял,спасибо

источник

22:22пожаловаться #10

АМ

Артур Мудрик... in Data Science Chat

Второй способ не понял — а если птичка попала на пересечение четырёх «плиток»?

источник

22:24пожаловаться #11

MО

Miss Очепятка... in Data Science Chat

Ну там НС тренируется на кусочках птичек по этому она тоже распознает. Вы, школьники это делают лучше, же можете своих близких распознать по носу или по глазам. Так же и искусственная НС работает.

источник

22:27пожаловаться #12

MО

Miss Очепятка... in Data Science Chat

Т.е. НС скажет что в 4 плитках по птичке. А далее дополнительными алгоритмами такими как IoU 4 объединятся в 1. Подробнее в книге что по ссылке выше в 7 главе.

источник

22:29пожаловаться #13

АМ

Артур Мудрик... in Data Science Chat

Огонь, да, ссылку видел, спасибо!

источник

22:29пожаловаться #14

Dmitry Belkevich in Data Science Chat

более того: так даже лучше результат, когда по части кота распознается весь. потому как не факт, что кот на картинке будет всегда весь

источник

22:47пожаловаться #15

Андрей in Data Science Chat