Вместо предисловия. В этом посте вы сможете прочитать про принцип работы системы видеонаблюдения и распознавания лиц, который применяется в Минске. Весьма вероятно, что аналогичная задумка прорабатывается или уже действует в Москве. При этом хочу подчеркнуть, что у меня нет возможности выяснить, насколько описанная информация соответствует действительности. Далее — рассказ подписчика.
«Есть компания ***(прим. — здесь и далее информация скрыта, дабы исключить возможность идентификации). Она изначально российская, но одному из владельцев, Шатрову, стрельнуло перевести разработку в Минск, что он и сделал. Я работал там ***[долго и не так давно]. Есть система Кипод 2, которая точно работала в московском метрополитене, её проблема была в том, что она не масштабировалась. Мы делали систему Кипод 3, которая очень хорошо умела масштабироваться. Кипод 2 точно работал в московском метрополитене, Кипод 3 работает в Минске, мы его продали в Азербайджан, каким-то ещё нефтеносным товарищам с аравийского полуострова и прочим развитым демократиям. В Москве конкурс проиграли. Что система из себя представляет: во-первых, это сертифицированные камеры. Она не работает с лишь бы какими, только с соответствующими критериям. Где ставят Кипод, покупают правильные камеры.
Дальше это сервер, на котором развернуты сервисы, которые используются прикладным софтом в этом кластере, и так называемые «каналы». «Канал» — это контейнер в кубернетисе, к которому привязана камера. Там крутится какая-то нейронная сеть, которая умеет искать на изображениях «дескриптор» и события. Например, система умеет определить мордобой в метро, пересечение линии и узнать мою морду, если в систему внесен мой дескриптор.
Дескрипторы делались из нескольких фотографий под разными углами. Так, например, когда я спускался в минское метро, если система была настроена на поиск моего дескриптора, то на телефон кому надо приходило уведомление, что *** замечен на такой-то станции в такое-то время.
Тендер в Москве мы тогда проиграли какой-то российской фирме. Соответственно, если они уже развернули свою систему в Москве и камеры на столбах на высоте третьего этажа относятся к ней — то это, скорее всего, правильные камеры, которые имеют соответствующее разрешение и годятся для поиска людей. У нас, например, стояла такая камера на здании за много тысяч долларов, у неё было невероятное разрешение, и её вращением можно было управлять через админку.
У кого-то из наших русских конкурентов была идея индексировать фотки из ВКонтакте и строить дескриптор из них, я не знаю, удалось ли им это сделать и они ли выиграли тендер».
Это было о том, какие технические возможности существуют. Далее о проблемах, которые могут возникать при использовании такой системы для идентификации протестующих.
«Грубо говоря, система распознавания лиц должна работать в другую сторону. Кто-то совершил преступление, собрали все его фотки с камер, сляпали дескриптор, на котором будет низкая точность, и поставили его в розыск. Это помимо срабатывания на нужного человека даст ещё пару ложных срабатываний на на тех людей в толпе, что приемлемо при поиске преступника. Я думаю, что, даже если они оцифровали фотки в ВК, натравили это все на стримы с митингов, у них на выходе вышла не очень вразумительная каша.
А, ну и самое ж главное. Операция поиска дескриптора в видеопотоке не самая дешевая по производительности. Одно дело искать на камерах надцать преступников, и другое — пытаться распознать 20 тысяч человек по дескрипторам скольких-то там миллионов юзеров ВК. Это нужно отдельно разрабатывать кластер, покупать железо и ставить его выполнять этот поиск на записи митинга».
Вот такая информация. Лично мне показалось это весьма интересным.