Не так давно я писал про американскую программу
«Palantir», которая решает комплексные задачи по объединению различных полицейских баз данных, их анализу и прогностике появления тех или иных криминальных событий в конкретных районах и у конкретных людей.
И вот 5 дней назад
Медуза порадовала великолепным обзором подобных программ в РФ.
А у нас все не менее круто. Разработками таких систем у нас занимается целый Научный центр при АП РФ.
Это системы:
- «ПСКОВ» - Поисковая система категории особой важности, способная извлекать даже данные из анонимной сети Tor,
- «Шерлок», система способная деанонимизировать практически любого человека всего по нескольким параметрам его персональных данных,
- Посейдон – система мониторинга протестной активности,
- Медиамонитор, анализирующий социальные сети по весьма специфическим запросам.
Кому интересна эта тема, рекомендую почитать
источник в Медузе, это займет у вас минут 30.
Демонстрацию системы «Шерлок» я лично видел на одной приватной встрече руководителей служб безопасности нескольких крупнейших компаний РФ зимой прошлого года. И она меня сильно впечатлила: поэтому то, что написала Медуза – правда.
Интересно, что вместе с вот этими инициативами все складывается в весьма масштабную систему:
1)
Осенью этого года Московское правительство в проведет конкурс на подключение 105 тыс. камер наблюдения к системе распознавания лиц. Если проект будет реализован, в городе появится одна из крупнейших в мире система слежения. По данным издания, в конкурсе могут принять участие три компании — «Центр речевых технологий» и VisionLabs, доли в которых принадлежат Сбербанку, и NTechLab, совладельцем которой является Ростех. Подробнее
здесь.
2)
Никаких обезличенных данных на самом деле не существует и определить и найти человека даже по малой части его данных – довольно простая штука.
Вот, к примеру, в опубликованной журналом Nature Communications
статье утверждается,
что знания персональных данных совсем не обязательно, чтобы понять, о ком именно в базе данных идет речь. Собрав всего три показателя, например, почтовый индекс, дату рождения и пол, можно сузить поиск до очень небольшого круга лиц. А при наличии 15 показателей, собранных из баз данных с социально-демографическими характеристиками людей, опросов и медицинских баз, можно точно определить конкретного человека.
Хотя это и так очевидно всем, кто работает в интернете 😀
Тем временем у нас никаких ученых, исследователей или общественных активистов на высокие заседания, где вершится судьба данных на десятилетия вперед, никто не зовет. Тихо,
спокойно и без лишнего внимания Ассоциация больших данных, в которую входят Сбербанк, Газпромбанк, «Яндекс», Mail.Ru Group, «Ростелеком», «Мегафон», сама решает, как им с ними поступить. А именно: разрешить использовать данные без согласия в целях, которые им покажутся важными. Дескать, получить согласие десятков миллионов клиентов, абонентов и пользователей интернет-ресурсов просто невозможно. Да и использоваться будут не персональные, а «обезличенные данные».
3) Настойчивые
предложения депутатов ввести идентификацию e-mail всех пользователей. Это уже, конечно, зашквар. Идея, - чтобы государство гарантированно знало, что данным почтовый ящик принадлежит именно вам и имело к нему щелочку для подсматривания и чтения вашей переписки.
4) Налоговиками
создается база со всеми данными граждан — от ФИО до родственных связей. Одна из целей — улучшить собираемость налогов.
В общем, в этой теме мы если не впереди планеты всей, то уж точно не отстаем. Вот только нужно определиться: это хорошо или плохо. Или, точнее для кого это хорошо, а для кого - плохо.
#технологии, #программы, #ИИ, #цифровойпрофайлинг, #персональныеданные, #криминалистика, #безопасность, #профайлинг, #ProProfiling, #Филатов