Телеграмм чат группы alukatsky страница 192

138422:09пожаловаться #1

2021 April 03

Хотите "убить" свой комп или комп своего коллеги? Пусть откроют файл со списком лицензиатов ФСБ с сайта регулятора - https://t.co/KwC7PZM55R Всего 1,5 Мб, в которых скрывается 1985 страниц (откуда в стране столько лицензиатов ФСБ???), открытие которых "убивает" Word :-(
— Alexey Lukatsky (@alukatsky) April 2, 2021

Я всё искал живые примеры того как хорошо/плохо построена работа с данными и сколько иллюзий у граждан/бизнеса/пользователей. Многие, например, думают что госорганизации публикуют плохие данные специально, а где-то внутри и тайно хранят и используют хорошие. Такое бывает очень редко, а чаще миром правит худоумие, а не хитроумие. О многих историях об этом написать нельзя по разным причинам, но о каких-то публичных и общедоступных более чем необходимо.

Рассмотрим пример, Центр по лицензированию, сертификации и защите государственной тайны ФСБ России [1] в открытом доступе публикует 4 реестра [2], все в формате .docx файлов:
- Реестр лицензий на деятельность, связанную с шифровальными (криптографическими) средствами
- Реестр лицензий на деятельность по разработке и производству средств защиты конфиденциальной информации
- Реестр лицензий на деятельность по выявлению электронных устройств
- Реестр лицензий на деятельность, связанную с оборотом СТС

Среди них, первый реестр, лицензий на деятельность, связанную с шифровальными (криптографическими) средствами - это файл MS Word (.docx) состоящий из одной таблицы в 1985 страниц и 4880 записи. Алексей Лукацкий ранее писал что этот файл с коллосальным трудом открывается, действительно, это аномально вести реестр таким образом. Для тех у кого не получится его открыть, я когда-то делал специальную утилиту docx2csv [4], она умеет вытаскивать таблицы из .docx файлов и сохранять их как серию файлов CSV или один XLSX.

Поэтому то что этот и остальные реестры публикуются в docx формате - это проблема, но проблема скорее культурная. Если бы в центре реально хотели делать это максимально вредным способом то публиковали бы реестр в виде отсканированного PDF файла с утверждающей подписью руководителя и аргументами что "только так можно дать ему юридическую значимость". Но, слава Богу, это не наш случай. Наш случай - это культура ведения реестра.

Сравнительно недавно я делал другую утилиту для командной строки, undatum [5] специально для разного рода операций преобразования и проверки данных и с её помощью регулярно проверяю разного рода официальные реестры на достоверность самых базовых реквизитов ИНН и ОГРН. Причём на уровне самой-самой простой проверки на валидность, даже без поиска по ЕГРЮЛ, проверки соответствия наименованию, кросс-валидации и так далее.

Так вот из 4880 записей у 191 (3,9%) недостоверные сведения в поле ОГРН и у 120 (2.4%) недостоверные сведения в поле ИНН. Чаще это отсутствие кода, реже это неверно введённые коды. Всего есть 16 организаций в сведениях о которых нет указаний на их коды ИНН и ОГРН одновременно. Причём все они не секретны, у многих, например, АО КБ "Хлынов", есть другие лицензии в этом же реестре и при этом заполненные реквизитами.

Являются ли эти данные достоверными? Где совершена ошибка: при их внесении, при подаче заявки на лицензию заявителем или, быть может, логичнее предположить ещё на этапе организации ведения реестра. Если он ведётся даже не в Excel и уж точно для него нет даже самой простой системы ведения реестров, если у него нет синхронизации и проверки с ЕГРЮЛ, если у него нет регламента ведения и так далее, то в нём как и в сотнях других реестров государства и опубликованных данных - будут ошибки. Эти ошибки накапливаются и итоговые системы принятия решений основанные на этих данных дают значительные искажения.

Напомню что я писал о подобных случаях с реестрами Минюста, Минцифры, Минэкономразвития, Федерального Казначейства и других органов власти. Качество данных государства - это общая проблема, пока мало кем решённая.

Ссылки:
[1] http://clsz.fsb.ru
[2] http://clsz.fsb.ru/clsz/license.htm
[3] https://t.me/alukatsky/3880
[4] https://github.com/ivbeg/docx2csv
[5] https://github.com/datacoon/undatum

#opendata #dataquality #registries

Пост Лукацкого

96613:01пожаловаться #2

Extracts tables from .docx files and saves them as .csv or .xls files - ivbeg/docx2csv

Иван Бегтин разработал утилиту https://t.co/3wRGo2XQ4T которая вытягивает таблицы из DOC и конвертит их в CSV или XLSX
— Alexey Lukatsky (@alukatsky) April 3, 2021

GitHub

ivbeg/docx2csv

84516:09пожаловаться #3

2021 April 05

Федеральная служба по техническому и экспортному контролю (ФСТЭК России)
fstec.ru

Неофициальный канал.

По всем вопросам: @GovInfoBot

У ФСТЭК, оказывается, есть свой канал в Телеге - https://t.co/H2qYDFTu4z Правда, там идет репост новостей с сайта и какие-то случайные и местами рекламные ссылки, которые регулятор врядли бы сам постил. Так что предположу, что аккаунт ненастоящий pic.twitter.com/LAoPvoRye9
— Alexey Lukatsky (@alukatsky) April 5, 2021

ФСТЭК России

127013:09пожаловаться #4

RIGF 2021. Российский форум по управлению Интернетом.

В воскресенье, на молодежном RIGF, запилил презу про атрибуцию кибератак, ее возможность, методы, отличия обывательского понимания атрибуции и юридического, и вот это вот все... В пятницу буду модерировать дискуссию на взрослом RIGF (https://t.co/7SMSvXo1RC) про это pic.twitter.com/vLcAKXrkwD
— Alexey Lukatsky (@alukatsky) April 5, 2021

rigf.ru

109815:10пожаловаться #5

99715:52пожаловаться #6

2021 April 06

Запилил еще одну презу для одного закрытого мероприятия - про методику оценки угроз ФСТЭК. Вот не зря говорят, когда учишь, у самого в голове картинка становится четче :-) В очередной раз прочтя методику, высветилось еще ряд темных пятен и нерешаемых без автоматизации задач :-( pic.twitter.com/8ETvVoA2h0
— Alexey Lukatsky (@alukatsky) April 6, 2021

197423:09пожаловаться #7

2021 April 07

Прямо сейчас я должен выступать на мероприятии GlobalCIO и рассказывать о пошаговом плане построения ИБ в крупной организации. Соответственно и про ФСТЭК с ЦБ, и про CIS Controls, и про фреймворки ИБ, и про архитектуру ИБ, и вот про это вот все... pic.twitter.com/1ka2hT32mI
— Alexey Lukatsky (@alukatsky) April 7, 2021

196811:09пожаловаться #8

Еще можно продавать последовательности числа Пи в качестве одноразовых паролей https://t.co/fntnDnnaJv
— Alexey Lukatsky (@alukatsky) April 7, 2021

188712:09пожаловаться #9

https://meduza.io/feature/2021/04/06/boites-zabyt-slozhnyy-parol-ili-poteryat-token-vam-pomogut-igralnye-kosti-dlya-dvuhfaktornoy-autentifikatsii-da-da-samye-nastoyaschie-kosti

Meduza

Боитесь забыть сложный пароль? Или потерять токен? Вам помогут «игральные» кости для двухфакторной аутентификации (да-да, самые настоящие кости!) 🎲 ➡️ 🔑 — Meduza

DiceKeys — набор уникальных криптографических кубиков. Недавно создатели начали рассылать его первым людям, поддержавшим проект. С помощью такого набора кубиков и специального приложения можно создавать надежные пароли и запасные копии токенов для двухфакторной аутентификации. Кубики даже внешне отличаются от обычных игральных: на них нанесены не только цифры, но и буквы, а также специальные значки для коррекции ошибок при сканировании приложением. На первый взгляд, набор выглядит как игрушка для гиков, хотя освоить его очень просто. «Медуза» протестировала DiceKeys и объясняет, как он работает.

199212:15пожаловаться #10

2021 April 08

Центр компетенций НАТО по ИБ запустил ресурс для юристов с разбором 19 сценариев инцидентов и их юридическим разбором - https://t.co/Jf0DLyZ8G3
— Alexey Lukatsky (@alukatsky) April 8, 2021

201913:09пожаловаться #11

Facebook data leak publicly available | CERT NZ

Новозеландский CERT выпустил простое описание с рекомендациями по ситуации с утечкой Facebook - https://t.co/ntzMt6pfxK По мне, так работы на полчаса. Но у нас ни ФСТЭК, ни ФСБ (НКЦКИ), ни РКН, ни МВД, не сделали ничего подобного ;-( Вот оно реальное отношение к ИБ граждан страны
— Alexey Lukatsky (@alukatsky) April 8, 2021

CERT NZ

User data from half a billion Facebook accounts has been publicly posted, containing name, date of birth, phone numbers, email addresses.

187413:09пожаловаться #12

Наверное одно из долгожданных решений Cisco Duo с 12 апреля начинает продажи в РФ. Теперь можно совместить 2FA корпоративного уровня с контролем устройств по ZeroTrust. Поставил себе на пробу на домашний и рабочий комп. Настроил политики. Все очень… https://t.co/MKn7YeTuDh pic.twitter.com/fzRi7D2XtR
— Sergey Borisov (@sb0risov) April 7, 2021

186214:10пожаловаться #13

met_doc_2021.02.05.docx

(1.89 Мб)

Если вдруг кому-то нужна методика оценки угроз ФСТЭК в формате DOCX, а не PDF, то вот

200314:44пожаловаться #14

По поводу "утечки" (или, как утверждает сам Фейсбук, особенностей настройки API-вызовов платформы) хочется отметить, что там не только имя, e-mail и телефон. pic.twitter.com/lxhrpJlo1m
— Alexey Lukatsky (@alukatsky) April 8, 2021

По поводу "утечки" (или, как утверждает сам Фейсбук, особенностей настройки API-вызовов платформы) хочется отметить, что там не только имя, e-mail и телефон.

186815:10пожаловаться #15

Там также утекли дата рождения (привет, фишинг про скидки в день рождения) и имя работодотеля (привет, фишинг от имени работодателя про изменения в трудовые договора, смену врача-куратора по ДМС, прибавку к зарплате в размере инфляции и т.п.).
— Alexey Lukatsky (@alukatsky) April 8, 2021

192015:10пожаловаться #16

Список_тактик_и_техник_из_ММУ_ФСТЭК.xlsx

(22.57 Кб)

Забацал еще отдельный файлик со всеми тактиками и техниками из методики оценки угроз ФСТЭК в более привычном, "столбцовом" формате матрицы MITRE ATT&CK

226817:49пожаловаться #17

https://t.co/xSkoirXJ9R - Забацал еще отдельный файлик со всеми тактиками и техниками из методики оценки угроз ФСТЭК в более привычном, "столбцовом" формате матрицы MITRE ATT&CK. В формате Excel
— Alexey Lukatsky (@alukatsky) April 8, 2021

Пост Лукацкого

201618:09пожаловаться #18

Переживаю за авторов канала SecAtor. Такими темпами, по анализу текстов их заметок, скоро их смогут вычислить и предать огласке их имена!

185018:15пожаловаться #19

A $2 Billion Government Surveillance Lab Created Tech That Guesses Your Name By Simply Looking At Your Face

Forbes рассказывает про оригинальный НИОКР американского исследовательского центра The MITRE Corp., разрабатывающего различные технологии в интересах американского правительства, в том числе военного характера (и для кибервойн тоже).

Финансирование MITRE внушительное - 2 млрд. долларов в год. Имея такое серьезное денежное обеспечение исследователи могут изучать не вполне традиционные вещи, что они и сделали.

MITRE на основе машинного обучения и больших данных разработали технологию определения имени человека по его лицу. Основой для исследования послужила работа израильских ученых из Еврейского университета в Иерусалиме, которые в серии экспериментов обнаружили, что вероятность того, что человек угадает имя другого человека значительно выше чем должна была бы быть статистически и сделали вывод, что имя, являясь первой и основной социальной меткой личности, каким-то образом влияет на ее внешность.

Сотрудники MITRE обучили нейросеть на базе из 13 тыс. изображений человеческих лиц и добились точности угадывания имени от 72 до 80,5%. Логично предположить, что если бы база была больше, то и точность угадывания была бы выше. Более того MITRE предполагает использование этой технологии и в обратную сторону - выбор наиболее соответствующего имени изображения из представленного набора.

Можно было бы пошутить, но мы не будем. Потому что это именно то, что называется "выявлением скрытых закономерностей" и что должно стать новым философским камнем в эпоху Big Data. И это может существенно улучшить уровень жизни на всем земном шаре, поскольку может быть применено буквально во всех сферах человеческой жизни - от медицины до открытия новых физических принципов.

Но это в возможном ближайшем будущем. А пока Big Data используется для оценки проходимости торговых точек в интересах маркетологов (чтобы их так-разэтак).

Forbes

The ‘Dorian Gray effect,’ wherein your face can apparently give away clues as to your name, has been adopted by a U.S. government contractor for use in facial recognition applications.