Size: a a a

Чат к каналу @begtin

2021 November 10

NK

ID:0 in Чат к каналу @begtin
В рубрике "как это устроено у них" в большинстве развитых стран и крупных международных институтах есть обязательная архивация всех материалов. Для научных учреждений это так называемые планы управления данными (DMP, Data management plan) и множество инициатив по георезервированию данных. А для органов власти и международных организаций - это национальные веб архивы.

Пример, веб-архив европейского союза EU Web Archive [1] создан и поддерживается The Publications Office of the European Union и в нём собраны архивы всех сайтов относящихся к органам управления Европейского союза, связанным с органами управления Европейского союза и получающими финансирование из бюджета Европейского союза.

Все архивы собраны через сервис Archive-It [2] собраны в 5 рубрик:
-  Brexit archive
-  European Union
-  Horizon 2020
-  Presidencies of the Council of the EU
-  Publications

Архивы собираются с марта 2019 года, охватывают 14 383 веб ресурса, большая часть которых относится к научной программе Horizon 2020.

Подобных национальных проектов по веб-архивации довольно много, об этом есть хороший обзор в Википедии [3]. Они носят, как утилитарный характер восстановления потерянной информации, так и являются инструментом общественного контроля благодаря которому можно убедиться что при смене власти предыдущие лица принимающие решения не "заметут следы" каких-то их действий.

А для тех кто любит работать с большими данными, напомню что есть такие проекты как HTTP Archive [4] веб архив для анализа данных, с интересными инсайтами и Common Crawl [5] поисковый индекс развернутый в облаке Amazon Web Services доступны через API для коммерческих и исследовательских проектов.

Ссылки:
[1] https://op.europa.eu/en/web/euwebarchive
[2] https://archive-it.org/home/euwebarchive
[3] https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives
[4] https://httparchive.org/
[5] https://commoncrawl.org/

#opendata #archives #webarchives #data
источник

NK

ID:0 in Чат к каналу @begtin
Я последние, наверное уже лет 16 интересовался и интересуюсь технологиями в госсекторе и в разных ролях создавал, проектировал, использовал государственные информационные системы и только в последние несколько лет ушёл в специализацию в данные, а раньше это были и госзакупки, и системы поддержки принятия решений и ещё много чего другого.

В России есть немало наработок которые реализованы вполне неплохо, но очень много есть мирового опыта который вообще никак не реализуется. Хуже всего дело обстоит с G2G проектами, в какой-то форме есть G2B и, как ни странно, но сервисы G2C (государственные услуги для граждан) работают лучше сервисов для бизнеса и для для других органов власти.

А я перечислю лишь некоторые проекты которые нужны другим органам власти и пока их нет в России на федеральном уровне:
- Сервис генерации статических госсайтов. Под мероприятие, под конкретный информационный сайт и тд. В США для этого используется платформа Federalist, в Сингапуре - Isomer. Его не надо делать обязательным, достаточно сделать его хорошо, а госорганы сами к нему придут - это быстрее и дешевле чем заказывать на рынке.

- Конструктор форм. На самом деле многие из очень типовых госуслуг реализуются через конструкторы форм. В государственном конструкторе должна быть предусмотрена авторизация через ЕСИА, а в остальном можно взять за пример сервис форм Яндекса или Google или многих стартапов. В Сингапуре есть такой сервис - forms.gov.sg

- Платформа API. Есть в США, Сингапуре, Канаде, Франции и ещё паре десятков стран. Систематизирует документацию и регламенты доступа к государственным API. Подсказка - в России сотни (!) недокументированных API. Через них поступают многие данные в наш каталог Datacrafter'а. Такие платформы всё более актуальны, они являются частью систематизации информационных ресурсов государства.

- Платформа [мета]данных. То чем в России мог бы быть портал открытых данных и то чем он, к сожалению, не является. Системы управления госданными в мире имеют как минимум 2 контура - открытые данные и данные по результатами инвентаризации в госоргане. По хорошему это должно было бы быть частью национальной системы управления данными.

- Сервис и реформа технической документации. Такое есть в Сингапуре, США, на тех же сервисах генерации статических сайтов. А из примеров недалёких от нас - это система документирования в Италии docs.italia.it. Всё редактируется в Markdown, можно скачивать и в других форматах. Удобно искать, удобно писать, удобно с этим работать. Это не только сервис, но и реформа требований к сдаче контрактной документации и предоставления документации пользователям. До сих пор по многим системам документация - это тысячи (!) страниц нечитабельного текста.

- Системы автоматического мониторинга (в том числе безопасности). Например проект Pulse в США, для мониторинга актуальности протоколов TLS/SSL на официальных сайтах органов власти. До недавних пор был открыт для всех, потом его закрыли, видимо из-за опасений в адрес "русских/корейских/китайских хакеров". Необходимый сервис и не только в части SSL, но и регулярного официального сканирования безопасности публично доступной инфраструктуры органов власти.

- Сервисы статуса доступности сайтов/онлайн сервисов. В коммерческом рынке это сервисы вроде status.com, в госпроектах такое тоже начинают применять и разрабатывать унифицированные сервисы охватывающие все госресурсы. Тот же Pulse умел не только сканировать TLS соединения, но и отслеживать доступность.

- Официальные счетчики посещаемости. В мире есть сильное давление на органы власти чтобы они не сливали сведения о посетителях госсайтов компаниям Adtech. Поэтому есть много противодействия тому что органы власти ставят счетчики Google, Facebook и далее по списку. Для госсайтов делают унифицированные счетчики в ведении органа власти и аналитика собирается только в них и отдаётся представителям госорганов. В США это analytics.usa.gov, сделаный специально под высоконагруженные сайты, но можно взять и один из открытых продуктов и использовать его.
источник

NK

ID:0 in Чат к каналу @begtin
- Единый дизайн-гайд. Тема как-то помершая в России, хотя и были попытки. Во многих странах госсайты сделаны "безобразно и единообразно" по одному дизайн гайду. Хорошо документированному, открытому, сопровождаемому, удобному и тд. Это полезный инструмент, будучи хорошо сделанным он будет применяться без принуждения.

- Единый портал. Довольно давняя тема внедряемая во многих странах. Логика такая - правительство вцелом, отдельные органы власти тратят слишком много ресурсов на многочисленные веб-сайты. Нет никакого обоснования тому что их сотни и тысячи. В мире есть большие инициативы вроде gov.uk или usa.gov или gov.pl и ещё десятков других когда сервисы и сайты органов власти сконцентрированы на одном корневом ресурсе. В России эту функцию частично решает портал госуслуг, но только частично. А вот портал gov.ru выглядит просто таки архаично.

Это не полный перечень, сюда можно добавить ещё довольно многое, я могу расписать несколько десятков показательных и полезных сервисов только навскидку, а если покопаться в записях то сотни. Если хотя бы часть из перечисленного будет появляться и появляться в хорошом виде на платформе Гостех, значит от этой платформы будет ощутимая польза. Если нет, ну что ж, подождём следующей плаформы:)

#govtech #government #technology #data #datamangement #api
источник

ОС

Ольга Соколова... in Чат к каналу @begtin
У нас очередные амбиции под названием Стратегическое направление цифровой трансформации -  Распоряжение Правительства РФ от 22 октября 2021 г. N 2998-р
Какое, однако, странное название, почему все слилось в одну Дорогу
источник

ОС

Ольга Соколова... in Чат к каналу @begtin
Г ту Г
источник

IB

Ivan Begtin in Чат к каналу @begtin
Идея то там разумная, вопрос как всегда в реализации и как сочетать нацпроекты, госпрограммы и инициативы с этим всем
источник

NS

Nikita Snegirev in Чат к каналу @begtin
Может знаете что-то интересное об украинском опыте gov.ua ?
источник

IB

Ivan Begtin in Чат к каналу @begtin
Ничего особо не знаю, не изучал его. Из украинского опыта самым интересным остаётся Prozorro, остальное как-то не впечатляло пока что
источник
2021 November 11

М

МГ in Чат к каналу @begtin
Вы слышали о Госвебе?
источник

IB

Ivan Begtin in Чат к каналу @begtin
Конечно и писал о нем когда он был
источник

ГМ

Григорий Машанов... in Чат к каналу @begtin
там тоже зоопарк, но мб Минцифры что-то сейчас делает по этому поводу
источник

AG

Artem Geller in Чат к каналу @begtin
:( эх
источник

S

Svyazist in Чат к каналу @begtin
https://novayagazeta.ru/articles/2021/11/10/perepischikam-naseleniia-razreshili-sobirat-dannye-o-rossiianakh-u-ikh-sosedei-liubymi-sposobami-news
Это не перепись, а какая-то профанация. Сама идея, что переписчики обойдут все дома так себе, да кто их будет сидеть и ждать?
источник

S

Svyazist in Чат к каналу @begtin
📺 Цены на интернет и ТВ в России могут повысить на 10%

Причины подорожания - увеличение цен на оборудование, инфляция и действие «закона Яровой».
источник

NK

ID:0 in Чат к каналу @begtin
Почему я делаю акцент на финансировании Большой российской энциклопедии? Потому что вот уже пару месяцев пишут про большой проект портала "Знание" на её основе. Можно почитать октябрьскую публикацию на сайте РАН [1] о первом заседании научно-редакционной коллегии портал «Знания» , который привлечет до 10 тыс. экспертов.

Об этом портале есть короткая заметка в Википедии [2] и, если кратко, то только за 2019-2021 годы на портал  потратили более 1.5 миллиардов рублей, а всего запланировано до конца 2022 года потратить 2.5 млрд рублей. При этом, напомню, за 3 года финансирования у него нет никаких публичных результатов, само ОАО БРЭ непрозрачно, а за 2021 год нет каких-либо следов контрактации ОАО БРЭ, а все расходы идут, если верить отчетности, на содержание коллектива (в лучшем случае это на производство контента) [3].

Если почитать интервью Сергея Кравец в РГ [4], то очевидно что это не технологический, а контентный проект. Не автоматическая интеграция и сведение баз данных, а претензия на ручную актуализацию до 40 тысяч статей ежегодно.

Ключевые вопросы во всем этом в том что:
1. Какие модели создания востребованного контента сейчас актуальны в мире и могут использоваться? Это требует как минимум исследования, но и без него видно что выживают, в основном, модели краудсорсинговые, а не энциклопедические. Практически все существующие классические энциклопедии мертвы, оживить их уже невозможно.
2. Какие формы потребления контента необходимы для молодежи? Есть как минимум предположение что игровой контекст для потребления знаний стал первоочередным. Edutainment за пределами образовательного процесса как минимум.
3. Какова связь знаний и образования? Предполагается ли навязать портал Знания в образовательный процесс? Тогда его надо сразу было передавать в какое-нибудь издательство Просвещение или в Минпросвет РФ, а не в БРЭ.

Для понимания, доход фонда Викимедия составляет 129 миллионов долларов за 2020 год [5] из которых 120 миллионов это пожертвования читателей, компаний и НКО. Это 7 миллионов жертвователей из которых 17 пожертвовали более $50 000 (более 3.5 миллионов рублей каждый). Там нет бюджетных средств, только средства доноров.

Можно ли создать аналог Википедии в России? Честно говоря я не очень в это верю, поскольку такие проекты - это, в первую очередь, очень мотивированные люди которые хотели бы именно его создать, а не участвовать более крупных международных проектах. Но если это делать, то нужна как минимум схожая модель существования. Софинансирование от граждан, статус НКО, получение удобным образом налогового вычета с пожертвований, возможность личного участия и современные технологии помноженные на репутацию команды которая могла бы такое создать.

Поэтому повторюсь это скорее, невозможно. Можно ли потратить лучшим образом те 2.5 миллиарда рублей что тратят на портал "Знания"? Да, конечно возможно. Даже если раздавать субсидии производителям игр с популяризацией знаний и НКО с просветительскими проектами - эффект был бы куда больше. Он, в принципе, был бы.

А в текущей форме портал Знания не сможет существовать без регулярного бюджетного допинга на эти самые "40 тысяч правок статей в год и 10 тысяч привлекаемых экспертов", о чем просто нельзя говорить без иронии, поскольку за каждой из них слышно только одно "дайте больше денег" при отсутствии гарантии чего бы то ни было.

Всё это на фоне того что на современные просветительские проекты найти в стране финансирование очень сложно, государственные средства уходят на проекты вроде портала "Знания", а частные и корпоративные доноры предпочитают финансировать проекты прямой помощи детям, старикам, бездомным и тд.
источник

NK

ID:0 in Чат к каналу @begtin
И я не могу не добавить и не акцентировать на закрытости всей этой истории. Вот мы знаем что у портала "Знания", оказывается, есть Научно-редакционная коллегия портала, а как это она есть, а портала нет? Где её состав? Где протоколы заседаний? А Дмитрий Чернышенко, оказывается, председатель Совета Портала «Знания». А где можно почитать положение об этом совете? Его состав? И, простите, я буду зануден, протоколы заседаний совета ? Вообще Дмитрий Чернышенко знает во что ввязался? Думается мне догадывается, иначе присутствовал бы на мероприятии лично, а не направлял бы письмо его участникам.

Многим уже понятно что когда портал Знания будет запущен весной 2022 года, то он получит очень много публичной критики, по всем тем причинам что я озвучивал выше и, с высокой вероятностью, может не пережить 2022 год. Но деньги то уже будут потрачены и это ещё большой вопрос какая их доля пойдет на этих 10 тысяч экспертов.

Ссылки:
[1] http://www.ras.ru/news/shownews.aspx?id=b2fbc33e-71bb-4f9d-8d47-8afe983cfd01
[2] https://ru.wikipedia.org/wiki/Знания
[3] https://t.me/begtin/3236
[4] https://rg.ru/2021/10/19/v-rossii-sozdaetsia-pervyj-v-mire-enciklopedicheskij-portal.html
[5] https://wikimediafoundation.org/about/annualreport/2020-annual-report/financials/

#budget #znanie #spending
источник

K

Kvg in Чат к каналу @begtin
Сейчас федеральная забава новая развивается. Замена токарных станков в ПТУ на цифровые симуляторы станков с ЧПУ. Обязательное условие - станок должен быть сдан на лом и уничтожен. Офттоп конечно, но самую малость.
источник

Aртем Салтанов... in Чат к каналу @begtin
Ну, люди есть, создававшие wiki.traditio, например. Другое дело, что они вам лично могут не нравиться.
источник

IB

Ivan Begtin in Чат к каналу @begtin
Тут вопрос не моих симпатий - пусть растёт 100 цветов
источник

K

Kvg in Чат к каналу @begtin
Вопрос не в людях. Вопрос в институте "экспертов"...А там такие течения глубокие, что этот портал снежинка на вершине айсберга.

Википедия создавалась энтузиастами и эксперты позже подключились плавненько введя там цензуру.

Представляете, что российские эксперты пойдут писать на "традицию", пусть даже и  с перспективами цензурировать? Я нет)
источник