Size: a a a

Чат к каналу @begtin

2021 January 13

MD

Maxim Dubinin in Чат к каналу @begtin
ID:0
В догонку про геоданные и их доступность, Максим Дубинин из NextGIS поделился статистикой их проекта [1] облачного, не государственного, сервиса российского происхождения и международной аудиторией:
- 2.1 млн скачиваний клиента для QGIS, 0.7 за последний год
- 1800+ сервисов
- 1000 авторов сервисов из 50 стран.

Максим был одним из основателей ГИС Лаборатории [2], одного их первых сообществ по открытым геоданным в России. А NextGIS - это пример коммерческого проекта на открытых данных и с открытым кодом для общественной пользы.


Ссылки:
[1] https://www.facebook.com/maxim.dubinin/posts/10111830597349957
[2] https://gis-lab.info/

#opendata #tech #opensource
а непонятно, чего скачке там делать, это ж про сервисы/протоколы/api и qms, а не про "саспланету"
источник
2021 January 14

G

Gip24 in Чат к каналу @begtin
- ИРИ провел анализ 11 тысяч порталов госорганов и выявил, что 12% из них содержат более 100 ошибок, а еще 43% - от 30 до 100 ошибок.

https://ири.рф/news/784
источник

G

Gip24 in Чат к каналу @begtin
источник

G

Gip24 in Чат к каналу @begtin
Утвердить:
- требования к форматам копий нормативных правовых актов субъектов Российской Федерации и сведений об источниках их официального опубликования, представляемых в Министерство юстиции Российской Федерации в электронном виде для включения ‎в федеральный регистр (Приложение № 2);
- методику ведения федерального регистра муниципальных нормативных правовых актов и порядок предоставления сведений
‎из него (Приложение № 3);

https://regulation.gov.ru/p/112258
источник

NK

ID:0 in Чат к каналу @begtin
Lichess [1], бесплатный сервер с открытым кодом для игры в шахматы, основан в 2010 году французским программистом Тибо Дюплесси [2] предоставляет открытые данные по всем играм начиная с января 2013 года [3].

Открытые данные объёмом 434 гигабайта в сжатом виде охватывают 1.7 миллиарда партий. Данные можно скачать напрямую файлами или через торрент, они представлены в PGN формате [4], стандарте публикации шахматных записей ещё с 1993 года.

А в декабре к этим данным добавились данные шахматных паззлов [5], пока небольшого объёма.

Все данные доступны под лицензией Creative Commons Zero.

И, вдогонку, для тех кто интересуется шахматами, существует также, база PGNMentor с играми крупнейших игроков и с крупнейших турниров [6] с охватом, как минимум, с 1886 года.

Ссылки:
[1] https://lichess.org/about
[2] https://ru.wikipedia.org/wiki/Lichess
[3] https://database.lichess.org/
[4] https://en.wikipedia.org/wiki/Portable_Game_Notation
[5]   https://lichess.org/blog/X-S6gRUAAGjNX4ki/new-puzzles-are-here
[6] http://www.pgnmentor.com/files.html

#opendata #chess
источник

R

Robokot in Чат к каналу @begtin
ID:0
Lichess [1], бесплатный сервер с открытым кодом для игры в шахматы, основан в 2010 году французским программистом Тибо Дюплесси [2] предоставляет открытые данные по всем играм начиная с января 2013 года [3].

Открытые данные объёмом 434 гигабайта в сжатом виде охватывают 1.7 миллиарда партий. Данные можно скачать напрямую файлами или через торрент, они представлены в PGN формате [4], стандарте публикации шахматных записей ещё с 1993 года.

А в декабре к этим данным добавились данные шахматных паззлов [5], пока небольшого объёма.

Все данные доступны под лицензией Creative Commons Zero.

И, вдогонку, для тех кто интересуется шахматами, существует также, база PGNMentor с играми крупнейших игроков и с крупнейших турниров [6] с охватом, как минимум, с 1886 года.

Ссылки:
[1] https://lichess.org/about
[2] https://ru.wikipedia.org/wiki/Lichess
[3] https://database.lichess.org/
[4] https://en.wikipedia.org/wiki/Portable_Game_Notation
[5]   https://lichess.org/blog/X-S6gRUAAGjNX4ki/new-puzzles-are-here
[6] http://www.pgnmentor.com/files.html

#opendata #chess
Pgnmentor не знал, спасибо!
источник

GG

George Glebov in Чат к каналу @begtin
ID:0
Lichess [1], бесплатный сервер с открытым кодом для игры в шахматы, основан в 2010 году французским программистом Тибо Дюплесси [2] предоставляет открытые данные по всем играм начиная с января 2013 года [3].

Открытые данные объёмом 434 гигабайта в сжатом виде охватывают 1.7 миллиарда партий. Данные можно скачать напрямую файлами или через торрент, они представлены в PGN формате [4], стандарте публикации шахматных записей ещё с 1993 года.

А в декабре к этим данным добавились данные шахматных паззлов [5], пока небольшого объёма.

Все данные доступны под лицензией Creative Commons Zero.

И, вдогонку, для тех кто интересуется шахматами, существует также, база PGNMentor с играми крупнейших игроков и с крупнейших турниров [6] с охватом, как минимум, с 1886 года.

Ссылки:
[1] https://lichess.org/about
[2] https://ru.wikipedia.org/wiki/Lichess
[3] https://database.lichess.org/
[4] https://en.wikipedia.org/wiki/Portable_Game_Notation
[5]   https://lichess.org/blog/X-S6gRUAAGjNX4ki/new-puzzles-are-here
[6] http://www.pgnmentor.com/files.html

#opendata #chess
Опечатка: "по по всем играм"
@ibegtin
источник

K

Konst. in Чат к каналу @begtin
ID:0
Lichess [1], бесплатный сервер с открытым кодом для игры в шахматы, основан в 2010 году французским программистом Тибо Дюплесси [2] предоставляет открытые данные по всем играм начиная с января 2013 года [3].

Открытые данные объёмом 434 гигабайта в сжатом виде охватывают 1.7 миллиарда партий. Данные можно скачать напрямую файлами или через торрент, они представлены в PGN формате [4], стандарте публикации шахматных записей ещё с 1993 года.

А в декабре к этим данным добавились данные шахматных паззлов [5], пока небольшого объёма.

Все данные доступны под лицензией Creative Commons Zero.

И, вдогонку, для тех кто интересуется шахматами, существует также, база PGNMentor с играми крупнейших игроков и с крупнейших турниров [6] с охватом, как минимум, с 1886 года.

Ссылки:
[1] https://lichess.org/about
[2] https://ru.wikipedia.org/wiki/Lichess
[3] https://database.lichess.org/
[4] https://en.wikipedia.org/wiki/Portable_Game_Notation
[5]   https://lichess.org/blog/X-S6gRUAAGjNX4ki/new-puzzles-are-here
[6] http://www.pgnmentor.com/files.html

#opendata #chess
Спасибо! Нужно ментора изучить.
источник

K

Konst. in Чат к каналу @begtin
ID:0
Германские исследователи Corinna Kroeber и Tobias Remschel собрали набор данных всех публикаций Германского парламента (Бундестага) с 1949 по 2017 годы и опубликовали в формате удобном для последующей текстовой обработки языком R - " Every single word - A new dataset including all parliamentary materials published in Germany " [1]. Объём набора данных в сжатом виде около 1.2 гигабайт и более 131 тысячи документов включающих текст, даты, сведения об авторах и тд.

Этот набор данных скомпилирован из ранее публиковавшихся материалов германского парламента [2].

Итоговая научная работа на основе этих данных вышла в издании Government and Opposition [3] в декабре 2020 года.

Ранее, другие исследователи, Christian Rauh и Jan Schwalbach, публиковали набор данных The ParlSpeech V2 data [4] включающем 6 миллионов выступлений в парламентах 9 стран за периоды от 21 до 32 лет и общий объём набора данных составляет 8.5 гигабайт в сжатом виде.

Обращу внимание на хорошую подготовку этих наборов данных, детальное описание всех метаданных, не избыточное, не недостаточное, а ровно необходимое документирование и привязку к научным исследованиям в рамках которых данные наборы данных создаются.

Эти данные публикуются на таких платформах как DataVerse, Zenodo и многих других в рамках долгосрочной политики Европейского союза по повышению доступности научных знаний. Открытые данные являются продолжение инициатив Open Access и результатом совместной работы нескольких исследовательских центров.

Ссылки:
[1] https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/7EJ1KI
[2] https://www.bundestag.de/services/opendata
[3] https://www.cambridge.org/core/journals/government-and-opposition/article/every-single-word-a-new-data-set-including-all-parliamentary-materials-published-in-germany/34D424C406687F7446C6F32980A4FE84
[4] https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/L4OAKN

#opendata #data #politicalscience #science #datascience
Вот очень близкий по смыслу проект — Manifesto Project: The corpus currently covers electoral programmes from more than 50 different countries in almost 40 languages. It contains about 2.750 machine-readable programmes. For more than 1.500 of these, unitising and codings are available as well. These are almost 1,500,000 coded quasi-sentences.
https://manifestoproject.wzb.eu/information/documents/corpus
источник

IB

Ivan Begtin in Чат к каналу @begtin
Konst.
Вот очень близкий по смыслу проект — Manifesto Project: The corpus currently covers electoral programmes from more than 50 different countries in almost 40 languages. It contains about 2.750 machine-readable programmes. For more than 1.500 of these, unitising and codings are available as well. These are almost 1,500,000 coded quasi-sentences.
https://manifestoproject.wzb.eu/information/documents/corpus
Да, весьма интересный проект
источник

DP

Dmitry Perminov in Чат к каналу @begtin
Только вчера уже здесь было
источник

NK

ID:0 in Чат к каналу @begtin
С 9 января в США наблюдается резкий всплеск популярности альтернативных мессенжеров и соцсетей. Помимо Telegram'а, это ещё и Signal, CloutHub, MeWe и Rumble.

Источник: Axios (http://axios.com), данные из Apptopia (http://apptopia.com)

#mobile
источник

VS

Victor Stepankov in Чат к каналу @begtin
Victor Grishchenko
https://www.kommersant.ru/doc/4639641
совсем неутешительные новости

Мэрия Москвы потратит 185 млн руб. на создание новой системы хранения персональных данных жителей столицы. В ней соберут не только информацию о документах граждан, но и данные об их фактическом доходе, месте проживания, родственниках, успеваемости детей в школе и даже домашних животных. Новый сервис, по мнению экспертов, сведет в одном месте все уже собранные данные, ускорив предоставление госуслуг, но одновременно и повысит опасность утечки информации.
https://roem.ru/14-01-2021/284649/moscow-mac-fail/
Один успешный проект уже в копилочке
источник

AC

Arcady Chumachenko in Чат к каналу @begtin
ID:0
С 9 января в США наблюдается резкий всплеск популярности альтернативных мессенжеров и соцсетей. Помимо Telegram'а, это ещё и Signal, CloutHub, MeWe и Rumble.

Источник: Axios (http://axios.com), данные из Apptopia (http://apptopia.com)

#mobile
Вот интересно: люди вроде как страдают от цензуры и самодурства, но не настолько, чтобы мириться с неудобствами распределенных систем, которые от оных защищены by design (будь то federated сети вроде Mastodon или полностью p2p, как ssb).
источник

NK

ID:0 in Чат к каналу @begtin
Archive Team, команда которая архивирует умирающие проекты, оказалась в центре внимания после того как они запустили процесс архивации Partler'а [1].

Впрочем публичная позиция Archive Team в том что архивируется только общедоступное, а взломанный контент из Parler они не используют [2]

Лично я считаю что архивы вне политики, какой бы ни был контент, он должен быть сохранён.

Ссылки:
[1] https://www.vice.com/en/article/n7vqew/the-hacker-who-archived-parler-explains-how-she-did-it-and-what-comes-next
[2] https://twitter.com/archiveteam/status/1349054073589420036

#opendata #data #archives
источник

ГМ

Григорий Машанов... in Чат к каналу @begtin
Стоимость победы на выборах в Госдуму-2021 резко вырастет из-за проведения праймериз «Единой России» на портале Госуслуг.

По информации источников, в Свердловской области политики уже готовятся к тому, что на свою кампанию им придется дополнительно потратить еще несколько миллионов рублей. Кандидаты говорят, что вскоре начнется массовая скупка аккаунтов на Госуслугах, а в ходе самих праймериз возможны громкие скандалы и накрутки голосов.
источник

ГМ

Григорий Машанов... in Чат к каналу @begtin
До сих пор на госуслугах нет двухфакторки по умолчанию
источник

ГМ

Григорий Машанов... in Чат к каналу @begtin
Хотя вреда угнанным аккаунтом можно нанести больше, чем банковским
источник

ГМ

Григорий Машанов... in Чат к каналу @begtin
Не понимаю почему ничего не делается по этому поводу
источник

IB

Ivan Begtin in Чат к каналу @begtin
Григорий Машанов
Не понимаю почему ничего не делается по этому поводу
Может как раз делается, просто мы не знаем.
источник