Size: a a a

R language and Statistical data analysis

2020 February 12

GS

Gleb Suvorov in R language and Statistical data analysis
Denis Naumov
Дорогие друзья. Подскажите как лучше решить задачу.
Задача правильно классифицировтаь данные по категориям.
Категории эти - это данные с выборов, явка, кол-во избирателей и т.д.
Беда в том что каждый избирательный участок по своему называет эти категории
Я подумал что проще всего на основе исторических данных смотреть распределение данных и на основе этого классифицировать эти данные.
Инициаторы этого мероприятия предлагают обработку естественного языка, мне кажется это оверинжениринг но все же, интересно, как можно использовать данный метод тут. Я только знаю что вначале слова в векторы, а потом между ними расстояния вроде. Может имеет смысл объединить методы для увеличения точности.
а язык какой?
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Denis Naumov
каждый избир ком по своему их именует
Если есть данные, то можно пример этого "по-своему"
источник

DN

Denis Naumov in R language and Statistical data analysis
Юрий 🐙💻🤖📊📈🚬
Что вы понимаете под задачей классификации?
Есть исторические данные по выборам. Это кол-ые признаки. Кол-во избиратеоей на участке, кол-во проголосовавших, кол-во отказов. И чтобы эти данные агрегировать надо объединять их, но на разных участках название этих признаков разное. Я подумал что значения всегда будут в каких то пределах. И сохранять примерное отношение к друг другу. Зная какие столбцы должны быть, поступающие данные можно относить к определенному признаку. Я не знаю как это назвать по другому как классификация данных
источник

DN

Denis Naumov in R language and Statistical data analysis
Gleb Suvorov
а язык какой?
Русский
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Denis Naumov
Есть исторические данные по выборам. Это кол-ые признаки. Кол-во избиратеоей на участке, кол-во проголосовавших, кол-во отказов. И чтобы эти данные агрегировать надо объединять их, но на разных участках название этих признаков разное. Я подумал что значения всегда будут в каких то пределах. И сохранять примерное отношение к друг другу. Зная какие столбцы должны быть, поступающие данные можно относить к определенному признаку. Я не знаю как это назвать по другому как классификация данных
Если это данные ЦИК, то не могут они по-разному именоваться. Отказы - это что?
источник

DN

Denis Naumov in R language and Statistical data analysis
Юрий 🐙💻🤖📊📈🚬
Если это данные ЦИК, то не могут они по-разному именоваться. Отказы - это что?
У меня информации от людей которые габлюдают за выборами уже много лет и каждый участок по своему именует данные
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Denis Naumov
У меня информации от людей которые габлюдают за выборами уже много лет и каждый участок по своему именует данные
С этого и надо было начинать
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Делаете словарь наименований и все
источник

DN

Denis Naumov in R language and Statistical data analysis
Юрий 🐙💻🤖📊📈🚬
Делаете словарь наименований и все
А для новых наименований?
источник

GS

Gleb Suvorov in R language and Statistical data analysis
добавляете в словарь
источник

GS

Gleb Suvorov in R language and Statistical data analysis
их же ограниченное количество
источник

D

Dmitriy Klimakov in R language and Statistical data analysis
Andrey G
Коллеги, подскажите, а кто использует сегменты в googleAnalyticsR?
если мне нужен сегмент с OR, то как его образовать в v4 API? кто разобрался?

https://code.markedmondson.me/googleAnalyticsR/articles/v4.html
У марка есть такая фраза:
## Elements can be combined into clauses, which can then be combined into OR filter clauses
segment_define - уже AND, а где же тогда OR и какие clauses надо сделать?
источник

S

Stepler in R language and Statistical data analysis
Alexey Seleznev
В прошлый раз была трансляция
Постараюсь записать, если не забуду
источник

ИП

Иван Поздняков in R language and Statistical data analysis
Всем привет! Столкнулся с такой проблемой: у меня написан скрипт на сервере, но прямого доступа к серверу нет. Нужно как-то отдебажить этот скрипт и понять, почему он работает не так, как у меня. Для этого, я полагаю, нужно записать в лог максимально подробно, что происходит на каждом этапе с каждой переменной. Как это лучше сделать? Какие-нибудь пакеты, туториалы?
источник

a

aGricolaMZ in R language and Statistical data analysis
ну запустить скрипт из командной строки и выхлоп куда-нибудь записать

R -f your_file.R > your_log.txt
источник

ИП

Иван Поздняков in R language and Statistical data analysis
Нет, это понятно, сам выхлоп есть, и он отличается от того, что нужно. Где-то в конце скрипта что-то работает не так (возможно, из-за разных версий пакетов), но что именно - не могу понять. Мне бы формировать выхлоп на каждом этапе (или просто интересующих этапах). У меня есть ощущение, что это распространенная задача, для которой есть какие-то готовые хорошие решения. Не знаю, записывать содержание отдельных переменных на каждом шаге, что-что-то в этом духе.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Иван Поздняков
Нет, это понятно, сам выхлоп есть, и он отличается от того, что нужно. Где-то в конце скрипта что-то работает не так (возможно, из-за разных версий пакетов), но что именно - не могу понять. Мне бы формировать выхлоп на каждом этапе (или просто интересующих этапах). У меня есть ощущение, что это распространенная задача, для которой есть какие-то готовые хорошие решения. Не знаю, записывать содержание отдельных переменных на каждом шаге, что-что-то в этом духе.
посмотри futile.logger
кстати, я не успел вам его на школе рассказать, но в презе он есть
источник

AA

A.K. A.K. in R language and Statistical data analysis
Всем привет, продолжаю воевать с пакетом...Подскажите, может кто знает, что за ошибка и как обойти....Error in install.packages : ERROR: failed to lock directory ‘C:\Program Files\R\R-3.6.2\library’ for modifying
Try removing ‘C:\Program Files\R\R-3.6.2\library/00LOCK’
источник

Y

Yaroslav in R language and Statistical data analysis
Попробуйте запустить с помощью прав администратора
источник

Y

Yaroslav in R language and Statistical data analysis
Всем привет, продолжаю воевать с пакетом...Подскажите, может кто знает, что за ошибка и как обойти....Error in install.packages : ERROR: failed to lock directory ‘C:\Program Files\R\R-3.6.2\library’ for modifying
Try removing ‘C:\Program Files\R\R-3.6.2\library/00LOCK’
источник