Size: a a a

Natural Language Processing

2020 May 11

YN

Yuriy Nazarov in Natural Language Processing
Dmitry Legchikov
SberQA кажется датасет
Может у кого остался этот SberQuAD ?
Поиск находит реп с битыми ссылками https://github.com/sberbank-ai/data-science-journey-2017
И статью с анализом, но, вроде, теми же ссылками https://arxiv.org/abs/1912.09723
https://github.com/sberbank-ai/data-science-journey-2017
И статью с анализом, но, вроде, теми же ссылками https://arxiv.org/abs/1912.09723
upd. пропустил ссылочку http://docs.deeppavlov.ai/en/master/features/models/squad.html
источник
2020 May 12

Р

Родион in Natural Language Processing
Всем привет! Кто-нибудь знает, есть ли размеченный корпус текстов на русском языке для тренировки классификатора?
источник

D

Dmitry in Natural Language Processing
Родион
Всем привет! Кто-нибудь знает, есть ли размеченный корпус текстов на русском языке для тренировки классификатора?
Привет, ну так у тебя же какие-то свои классы?
источник

D

Dmitry in Natural Language Processing
по каким классам то классифицировать будешь, по чужим?))
источник

D

Dmitry in Natural Language Processing
2 тысячи документов за 2 дня вполне реально разметить самому.
очень медитативный процесс)) я проходил
источник

Р

Родион in Natural Language Processing
Dmitry
Привет, ну так у тебя же какие-то свои классы?
Не, я подумал передаточное обучение попробовать. Сам уже тысячи две как раз и разметил :) но мне кажется, что этого маловато будет
источник

YN

Yuriy Nazarov in Natural Language Processing
Родион
Всем привет! Кто-нибудь знает, есть ли размеченный корпус текстов на русском языке для тренировки классификатора?
https://study.mokoron.com/
тональность твиттов например подойдёт?
источник

Р

Родион in Natural Language Processing
Yuriy Nazarov
https://study.mokoron.com/
тональность твиттов например подойдёт?
Спасибо 😊
источник

YN

Yuriy Nazarov in Natural Language Processing
Родион
Спасибо 😊
Ещё от авито на kaggle есть 4 соревнования. Кроме самих задач соревнований можно выданные в качестве фичей столбцы попробовать попредсказывать.
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
Грустно :с
источник

YB

Yuri Baburov in Natural Language Processing
Родион
Всем привет! Кто-нибудь знает, есть ли размеченный корпус текстов на русском языке для тренировки классификатора?
POS tagging - датасет syntagrus - классификация слов по частям речи. Новости по темам -- классификация документов.
источник

AC

Anton Cherepkov in Natural Language Processing
Yuri Baburov
POS tagging - датасет syntagrus - классификация слов по частям речи. Новости по темам -- классификация документов.
А есть готовый датасет с новостями по темам?
источник

YB

Yuri Baburov in Natural Language Processing
Anton Cherepkov
А есть готовый датасет с новостями по темам?
Их штук 5 уже: лента, Интерфакс, РТ, кто-то ещё был. Гуглится.
источник

SP

Sebastian Pereira in Natural Language Processing
Коллеги, а есть где-то простой классический перевод на с английского на русский для английских Universal POS tags () и syntactic dependency отношений?
источник

DK

Denis Kirjanov in Natural Language Processing
Sebastian Pereira
Коллеги, а есть где-то простой классический перевод на с английского на русский для английских Universal POS tags () и syntactic dependency отношений?
боюсь, едва ли
источник

FF

Futorio Franklin in Natural Language Processing
Sebastian Pereira
Коллеги, а есть где-то простой классический перевод на с английского на русский для английских Universal POS tags () и syntactic dependency отношений?
источник

SP

Sebastian Pereira in Natural Language Processing
Да, там есть примеры, и можно, конечно догадаться. Но хотелось бы на какую-то таблицу или статью сослаться в своей статье.
источник

SP

Sebastian Pereira in Natural Language Processing
Кстати, спасибо, отличные примеры.
источник

M

M&M in Natural Language Processing
кто-нибудь знает, могут ли spacy модели предсказывать сразу по батчу, а не по одному примеру?
источник

YB

Yuri Baburov in Natural Language Processing
M&M
кто-нибудь знает, могут ли spacy модели предсказывать сразу по батчу, а не по одному примеру?
могут. метод pipe смотри
источник