Size: a a a

Natural Language Processing

2017 December 01

t2

tonko 22 in Natural Language Processing
Вот только где первичную разметку брать тоже непонятно
источник

t2

tonko 22 in Natural Language Processing
Проблема вообще в том что обычный пос теггер дает мне один тег каждому уникальному токену, в то время как один и тот же токен может иметь разные значения и часть речи
источник

TM

Timophey Molchanov in Natural Language Processing
А разве в какой-нибудь вышке нет размеченных корпусов?
источник

t2

tonko 22 in Natural Language Processing
У меня в словаре много сленга и терминов
источник

PK

Polina Kazakova in Natural Language Processing
tonko 22
Проблема вообще в том что обычный пос теггер дает мне один тег каждому уникальному токену, в то время как один и тот же токен может иметь разные значения и часть речи
mystem? он же разрешает неоднозначности
источник

PK

Polina Kazakova in Natural Language Processing
правда медленный............
источник

TM

Timophey Molchanov in Natural Language Processing
Можно было бы разметить вашу выборку, и сделать finetuning какой-нибудь готовой модели на большем корпусе
источник

t2

tonko 22 in Natural Language Processing
Хм, я думал он только неизвестные слова умеет предсказывать
источник

t2

tonko 22 in Natural Language Processing
Я майстему словарь скармливаю
источник

DV

Dima Veselov in Natural Language Processing
tonko 22
мне по работе нужен хороший пос теггер который бы учитывал контекст, врде в наташу обещали завезти, но я еще не тестил
Привет, вот здесь ребята собрали список открытых морф. анализаторов: https://github.com/dialogue-evaluation/morphoRuEval-2017#opensource-tools
Из того, что я пробовал, для русского языка самое простое и с достойным качеством, это - https://github.com/kmike/morphine , от Михаила Коробова :)
Вот тут результаты morphine для morphoRuEval-2017: https://github.com/kmike/dialog2017#crf-baseline (в котором, кстати, шел разбор корпусов из интернета - жж, вконтакте и т.д.)
источник

TM

Timophey Molchanov in Natural Language Processing
https://github.com/tensorflow/models/blob/master/research/syntaxnet/g3doc/syntaxnet-tutorial.md Вроде на нейронках и русский вроде как поддерживал
источник

TM

Timophey Molchanov in Natural Language Processing
источник

t2

tonko 22 in Natural Language Processing
Dima Veselov
Привет, вот здесь ребята собрали список открытых морф. анализаторов: https://github.com/dialogue-evaluation/morphoRuEval-2017#opensource-tools
Из того, что я пробовал, для русского языка самое простое и с достойным качеством, это - https://github.com/kmike/morphine , от Михаила Коробова :)
Вот тут результаты morphine для morphoRuEval-2017: https://github.com/kmike/dialog2017#crf-baseline (в котором, кстати, шел разбор корпусов из интернета - жж, вконтакте и т.д.)
Бенч последней ссылки впечатляет
источник

t2

tonko 22 in Natural Language Processing
Тэкс, ну надо значит все попробовать
источник

t2

tonko 22 in Natural Language Processing
А что из этого нет в spacy, что вы бы хотели запилить?
источник

t2

tonko 22 in Natural Language Processing
Или идея в том чтобы использовать именно spacy?
источник

TM

Timophey Molchanov in Natural Language Processing
Просто он очень мощно развивается, удобен и в нем есть сразу много инструмнтов. Ну и потом мне нужен хороший NER, а в Spacy под это целая инфраструктура - хочешь грамматики пиши, хочешь нейронки прикручивай
источник

EI

Eugene Istomin in Natural Language Processing
Dima Veselov
Привет, вот здесь ребята собрали список открытых морф. анализаторов: https://github.com/dialogue-evaluation/morphoRuEval-2017#opensource-tools
Из того, что я пробовал, для русского языка самое простое и с достойным качеством, это - https://github.com/kmike/morphine , от Михаила Коробова :)
Вот тут результаты morphine для morphoRuEval-2017: https://github.com/kmike/dialog2017#crf-baseline (в котором, кстати, шел разбор корпусов из интернета - жж, вконтакте и т.д.)
👍🏻
источник

N

Nikita in Natural Language Processing
Я, видимо, что-то пропустил
А что случилось с доками наташи?
источник
2017 December 05

СТ

Сергей Тихонов in Natural Language Processing
Всем привет!
источник