Size: a a a

Natural Language Processing

2020 July 06

ck

cnstntn kndrtv in Natural Language Processing
Alexander Kukushkin
в четвёртой строчке вы берете результат для первого предложения
Точно. Спасибо!
источник

ck

cnstntn kndrtv in Natural Language Processing
если вдруг кому-то нужен результат этого
источник

YB

Yuri Baburov in Natural Language Processing
Andrew Ishutin
text —> lowercase —> truecase —> model ?
этот вариант теряет столько же информации, сколько и вариант сразу учить модель в lowercase.
источник

ck

cnstntn kndrtv in Natural Language Processing
Alexander Kukushkin
в четвёртой строчке вы берете результат для первого предложения
Спасибо. Как можно запустить на на slovnet_bert?
источник

AI

Andrew Ishutin in Natural Language Processing
Yuri Baburov
этот вариант теряет столько же информации, сколько и вариант сразу учить модель в lowercase.
это не так вроде. Пруф: https://arxiv.org/pdf/1903.11222.pdf
источник

AI

Andrew Ishutin in Natural Language Processing
а мы про какую задачу говорим? NER или POS? Про POS правы Вы, про NER я.
источник

AK

Alexander Kukushkin in Natural Language Processing
cnstntn kndrtv
Спасибо. Как можно запустить на на slovnet_bert?
это непубличная часть либы, надо будет разбираться. Докер-контейнер https://hub.docker.com/r/natasha/slovnet-ner-bert, исходники https://github.com/natasha/slovnet/blob/master/docker/slovnet-ner-bert/app.py
источник

YB

Yuri Baburov in Natural Language Processing
Andrew Ishutin
а мы про какую задачу говорим? NER или POS? Про POS правы Вы, про NER я.
возможно, я не очень понимаю их терминологию, но я наоборот вижу, что на POS можно сразу использовать lowercase (и непонятно, помогает ли предсказание case),
а на NER мы получаем падение с 92.45 до 90.25 .
источник

YB

Yuri Baburov in Natural Language Processing
слева NER, справа POS
источник

AI

Andrew Ishutin in Natural Language Processing
да, я как раз хотел заскринить
источник

AI

Andrew Ishutin in Natural Language Processing
Просто lowercase это в их табличке Uncased Test(U), т. е. 89.32 F1 score в NER
источник

AI

Andrew Ishutin in Natural Language Processing
Метод, про который говорил я, как Вы и сказали - 90.25 F1 score на NER
источник

YB

Yuri Baburov in Natural Language Processing
смотрите. 92.45 -> 90.25 (учить на truecase) примерно соответствует 92.45 -> 89.32 (учить на lowercase)
и там и там происходит потеря качества, т.е. предсказание кейса не помогает. хм, ну ок, чуть-чуть помогает, оказывается. на NER.
а на POS эти ±0.2% неразличимы.
ну и лучший (и достаточный) вариант обучения, получается, cased+uncased.
источник

AI

Andrew Ishutin in Natural Language Processing
Yuri Baburov
этот вариант теряет столько же информации, сколько и вариант сразу учить модель в lowercase.
Я согласен, что можно сделать лучше, чем я предложил. Но это не отменяет того, что Ваше утверждение ложное
источник

AI

Andrew Ishutin in Natural Language Processing
Плюс, то, что я предложил не нужно дообучать. Нужен только truecaser для русского и готовая модель
источник

YB

Yuri Baburov in Natural Language Processing
Andrew Ishutin
Я согласен, что можно сделать лучше, чем я предложил. Но это не отменяет того, что Ваше утверждение ложное
в том смысле, что 90% лучше 89% (сравнивая относительно 92%)? ну, можно так считать, ок.
источник

YB

Yuri Baburov in Natural Language Processing
спасибо большое за статью, надо взять метод на вооружение (а то одно дело свой опыт и свои бессистемные эксперименты, а другое дело чужие, более грамотные)
источник

YB

Yuri Baburov in Natural Language Processing
эх, ещё бы syntax analysis где-нибудь так же потестили...
источник

DK

Denis Kirjanov in Natural Language Processing
Yuri Baburov
эх, ещё бы syntax analysis где-нибудь так же потестили...
так это как?
источник

YB

Yuri Baburov in Natural Language Processing
Denis Kirjanov
так это как?
такую же табличку посчитали для него.
источник