Size: a a a

Natural Language Processing

2020 February 14

SP

Sebastian Pereira in Natural Language Processing
Yuri Baburov
берёте склеиваете существительные и числительные во фразы.
потом учите word2vec на полученном тексте.
потом берёте слово "вчера" и находите все слова и фразы, что находятся на косинусном расстоянии 0.65 и выше.
берёте фразу "два дня назад" и поступаете так же.
набрали фразы. потом их расширяете таким же образом, ища синонимы через word2vec.
Хм
источник

SP

Sebastian Pereira in Natural Language Processing
У нас датасет: «через две недели» : «334» ( часа имеется в виду)
источник

SP

Sebastian Pereira in Natural Language Processing
Дата human readable и время
источник

SP

Sebastian Pereira in Natural Language Processing
Цель найти время
источник

YB

Yuri Baburov in Natural Language Processing
эм, 14*24 = 336 ;)
источник

YB

Yuri Baburov in Natural Language Processing
писали бы лучше в секундах)
источник

YB

Yuri Baburov in Natural Language Processing
но ок, да. сначала делаете датасет для детекции
источник

SP

Sebastian Pereira in Natural Language Processing
Yuri Baburov
эм, 14*24 = 336 ;)
14 февраля, пятница, да как у вас рука поднялась считать)
источник

SP

Sebastian Pereira in Natural Language Processing
Просто берёшь первое пришедшее на ум число₽
источник

YB

Yuri Baburov in Natural Language Processing
потом оттуда время считаете всякими функциями
источник

YB

Yuri Baburov in Natural Language Processing
Sebastian Pereira
14 февраля, пятница, да как у вас рука поднялась считать)
просто 334 — странное число, не разу не встречал такое в задачах времени :)
источник

IK

Ivan Kargapoltsev in Natural Language Processing
Если вы уверены в текстовых строках, то на Толоке можно выстроить механизм контроля толокеров: экзамен, ханипоты. Это будет их подстегивать делать правильно с поправкой на человеческую ошибку. Также можно использовать перекрытие ответов. То, что вы уже разметили, можно пустить как раз на экзамен и ханипоты.

Если интересно, можем в личке обсудить просто.
источник

SP

Sebastian Pereira in Natural Language Processing
Ivan Kargapoltsev
Если вы уверены в текстовых строках, то на Толоке можно выстроить механизм контроля толокеров: экзамен, ханипоты. Это будет их подстегивать делать правильно с поправкой на человеческую ошибку. Также можно использовать перекрытие ответов. То, что вы уже разметили, можно пустить как раз на экзамен и ханипоты.

Если интересно, можем в личке обсудить просто.
Тут такая штука, это почти так же мучительно как размечать и вычислять самому.
источник

IK

Ivan Kargapoltsev in Natural Language Processing
Sebastian Pereira
Тут такая штука, это почти так же мучительно как размечать и вычислять самому.
Что именно мучительно? Настроить проект в Толоке?
источник

SP

Sebastian Pereira in Natural Language Processing
Ivan Kargapoltsev
Что именно мучительно? Настроить проект в Толоке?
Да
источник

IK

Ivan Kargapoltsev in Natural Language Processing
источник

AK

Alexander Kukushkin in Natural Language Processing
Nikolai Fominykh
Всем привет. А у NER Natasha - есть UI?
Есть страничка с демо https://natasha.github.io/demo/ . Не очень понятно о каком UI речь
источник

Г

Герман in Natural Language Processing
Sebastian Pereira
Про парсеры забудьте - я опишу наши муки, нет готового решения, только рассуждения про « да я бы за вечер все сделал» dateparser, natty, timeforhuman - все остой
Писал сам правила на yargy для поиска абсолютных и относительных дат. Кажется, что более менее успешно. Конечно, сходу сразу все возможные варианты трудно придумать, но можно расширять грамматики постепенно, добавляя новое
источник
2020 February 15

ИГ

Иван Гладуш in Natural Language Processing
Всем  привет, кто-то использовал BERT для NER, а именно допиливал его чтобы можно было доставать имена из предложения, Фамилии и т.д.
источник

NS

Nikolay Shmyrev in Natural Language Processing
источник