Size: a a a

Natural Language Processing

2017 May 11

DV

Dima Veselov in Natural Language Processing
Ну, там (вроде бы) всё просто - проходим по всем извлеченным результатам и строим объекты.
источник

🕵

🕵🏻 Макс in Natural Language Processing
Привет! :)
Не много вас тут )
источник

🕵

🕵🏻 Макс in Natural Language Processing
Подскажите, Томита-парсер кто-то использует?
источник

🕵

🕵🏻 Макс in Natural Language Processing
Может ли Томита-парсер что-то, чего не могут инструменты Bureaucratic Labs?
источник

DV

Dima Veselov in Natural Language Processing
Томита быстрее, как минимум - но использовать её сложнее.
источник

DV

Dima Veselov in Natural Language Processing
По возможностям - не знаю, что именно интересует?
источник

🕵

🕵🏻 Макс in Natural Language Processing
Просто документация по Томите совсем удручает. Я пытаюсь вытащить из фразы топонимы. И какие-то сочетания типа омонимии.
И с топонимами получается плохо.
источник

🕵

🕵🏻 Макс in Natural Language Processing
Я собрал некий словарь названий городов + разговорных форм. Подключил в Томиту, в виде файла. Томита извлекает в итоге только полное совпадение по слову из файла.
То есть "Москва" видит, а "в Москве" не видит.
источник

🕵

🕵🏻 Макс in Natural Language Processing
И все, документации нет, куда рыть не понятно.
источник

🕵

🕵🏻 Макс in Natural Language Processing
Гугл молчит.
источник

DV

Dima Veselov in Natural Language Processing
Думаю, это проблемы со словарями - в твоём словаре (который статья газеттира, в их понимании, так ведь?)  все слова должны быть в нормальной форме.
источник

🕵

🕵🏻 Макс in Natural Language Processing
Эмм.. нет
источник

🕵

🕵🏻 Макс in Natural Language Processing
Это просто файл txt, где все в нормальной форме даже. Но там нет синтаксиса, просто список.
источник

🕵

🕵🏻 Макс in Natural Language Processing
TAuxDicArticle "город" {
   key = {"cities.dic" type=FILE}
}

Вот так.
источник

🕵

🕵🏻 Макс in Natural Language Processing
Я где-то увидел пример, что так можно.
источник

EV

Egor V. in Natural Language Processing
В самой доке прописано, что так можно.
источник

EV

Egor V. in Natural Language Processing
Тоже изучаю Томитину документацию сейчас
источник

🕵

🕵🏻 Макс in Natural Language Processing
А потом извлекаю факт вот так:
PP -> Word<kwtype="город">;
S -> PP interp (MyFact.Field1);
источник

🕵

🕵🏻 Макс in Natural Language Processing
При этом формы слов не учитываются.
источник

🕵

🕵🏻 Макс in Natural Language Processing
В документации это как-то очень вскользь упоминается.
источник