Телеграмм чат группы natural_language_processing страница 666

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1585 membersпожаловаться на группу

2020 May 21

YB

Yuri Baburov in Natural Language Processing

А Наташа разве выделяет элементы? Мне казалось, дергает только ФИО в целом.

pullenti точно умеет разделять на Ф И О.

источник

11:56пожаловаться #1

YB

Yuri Baburov in Natural Language Processing

Сергей Устьянцев

да, тоже думал про словарь, но он вряд ли полноту обеспечит

нужна более-менее полнота среди И и О, тогда Ф методом исключения определяется

источник

11:56пожаловаться #2

SS

Sergey Shulga in Natural Language Processing

pullenti точно умеет разделять на Ф И О.

пойду смотреть

источник

11:57пожаловаться #3

СУ

Сергей Устьянцев... in Natural Language Processing

тогда можно даже не CRF на выход, а просто на правилах

источник

11:57пожаловаться #4

СУ

Сергей Устьянцев... in Natural Language Processing

вряд ли же данные будут в формате ФОИ или ИФО

источник

11:58пожаловаться #5

YB

Yuri Baburov in Natural Language Processing

словарь на 1 млн имён где-то был, -вич, -вна, -оглы — все отчества.

источник

11:58пожаловаться #6

SS

Sergey Shulga in Natural Language Processing

словарь на 1 млн имён где-то был, -вич, -вна, -оглы — все отчества.

хорошая тема, пойду искать

источник

11:58пожаловаться #7

YB

Yuri Baburov in Natural Language Processing

Сергей Устьянцев

вряд ли же данные будут в формате ФОИ или ИФО

зависит от конкретной задачи.

источник

11:59пожаловаться #8

YB

Yuri Baburov in Natural Language Processing

словарь на 1 млн имён где-то был, -вич, -вна, -оглы — все отчества.

редкие исключения — фамилии типа "александрович", "иванович", и так же бывают имена с фамилиями одинаковые.

источник

12:00пожаловаться #9

СУ

Сергей Устьянцев... in Natural Language Processing

есть словарь фамилий примерно 300к штук, могу закинуть

источник

12:00пожаловаться #10

YB

Yuri Baburov in Natural Language Processing

в общем, три детектора надо, а потом по максимальным их вероятностям определять, где какая компонента.

источник

12:00пожаловаться #11

YB

Yuri Baburov in Natural Language Processing

Сергей Устьянцев

есть словарь фамилий примерно 300к штук, могу закинуть

кидай прям сюда, если не жалко

источник

12:00пожаловаться #12

SS

Sergey Shulga in Natural Language Processing

меня тут больше болгары волнуют )) Они там любят всякие Александр Павел

источник

12:00пожаловаться #13

SS

Sergey Shulga in Natural Language Processing

кидай прям сюда, если не жалко

+1

источник

12:00пожаловаться #14

MF

M F in Natural Language Processing

контекста нет, чистый стринг, в котором находится ФИО, при этом это ФИО иногда бывает не в именительном падеже (встречается дательный и родительный)

похожую задачу когда-то решали с https://github.com/erikrose/parsimonious - удобно свои какие угодно правила писать, если как раз строка короткая и вся должна быть распаршена

источник

12:01пожаловаться #15

СУ

Сергей Устьянцев... in Natural Language Processing

rus_surnames.txt

источник

12:01пожаловаться #16

YB

Yuri Baburov in Natural Language Processing

меня тут больше болгары волнуют )) Они там любят всякие Александр Павел

тут только порядком тогда решить можно. т.е. если два детектора вернули 1 (или не сильно различаются по вероятности), то первое — имя, второе — фамилия.
но прикол что в русской системе записи чаще пишут ФИО, а в английской ИОФ (или просто ИФ).

источник

12:02пожаловаться #17

СУ

Сергей Устьянцев... in Natural Language Processing

но мне кажется, словарь немного грязноват

источник

12:02пожаловаться #18

СУ

Сергей Устьянцев... in Natural Language Processing

кинул как есть

источник

12:02пожаловаться #19

V

Viktor in Natural Language Processing

словарь на 1 млн имён где-то был, -вич, -вна, -оглы — все отчества.

петрович вроде такое умеет делать

источник

12:48пожаловаться #20