Телеграмм чат группы natural_language_processing страница 17

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1279 membersпожаловаться на группу

1
«
…
‹
12
13
14
15
16
17
18
›
…
»

2017 June 18

DV

Dima Veselov in Natural Language Processing

Привет. С 5kb текстом проблем быть не должно.
Если документ больше - можно разбить по абзацам (или по предложениям) и запустить по парсеру на ядро процессора.

источник

12:56пожаловаться #1

2017 June 21

EV

Egor V. in Natural Language Processing

Добрый день. Скажи, есть ли какие-то задачи, которые можно помочь решить? У меня появилось свободное время. Хотелось бы принять участие в разработке.

источник

17:54пожаловаться #2

EV

Egor V. in Natural Language Processing

🕵🏻 Макс

Где можно будет почитать обзор? :)

Там буквально пара строк про томиту, наташу и пуллэнти. 😊

источник

17:56пожаловаться #3

🕵

🕵🏻 Макс in Natural Language Processing

И как, Наташа рулит? )

источник

18:20пожаловаться #4

EV

Egor V. in Natural Language Processing

🕵🏻 Макс

И как, Наташа рулит? )

Я использовал Томиту, потому что уже были кое-какие наброски грамматик. Были другие важные задачи, поэтому не стал разбираться с Наташей)

источник

18:49пожаловаться #5

x

x in Natural Language Processing

определение негативного или позитивного контекста у произвольного текста это стандартная задача?

источник

18:52пожаловаться #6

EV

Egor V. in Natural Language Processing

определение негативного или позитивного контекста у произвольного текста это стандартная задача?

много кто таким занимается

источник

18:53пожаловаться #7

2017 June 22

EV

Egor V. in Natural Language Processing

@dveselov так что, можно принять участие?

источник

09:16пожаловаться #8

DV

Dima Veselov in Natural Language Processing

Привет! Спасибо за проявленный интерес, но прямо сейчас нет того, с чем можно помочь :) Сейчас @alexkuk делает новые внутренности для парсера - поэтому у нас немного встал процесс (но это ненадолго)

источник

09:20пожаловаться #9

AK

Alexander Kukushkin in Natural Language Processing

Есть ещё https://github.com/bureaucratic-labs/models , мне кажется, там есть несколько приятных небольших задач

bureaucratic-labs/models

Pre-trained models for tokenization, sentence segmentation and so on - bureaucratic-labs/models

источник

10:29пожаловаться #10

2017 June 23

EV

Egor V. in Natural Language Processing

Alexander Kukushkin

Есть ещё https://github.com/bureaucratic-labs/models , мне кажется, там есть несколько приятных небольших задач

bureaucratic-labs/models

Pre-trained models for tokenization, sentence segmentation and so on - bureaucratic-labs/models

Что за задачи?

источник

20:01пожаловаться #11

2017 June 25

AK

Alexander Kukushkin in Natural Language Processing

Продублирую то, что писал @dveselov . Это вещи которые мне самому было бы интересно сделать. https://github.com/bureaucratic-labs/models библиотека для сегментации русского текста на предложения и слова. Эта задача часто встречается. Люди про неё спрашивают. Нормального инструмента для русского мне не известно, поэтому инициатива по-моему полезная. Вот что, мне кажется, было бы полезно сделать
1. Написано, что качество >98%. Было бы интересно знать какое качество у супер-простых подходов: разбить по пробелу, по точке. Какое качество у чего-нибудь посложнее: у регулярок как в yargy.tokenizer у правил типа http://ideone.com/pNpffv
2. Нужен простой интерфейс. Можно как у yargy.tokenizer
3. Интересно посмотреть на ошибки. И на случаи где простые методы ошибаются, а CRF нет
4. Интересно посмотреть на замеры скорости. И сравнить с супер простыми методами

bureaucratic-labs/models

Pre-trained models for tokenization, sentence segmentation and so on - bureaucratic-labs/models

источник

12:51пожаловаться #12

2017 June 29

DV

Dima Veselov in Natural Language Processing

Привет.

источник

11:56пожаловаться #13

DV

Dima Veselov in Natural Language Processing

Если не нужно искать по правилам типа <должность> такой-то такой, можно просто их отключить. Вот пример такого правила: https://github.com/bureaucratic-labs/natasha/blob/master/natasha/grammars/person/grammars.py#L406

bureaucratic-labs/natasha

natasha - Rule-based named entity recognition library for russian language

источник

12:25пожаловаться #14

DV

Dima Veselov in Natural Language Processing

т.е. сделать свой класс, в котором переопределить грамматики, примерно так: https://gist.github.com/dveselov/d1dff4d4d4d4611ec57d40d7491e2f2d

custom_person.py

источник

12:27пожаловаться #15

DV

Dima Veselov in Natural Language Processing

И в парсер передавать его, а не natasha.grammars.Person.

источник

12:28пожаловаться #16

DV

Dima Veselov in Natural Language Processing

Примерно так, если я правильно понял вопрос.

источник

12:28пожаловаться #17

DV

Dima Veselov in Natural Language Processing

А, для этого есть такая штука: https://github.com/bureaucratic-labs/natasha/blob/master/natasha/grammars/pipelines.py#L181

bureaucratic-labs/natasha

natasha - Rule-based named entity recognition library for russian language

источник

12:49пожаловаться #18

DV

Dima Veselov in Natural Language Processing

Её тоже можно переопределить и передавать вместо оригинала.

источник

12:49пожаловаться #19

2017 July 01

DV

Dima Veselov in Natural Language Processing

Друзья, в ближайшие пару месяцев мы будем менять интерфейс парсера. Посмотреть как будут выглядеть правила можно здесь: https://alexanderkuk.github.io/yargy/index.html
Если вы пишите свои правила, на базе yargy, будьте готовы к изменениям :)

источник

11:23пожаловаться #20

1
«
…
‹
12
13
14
15
16
17
18
›
…
»