Телеграмм чат группы natural_language_processing страница 1172

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2680 membersпожаловаться на группу

2021 April 23

IK

Irina Krotova in Natural Language Processing

https://github.com/dtuggener/CharSplit — вот есть скрипт, который по н-грамам разбивает немецкие композиты на две части, можно под свои задачи переписать и обучить на какой-нибудь английской Википедии, так там принцип примерно тот же. У меня достаточно быстро обучалось и потом отрабатывало на тестовом датасете.

dtuggener/CharSplit

Compound splitter for German. Contribute to dtuggener/CharSplit development by creating an account on GitHub.

источник

13:30пожаловаться #1

IK

Irina Krotova in Natural Language Processing

Это если нужен какой-нибудь готовый код, чтобы быстро проверить

источник

13:31пожаловаться #2

DD

David Dale in Natural Language Processing

Есть алгоритм ахо-корасика (в питоне пакет pyahocorasik кажется), он позволяет эффективно проверять вхождения большого количества слов в строке. Я проверял на миллионе слов, работает едва ли не единицы миллисекунд.

источник

13:32пожаловаться #3

Bo

Blen obema in Natural Language Processing

Всем спасибо за ответ!

источник

13:35пожаловаться #4

SK

Sergey Kamenshchikov in Natural Language Processing

Добрый день. Подскажите пожалуйста, каким оптимальным способом разбить текст без пунктуации на предложения? Пробуем Spacy (на базе синтаксического парсера), но не до конца понимаю, как он работает. Возможно кто-то сталкивался с такой задачей. Спасибо.

источник

14:20пожаловаться #5

NS

Nikolay V. Shmyrev in Natural Language Processing

https://t.me/natural_language_processing/21948

Nikolay V. Shmyrev in Natural Language Processing

ещё https://github.com/Lesha17/Punctuation

источник

14:24пожаловаться #6

AM

Alina Mogilevets in Natural Language Processing

#вакансия
Всем привет✋
Нашла в переписке, что иногда можно публиковать вакансии здесь и решила рискнуть😉

Я рекрутер в компании Social Discovery Ventures.
Сейчас ищу NLP/ML разработчика с опытом работы с чат-ботами на проект Виртуальный друг.

Буду рада пообщаться в ЛС с теми, кто вдруг сейчас в поисках или готов к чему-то новому и захватывающему)

Наша ваканси: https://rabota.by/vacancy/42351678

Спасибо за внимание и ярких выходных всем!

Вакансия Senior NLP/ML разработчик в Москве, работа в компании Social Discovery Ventures

Зарплата: не указана. Москва. Требуемый опыт: 3–6 лет. Полная занятость. Дата публикации: 22.04.2021.

источник

18:53пожаловаться #7

MK

Max Kuznetsov in Natural Language Processing

"Виртуальный друг с опытом работы с чат-ботами" - ваш вирутальный друг за вас общается с чатботами и зовёт вас, когда в чате появится живой оператор, пригодный для прохождения теста Тьюринга

источник

19:06пожаловаться #8

SK

Sergey Kamenshchikov in Natural Language Processing

🙏🙏 Спасибо!

источник

19:15пожаловаться #9

IK

Irina Krotova in Natural Language Processing

https://norvig.com/ngrams/ — что-то весь день вспоминала, где видела уже готовую статистическую н-грамную модель именно для такой задачи. Вот тут у Peter Norvig выложен готовый учебный код и простой разбор того, как работает, в пдфке раздел Word Segmentation.

источник

20:33пожаловаться #10

Bo

Blen obema in Natural Language Processing

спасибо!

источник

21:37пожаловаться #11

WB

Wincent Balin in Natural Language Processing

Тоже самое, только в блокноте: https://github.com/norvig/pytudes/blob/master/ipynb/How%20to%20Do%20Things%20with%20Words.ipynb

norvig/pytudes

Python programs, usually short, of considerable difficulty, to perfect particular skills. - norvig/pytudes

источник

21:50пожаловаться #12

A

Anthony in Natural Language Processing

Переслано от Wincent Balin

Тоже самое, только в блокноте: https://github.com/norvig/pytudes/blob/master/ipynb/How%20to%20Do%20Things%20with%20Words.ipynb

norvig/pytudes

Python programs, usually short, of considerable difficulty, to perfect particular skills. - norvig/pytudes

источник

22:30пожаловаться #13

2021 April 24

В

Валера in Natural Language Processing

Прикольно. Спасибо, пригодится для фильтрации контента)

источник

11:07пожаловаться #14

SМ

SancheZz Мов in Natural Language Processing

Еще советую посмотреть токсик соревнование 2020 г, там есть и ру домен.

источник

11:36пожаловаться #15

SМ

SancheZz Мов in Natural Language Processing

https://www.kaggle.com/c/jigsaw-multilingual-toxic-comment-classification

Jigsaw Multilingual Toxic Comment Classification

Use TPUs to identify toxicity comments across multiple languages

источник

11:38пожаловаться #16

SМ

SancheZz Мов in Natural Language Processing

Там можно найти классы токсик которые поделены на подтипы в тч оскарбления по рассовому и тп признаку

источник

11:39пожаловаться #17

Е

Егорка in Natural Language Processing

Добрый день. Не мог бы кто-нибудь подсказать, какую модель использует spacy для задачи NER ?

источник

14:05пожаловаться #18

YB

Yuri Baburov in Natural Language Processing

Свою, на основе CNN.

источник

19:05пожаловаться #19

AK

Alexander Kukushkin in Natural Language Processing

Вообще там достаточно необычная модель. Доклад про то что было в версии 2 https://www.youtube.com/watch?v=sqDHBH9IjRU, возможно в версии 3 то же самое. На сколько понял, автор собаку съел на синтаксических парсерах, поэтому в Spacy NER сводится к парсингу, подход описан в https://arxiv.org/pdf/1603.01360.pdf "Transition-Based Chunking Model". Ещё там свой фреймвок для deep learning и трюк с хешированием эмбеддингов

SPACY'S ENTITY RECOGNITION MODEL: incremental parsing with Bloom embeddings & residual CNNs

spaCy v2.0's Named Entity Recognition system features a sophisticated word embedding strategy using subword features and "Bloom" embeddings, a deep convoluti...

источник

19:17пожаловаться #20