Телеграмм чат группы natural_language_processing страница 664

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1579 membersпожаловаться на группу

2020 May 16

D(

David (ddale) Dale in Natural Language Processing

В 2) можно предварительно потюнить модель чем-то вроде кантерфиттинга или других видов фитинга
Тогда антонимы отъедут и должно быть плюс-минус ок

А можно ссылочку на пример, или ключевые слова для гугления? Это для меня новое понятие 🤷‍♂️

источник

15:17пожаловаться #1

DK

Denis Kirjanov in Natural Language Processing

Counter-fitting word vectors и retro-fitting word vectors
И как подвид одного из них — attract-repel

Идея простая — заводим списки синонимов-антонимов (например, взятые из тезаурусов) и меняем разными методами либо вектора отдельных слов, либо целые пространства. То есть это в каком-то смысле синкретизм методов 1) и 2) из списка выше.

Но должен честно предупредить, что я копал эту историю пару лет назад — возможно, появились более эффективные методы

У меня тогда получалось, что counter fitting очень сильно менял исходное пространство (что, возможно, для задачи создания модели только для поиска синонимии и некритично и даже наоборот хорошо — если уже есть на входе тезаурус с синонимами, то хорошо бы поменять вектора кому-то ещё, иначе все останется как было), а retro-fitting работал недурно, но его scope наоборот был слишком локальный — вектора слов, кроме тех, что были в исходных списках синонимов-антонимов практически никак не менялись. Что, см. выше, для нашей задачи будто бы плохо на первый взгляд

источник

15:27пожаловаться #2

YB

Yuri Baburov in Natural Language Processing

Да, триплет лосс на таргет задачу на нейросети поверх эмбеддингов улучшает качество. Можно на тезаурусе тренировать. Кроме тезауруса можно ещё sentiment analysis взять, sentiment analysis "можно" от "нельзя" отличит, но слова "длинный" от "короткий" не отличит.

источник

17:31пожаловаться #3

2020 May 18

SP

Sebastian Pereira in Natural Language Processing

Написал первую часть обзора open source NER библиотек. Вторая часть будет про закрытые решения, платные API и т.д. Третью планирую про решения позволяющие свой собственный NER обучить для конкретных задач и языков, не представленных в текущих решениях. https://habr.com/ru/post/502366/

Сравниваем работу open source Python — библиотек для распознавания именованных сущностей

Введение Мы в компании создаем сервис, который позволяет автоматически создавать, управлять и безопасно хранить лицензионные соглашения и прочие договоры между ф...

источник

17:30пожаловаться #4

AK

Alexander Kukushkin in Natural Language Processing

C Output для Natasha что-то не так

источник

19:28пожаловаться #5

SP

Sebastian Pereira in Natural Language Processing

Поехала верстка в статье, вы правы, надо поправить.

источник

19:30пожаловаться #6

AK

Alexander Kukushkin in Natural Language Processing

Есть ещё https://github.com/natasha/naeval#ner . У вас качественное сравнение, в Naeval количественное

natasha/naeval

Comparing quality and performance of NLP systems for Russian language - natasha/naeval

источник

19:32пожаловаться #7

YB

Yuri Baburov in Natural Language Processing

Да, на 10 словах нормальное сравнение не сделать... Не надо так. В целом статья конечно интересная, про часть инструментов я не знал.

источник

19:55пожаловаться #8

SP

Sebastian Pereira in Natural Language Processing

Да, на 10 словах нормальное сравнение не сделать... Не надо так. В целом статья конечно интересная, про часть инструментов я не знал.

Все так, цель была показать инструменты. Для нормального исследования стоило бы еще разные версии сравнивать, так как даже в процессе сбора информации результат был разным.

источник

19:58пожаловаться #9

SP

Sebastian Pereira in Natural Language Processing

Тот же HanLP гораздо более перспективная система чем кажется, если немного разобраться.

источник

19:59пожаловаться #10

SP

Sebastian Pereira in Natural Language Processing

Но, для того и колаб в приложении - можно вставить любые тексты, любой величины.

источник

20:00пожаловаться #11

YB

Yuri Baburov in Natural Language Processing

Sebastian Pereira

Но, для того и колаб в приложении - можно вставить любые тексты, любой величины.

Есть датасеты для сравнения, зачем вставлять что-то ещё...

источник

20:44пожаловаться #12

YB

Yuri Baburov in Natural Language Processing

Sebastian Pereira

Тот же HanLP гораздо более перспективная система чем кажется, если немного разобраться.

А что в hannlp особенного?

источник

20:44пожаловаться #13

SP

Sebastian Pereira in Natural Language Processing

А что в hannlp особенного?

транскрипция в пиньинь, например)

источник

20:48пожаловаться #14

2020 May 19

M

Mikhail in Natural Language Processing

Всем привет. кто то natasha(ей) парсил письменные суммы типа( пятнадцать тысяч сто пятьдесят рублей 50 копеек) я что то не нашел готового решения нужно свое правило писать со словарем ?

источник

13:08пожаловаться #15

M

Mikhail in Natural Language Processing

остальные суммы MoneyExtractor от natasha вполне хорошо достает

источник

13:09пожаловаться #16

KS

Konstantin Smith in Natural Language Processing

Mikhail

Всем привет. кто то natasha(ей) парсил письменные суммы типа( пятнадцать тысяч сто пятьдесят рублей 50 копеек) я что то не нашел готового решения нужно свое правило писать со словарем ?

Pullenti хорошо такие вещи парсит.

источник

13:16пожаловаться #17

DR

Dinesh Raturi in Natural Language Processing

https://www.youtube.com/watch?v=kB_kN7V7pN4&list=PLrYq9TGMS8e_lErp6sl9v2ic2XL2bNOje

Build Covid-19 Chatbot using Python & DialogFlow In 1 HOUR Challenge|MongoDB|Flask|RapidAPI|Telegram

Our Task - 1. The bot should be able to answer all the queries/FAQ related to Covid-19 2. The bot should be able to show statistics worldwide, Country-wise, ...

источник

13:21пожаловаться #18

2020 May 20

ПЧ

Первый Человек... in Natural Language Processing

https://youtu.be/sZQ0YPtdBF8

Авторегистрация Telegram аккаунтов в Telegram soft 2.0

Контакты для связи - t.me/SEO_UP

Цена софта:

Пожизненная 15000р месячная 7500р
Месячную до вечной можно продлить в течении 31 дня доплатив разницу.

Демо предоставляется бесплатно на 3 часа

Модули покупаются отдельно

источник

00:17пожаловаться #19

DP

Definitely Not Peter... in Natural Language Processing

Есть ли у python готовые библиотеки, для обработки естественного языка?
Интересует следующий кейс:
На вход подаётся строка "в пятницу, в 18:45", а на выход - дата ( 22.05.2020 18:45). Или
"В следующую пятницу в 17:56" - 29.05.2020 17:56
Проблема в том, что пользователь может по-разному формулировать дату и время (как напрямую задать дату, вроде "22 мая, в 17:56", так и назвать день недели. Есть ли готовые решения, которые это обрабатывают?

источник

18:03пожаловаться #20