Телеграмм чат группы natural_language

Size: a a a

Natural Language Processing

1279 membersпожаловаться на группу

2019 December 15

ПП

Павел Приказчиков in Natural Language Processing

Приветствую, а вы используете flair для русского языка?

источник

17:00пожаловаться #1

Alfredo Diezo in Natural Language Processing

Нет, для английского

источник

17:34пожаловаться #2

Dmitriy Pankov in Natural Language Processing

Alfredo Diezo

Всем привет
Столкнулся с такой задачей. Имеется некоторое предложение. За ним следует другое, и нужно определить: является следующее просто пересказом предыдущего, либо же это "продолжение истории"
Как понимаю, первое — это задача paraphrase identification. А второе? И чем лучше решать? Из того, что здесь видел — flair и LASER

Привет. Второе пересекается с задачей поиска анафорических связей.

источник

21:20пожаловаться #3

Alfredo Diezo in Natural Language Processing

Dmitriy Pankov

Привет. Второе пересекается с задачей поиска анафорических связей.

Спасибо за наводку!
А в какой библиотеке лучше искать реализации под это?

источник

21:20пожаловаться #4

Dmitriy Pankov in Natural Language Processing

Не знаю готовой реализации, но помнится были статьи на Диалоге по этой тематике

источник

21:26пожаловаться #5

Aragaer in Natural Language Processing

Павел Приказчиков

Приветствую, а вы используете flair для русского языка?

да

источник

22:05пожаловаться #6

Alexander C in Natural Language Processing

http://www.marekrei.com/blog/74-summaries-of-machine-learning-and-nlp-research/?utm_source=telegram&utm_medium=social&utm_campaign=DataScienceDigest&utm_term=74-summaries-of-machine-learning-and-nlp&utm_content=6576717

Marek Rei

74 Summaries of Machine Learning and NLP Research - Marek Rei

My previous post on summarising 57 research papers turned out to be quite useful for people working in this field, so it is about time…

источник

22:19пожаловаться #7

Alexander C in Natural Language Processing

може кому полезно

источник

22:19пожаловаться #8

ЮГ

Юлия Галиева in Natural Language Processing

Всем привет! Ребята, пытаюсь спарсить текст между тегами (к сожалению, надо это сделать с помощью yargy).

Может был у кого такой опыт? Пока только токенайзером удалось, но не нравится решение, тк это в регулярки упирается

источник

23:18пожаловаться #9

2019 December 16

Manoj in Natural Language Processing

What are some advanced NLP courses? Be it anywhere kaggle, github, edx, coursera.

источник

08:05пожаловаться #10

ПП

Павел Приказчиков in Natural Language Processing

Aragaer

да

Официально же не поддерживается? Подскажите как используете?

источник

08:07пожаловаться #11

Aragaer in Natural Language Processing

там есть туториал для non-latin символов

источник

08:54пожаловаться #12

ПП

Павел Приказчиков in Natural Language Processing

Понял, спасибо

источник

08:57пожаловаться #13

David (ddale) Dale in Natural Language Processing

Друзья, а кто умеет эффективно скукоживать fasttext? Не классификатор, а именно кусок, который эмбеддинги для OOV слов составляет.
Пока что нашёл статьюшку Андрея Васнецова (https://medium.com/@vasnetsov93/shrinking-fasttext-embeddings-so-that-it-fits-google-colab-cd59ab75959e) и буду её пробовать, но может у кого-нибудь ещё опыт есть такой)

Medium

Shrinking fastText embeddings so that it fits Google Colab

Attempt to compress fastText so it takes 2Gb of RAM instead of 16Gb. Keep new model 94% similar to the original model.

источник

09:04пожаловаться #14

Alexander Kukushkin in Natural Language Processing

Есть опыт сжатия обычных эмбедингов https://github.com/natasha/navec . Там используется квантизация, с fasttext можно так же но логика сложнее

источник

09:53пожаловаться #15

David (ddale) Dale in Natural Language Processing

Alexander Kukushkin

Ага, navec я тоже нашёл и успел полюбить :)
Может, попробую сначала попрюнить fasttext методом Андрея, а потом ещё и квантизировать - твоим)

источник

09:56пожаловаться #16

Rinat Valiullov in Natural Language Processing

https://russia.googleblog.com/2019/12/google.html?m=1

Официальный блог Google Россия

Теперь Google понимает поисковые запросы лучше, чем когда-либо

Панду Найак, вице-президент Google Поиска За 15 лет работы над Google Поиском я понял, что человеческое любопытство не знает границ. Е...

источник

13:04пожаловаться #17

Владислав in Natural Language Processing

Добрый день. Есть ли на премете датасеты для сентиментального анализа на русском для деловых переписок, рабочих обсуждений, в которых негатив выражается не в виде явных оскорблений и "постановках диагнозов", а в завуалированном виде?

источник

13:56пожаловаться #18

Владислав in Natural Language Processing

Или что то близкое по тексту

источник

13:57пожаловаться #19

Vlad in Natural Language Processing

Всем привет. Кто-нибудь решал тут задачу расстановки ударений в русских ФИО? Пробовал russian_g2p, почти всегда на первый слог ставит. Пока никакого решения, кроме как делать словарь ударений для ФИО не вижу...

источник

14:07пожаловаться #20