Size: a a a

Natural Language Processing

2020 April 26

М

Максим in Natural Language Processing
Раз уж такие дела, мне нужно извлекать имена-фамилии-отчества русские, но есть один нюанс: текст с распознавания речи, так что они могут перемежаться всякими "ммммм". Наташа что-то не очень. Пробовал 🤗, он захватывает междометия, мб придется пост писать просто. (Кстати, всем привет, первый раз отписываюсь тут 👋)
источник

AK

Alexander Kukushkin in Natural Language Processing
Лайла ты идёшь?
Подскажите пожалуйста, как называются эти поля в новых версиях ipmarkup?
# pip install ipymarkup
from ipymarkup import show_span_ascii_markup as show_markup

spans = []
for match in result.walk():
   start, stop = match.span
   label = match.referent.label
   spans.append([start, stop, label])
show_markup(result.text, spans)
источник

Л

Лайла ты идёшь? in Natural Language Processing
Alexander Kukushkin
# pip install ipymarkup
from ipymarkup import show_span_ascii_markup as show_markup

spans = []
for match in result.walk():
   start, stop = match.span
   label = match.referent.label
   spans.append([start, stop, label])
show_markup(result.text, spans)
Спасибо большое
источник

KS

Konstantin Smith in Natural Language Processing
Максим
Раз уж такие дела, мне нужно извлекать имена-фамилии-отчества русские, но есть один нюанс: текст с распознавания речи, так что они могут перемежаться всякими "ммммм". Наташа что-то не очень. Пробовал 🤗, он захватывает междометия, мб придется пост писать просто. (Кстати, всем привет, первый раз отписываюсь тут 👋)
Я на SDK Pullenti делал похожую задачу, когда нужно было по введённым в поле ФИО выделить, где что. Там могли быть и ошибки, и вставки мусора. Использовал возможности не полноценного NER по выделению сущностей, а конкретно класса PersonItemToken - выделял токены, которые могут быть кандидатами на ф.и.о., и на этом принимал решение.
источник

М

Максим in Natural Language Processing
Konstantin Smith
Я на SDK Pullenti делал похожую задачу, когда нужно было по введённым в поле ФИО выделить, где что. Там могли быть и ошибки, и вставки мусора. Использовал возможности не полноценного NER по выделению сущностей, а конкретно класса PersonItemToken - выделял токены, которые могут быть кандидатами на ф.и.о., и на этом принимал решение.
Спасибо! Забавно что автор отписался двумя сообщениями выше 🙃 буду пробовать!
источник
2020 April 27

RV

Ruchit Vithani in Natural Language Processing
Can I ask questions about NLP here? I can speak english. I do not know what language people are using in the conversation in this channel.
источник

D(

David (ddale) Dale in Natural Language Processing
Ruchit Vithani
Can I ask questions about NLP here? I can speak english. I do not know what language people are using in the conversation in this channel.
Yes, you can. Or you can go to https://t.me/nlp_eng
By the way, here it is Russian.
источник

RV

Ruchit Vithani in Natural Language Processing
Thank you :)
источник

AG

Alexey Gavrilov in Natural Language Processing
привет!
источник

AG

Alexey Gavrilov in Natural Language Processing
подскажите, пожалуйста, где можно найти список всех предикатов, которые есть в yargy?
нашел несколько ссылок на официальную документацию по этому вопросу, то том числе из приклепленки, но они все ведут на страницы с 404 кодом
источник

AK

Alexander Kukushkin in Natural Language Processing
Alexey Gavrilov
подскажите, пожалуйста, где можно найти список всех предикатов, которые есть в yargy?
нашел несколько ссылок на официальную документацию по этому вопросу, то том числе из приклепленки, но они все ведут на страницы с 404 кодом
источник

AS

Artem Semenov in Natural Language Processing
Hello world !
источник

AG

Alexey Gavrilov in Natural Language Processing
спасибо!
источник

V

Vishal in Natural Language Processing
Переслано от Vishal
hey everyone i am using pytorch on kaggle for text classification but here GPU allocation is zero though i used .cuda() function
источник

V

Vishal in Natural Language Processing
Переслано от Vishal
how to resolve it
источник

GG

Gleb Glushkov in Natural Language Processing
Ребят, а какой обычно язык выбирают при back translation (для расширения датасета) для английского языка?
источник

VM

Valentin Malykh in Natural Language Processing
тот, который доступен, обычно это европейские - французский, немецкий, испанский
источник

SP

Sebastian Pereira in Natural Language Processing
Привет! Тестируем разные способы: используем SpaCy для NER model lg, по сути часть решения это только поиск 2 entity’s. Мне не нравится быстродействие и размер модели. Думаю в сторону либо тренировки собственно custom модели, или уменьшения размера текущей. Кто-нибудь решал похожую задачу?
источник

SP

Sebastian Pereira in Natural Language Processing
Ищем даты и гео-таги.
источник

SP

Sebastian Pereira in Natural Language Processing
Пробовал с fasttext - быстро, но очень плохой результат.
источник