Size: a a a

Natural Language Processing

2021 March 29

MM

Mikhail Mashkovich in Natural Language Processing
Это просто запись живого потока http://atom.services.livejournal.com/atom-stream.xml и http://www.livejournal.com/stats/latest-rss.bml для журнала по сбору и аннотации картинок, публикуемых в жж https://salariman.livejournal.com/
источник

ИВ

Иба Ву in Natural Language Processing
Привет

Скажите пожалуйста есть ли библиотека для python которая помогает при проверке русской орфографии??

На правописание именно русских слов
источник

ИВ

Иба Ву in Natural Language Processing
Поможете?
источник

🐙

🐙 in Natural Language Processing
Иба Ву
Поможете?
Попробуйте поиск по чату, тема неоднократно поднималась
источник

ИВ

Иба Ву in Natural Language Processing
Окей
источник

AM

Alex Mak in Natural Language Processing
Всем привет!

А правильно я понимаю, что модели на основе bert можно дофайнтьюнить, чтобы они искали не просто стандартные named entities (типа организации, персоны, деньги), а более специфические?

Например в том же кредитном договоре есть сумма кредита, есть процентная ставка, график платежей с суммами платежей. Все это ДЕНЬГИ (ну или ок, проценты), но, скажем так, деньги разного типа.

И мне соответственно нужен датасет с размеченными этими разными суммами, чтобы дообученная модель их правильно распознавала?

И еще, правильно я понимаю, что bert сможет это сделать (если сможет конечно), т к учитывает контекст, т е текст окружающий ту или иную сумму денег?
источник

DD

David Dale in Natural Language Processing
Alex Mak
Всем привет!

А правильно я понимаю, что модели на основе bert можно дофайнтьюнить, чтобы они искали не просто стандартные named entities (типа организации, персоны, деньги), а более специфические?

Например в том же кредитном договоре есть сумма кредита, есть процентная ставка, график платежей с суммами платежей. Все это ДЕНЬГИ (ну или ок, проценты), но, скажем так, деньги разного типа.

И мне соответственно нужен датасет с размеченными этими разными суммами, чтобы дообученная модель их правильно распознавала?

И еще, правильно я понимаю, что bert сможет это сделать (если сможет конечно), т к учитывает контекст, т е текст окружающий ту или иную сумму денег?
Да, всё верно. Если обучающие данные есть, то BERT вполне можно на задачу распознавания таких сущностей зафайнтюнить.
Хотя если договоры достаточно типовые, то, может быть, можно даже и без машинного обучения справиться)
источник

AM

Alex Mak in Natural Language Processing
David Dale
Да, всё верно. Если обучающие данные есть, то BERT вполне можно на задачу распознавания таких сущностей зафайнтюнить.
Хотя если договоры достаточно типовые, то, может быть, можно даже и без машинного обучения справиться)
Да я вот тоже думаю искать просто в «окрестностях» найденной стандартной моделью суммы «ключевые слова» чисто через регулярки. Просто пытаюсь понять все варианты решения задачи.

Спасибо!
источник

YS

Yehor Smoliakov in Natural Language Processing
Добрый день.

Есть ли open source инструмент для расстановки ударений? По типу https://morpher.ru/accentizer/
источник

NS

Nikolay V. Shmyrev in Natural Language Processing
источник

YS

Yehor Smoliakov in Natural Language Processing
Спасибо!
источник

YS

Yehor Smoliakov in Natural Language Processing
@nshmyrev это побочное ударение?
источник

YS

Yehor Smoliakov in Natural Language Processing
Переслано от Yehor Smoliakov
источник
2021 March 30

V

Vic in Natural Language Processing
Ребят, а кто как проверяет нагрузку, сколько может выдержать нейросеть на inference на сервере с gpu - одновременных подключений юзеров?
Нужно понять когда сервер упадет(по памяти гпу или оперативной) или когда станет медленнее отвечать
источник

AK

Alastar Kriminetskiy in Natural Language Processing
locust
источник

OR

Oleg Ruban in Natural Language Processing
Всем привет)

Подскажите, пожалуйста, какие есть предобученные модели для суммаризации текста на русском языке?
источник

SK

Sasha Korovii in Natural Language Processing
Здравствуйте такой вопрос, нужно генерировать предложения, но чтобы в середине каждого предложении встречалось некоторое слово или словосочетание, которое задает пользователь, может кто-то делал такую задачу?
источник

A

Anton in Natural Language Processing
Oleg Ruban
Всем привет)

Подскажите, пожалуйста, какие есть предобученные модели для суммаризации текста на русском языке?
summarus, hugging face
источник

OR

Oleg Ruban in Natural Language Processing
Anton
summarus, hugging face
спасибо
источник

И

Известно Кто... in Natural Language Processing
Здравствуйте! Не подскажете каких нибудь специализированных трансформеров для doc2vec?
источник