Телеграмм чат группы natural_language

Всем привет!

А правильно я понимаю, что модели на основе bert можно дофайнтьюнить, чтобы они искали не просто стандартные named entities (типа организации, персоны, деньги), а более специфические?

Например в том же кредитном договоре есть сумма кредита, есть процентная ставка, график платежей с суммами платежей. Все это ДЕНЬГИ (ну или ок, проценты), но, скажем так, деньги разного типа.

И мне соответственно нужен датасет с размеченными этими разными суммами, чтобы дообученная модель их правильно распознавала?

И еще, правильно я понимаю, что bert сможет это сделать (если сможет конечно), т к учитывает контекст, т е текст окружающий ту или иную сумму денег?

источник

20:00пожаловаться #6

DD

David Dale in Natural Language Processing

Alex Mak

Всем привет!

А правильно я понимаю, что модели на основе bert можно дофайнтьюнить, чтобы они искали не просто стандартные named entities (типа организации, персоны, деньги), а более специфические?

Например в том же кредитном договоре есть сумма кредита, есть процентная ставка, график платежей с суммами платежей. Все это ДЕНЬГИ (ну или ок, проценты), но, скажем так, деньги разного типа.

И мне соответственно нужен датасет с размеченными этими разными суммами, чтобы дообученная модель их правильно распознавала?

И еще, правильно я понимаю, что bert сможет это сделать (если сможет конечно), т к учитывает контекст, т е текст окружающий ту или иную сумму денег?

Да, всё верно. Если обучающие данные есть, то BERT вполне можно на задачу распознавания таких сущностей зафайнтюнить.
Хотя если договоры достаточно типовые, то, может быть, можно даже и без машинного обучения справиться)

источник

20:02пожаловаться #7

AM

Alex Mak in Natural Language Processing

David Dale

Да, всё верно. Если обучающие данные есть, то BERT вполне можно на задачу распознавания таких сущностей зафайнтюнить.
Хотя если договоры достаточно типовые, то, может быть, можно даже и без машинного обучения справиться)

Да я вот тоже думаю искать просто в «окрестностях» найденной стандартной моделью суммы «ключевые слова» чисто через регулярки. Просто пытаюсь понять все варианты решения задачи.

Спасибо!

источник

20:05пожаловаться #8

YS

Yehor Smoliakov in Natural Language Processing

Добрый день.

Есть ли open source инструмент для расстановки ударений? По типу https://morpher.ru/accentizer/

источник

21:05пожаловаться #9

NS

Nikolay V. Shmyrev in Natural Language Processing

https://github.com/nsu-ai/russian_g2p

GitHub

nsu-ai/russian_g2p

Accentor and transcriptor for Russian language. Contribute to nsu-ai/russian_g2p development by creating an account on GitHub.

источник

21:07пожаловаться #10

YS

Yehor Smoliakov in Natural Language Processing

Nikolay V. Shmyrev

https://github.com/nsu-ai/russian_g2p

GitHub

nsu-ai/russian_g2p

Accentor and transcriptor for Russian language. Contribute to nsu-ai/russian_g2p development by creating an account on GitHub.

Спасибо!

источник

21:07пожаловаться #11

YS

Yehor Smoliakov in Natural Language Processing

@nshmyrev это побочное ударение?

источник

21:53пожаловаться #12

YS

Yehor Smoliakov in Natural Language Processing

Переслано от Yehor Smoliakov

источник

21:53пожаловаться #13

2021 March 30

V

Vic in Natural Language Processing

Ребят, а кто как проверяет нагрузку, сколько может выдержать нейросеть на inference на сервере с gpu - одновременных подключений юзеров?
Нужно понять когда сервер упадет(по памяти гпу или оперативной) или когда станет медленнее отвечать

источник

10:24пожаловаться #14

AK

Alastar Kriminetskiy in Natural Language Processing

locust

источник

10:25пожаловаться #15

OR

Oleg Ruban in Natural Language Processing

Всем привет)

Подскажите, пожалуйста, какие есть предобученные модели для суммаризации текста на русском языке?

источник

12:05пожаловаться #16

SK

Sasha Korovii in Natural Language Processing

Здравствуйте такой вопрос, нужно генерировать предложения, но чтобы в середине каждого предложении встречалось некоторое слово или словосочетание, которое задает пользователь, может кто-то делал такую задачу?

источник

12:40пожаловаться #17

A

Anton in Natural Language Processing

Oleg Ruban

Всем привет)

Подскажите, пожалуйста, какие есть предобученные модели для суммаризации текста на русском языке?

summarus, hugging face

источник

12:41пожаловаться #18

OR

Oleg Ruban in Natural Language Processing

Anton