Телеграмм чат группы natural_language

Size: a a a

Natural Language Processing

2718 membersпожаловаться на группу

2021 May 14

SМ

SancheZz Мов in Natural Language Processing

Директивный прям

источник

13:17пожаловаться #1

David Dale in Natural Language Processing

Я похожую штуку как-то делал, и она докидывала.
1) использовал готовую модель для поиска сущностей в тексте
2) на вход LSTM подавал для каждого слова сразу два эмбеддинга - один для самого слова, другой для сущности, которая в нём найдена (точнее, для IOB тега). Эмбеддинги можно сложить или конкатенировать, как вам больше нравится.

источник

13:19пожаловаться #2

Alexander Kukushkin in Natural Language Processing

🎙 Сегодня вечером с Давидом @cointegrated Дале запустим здесь голосовую конфу. Давид — парень, который развернуто и дружелюбно отвечает даже на дурацкие вопросы https://t.me/natural_language_processing/25359, https://t.me/natural_language_processing/28922 в этом чатике. У нас похожие карьерные пути: учились в ШАДе, работали в Яндексе, ушли заниматься своими проектами. Поговорим про работу в крупной компании и на себя, найм и фриланс. Сейчас Давид занимается NLP в Сколтехе, поспрашиваю какие задачи они решают, сравним науку с индустрией.

Где: здесь в чатике @natural_language_processing.

Когда: сегодня, 14 мая в 19:00 по Москве, продлится примерно полтора часа.

Приходите послушать, поучаствовать. Запись с прошлой встречи https://t.me/natural_language_processing/27957, чтобы понимать как это выглядит.

источник

13:26пожаловаться #3

Alex Mak in Natural Language Processing

Гугл вывел вот на такое:
https://stackoverflow.com/questions/62948332/how-to-add-attention-layer-to-a-bi-lstm/62949137#62949137
https://github.com/philipperemy/keras-attention-mechanism
(Мало ли кто еще будет подобный вопрос тут задавать.)

Stack Overflow

How to add attention layer to a Bi-LSTM

I am developing a Bi-LSTM model and want to add a attention layer to it. But I am not getting how to add it.
My current code for the model is
model = Sequential()
model.add(Embedding(max_words, 1152,

источник

15:52пожаловаться #4

Alex Mak in Natural Language Processing

Спасибо, попробую.

источник

15:53пожаловаться #5

Andrey Tatarinov in Natural Language Processing

Друзья, а есть ли в природе какой-то предобученный миниберт, чтобы можно было использовать как drop-in replacement для RuBERT, но в 4-8 раз меньше по размеру?

источник

15:57пожаловаться #6

David Dale in Natural Language Processing

Русского миниберта не знаю. Но есть mT5-small, у которого если удалить все нерусские токены в словаре и удалить декодер, то останется маленький энкодер.
Насколько маленький? Там 29 млн параметров (112мб), а у BERT от DeepPavlov 178 млн (678 мб). Ну и по скорости инференса он где-то раза в 3 выше.
В этом блокноте я сделал пример использования энкодера от маленького T5.

источник

16:02пожаловаться #7

Anton in Natural Language Processing

🔥 Спасибо ✌🏻

источник

16:03пожаловаться #8

Andrey Tatarinov in Natural Language Processing

Огонь, попробуем, спасибо )

источник

16:03пожаловаться #9

David Dale in Natural Language Processing

Ну а для английского есть классный TinyBERT от Хуавея.
И есть ещё мультиязычный distilbert, у которого можно тоже дропнуть нерусские токены.