Size: a a a

Natural Language Processing

2021 October 21

A

Andrey in Natural Language Processing
take a look to "bertopic" package, spelled exactly. it has the dynamic topic modeling and visualisation functionality
источник

A

Anton in Natural Language Processing
это из-за bbpe токенайзера? на обучение не повлияет? ))
источник

DD

David Dale in Natural Language Processing
Если ты это токенайзером декодируешь, получишь назад валидный текст. Поэтому нет, не влияет.
источник

A

Anton in Natural Language Processing
Да, поторопился, функция encode работает отлично
источник

🐙

🐙 in Natural Language Processing
Спрашивал когда-то про методы/функции заменять в строке символы на аналогичные по словарю и без ручных for'ов. Нашёл, вот встроенная функциональность, вдруг кому тоже будет полезно: https://docs.python.org/3.8/library/stdtypes.html#str.translate
источник

Д

Данил in Natural Language Processing
Вопрос про получения эмбеддинга предложения в LASER. Мы ему скармливаем обработанное предложение (удаление стоп-слов, приведение к нижнему регистру и тд) или исходное предложение?
источник

ВК

Владимир Кузовкин... in Natural Language Processing
коллеги,добрый вечер всем!
У меня следующий вопрос. Я столкнулся со следующдей темой - Neural Question Generation,Если я верно понял,то это концепция,позволяющая создавать вопросы по тексту. Скажите: кто то занимался нечто подобным? Есть ли готовые пакеты в pythone?

И второй вопрос: кто-нибудь работал с seq2seq моделями?
источник
2021 October 22

KZ

Konstantin Zharikov in Natural Language Processing
Коллеги, а есть где-нибудь в открытом доступе размеченная база "наименование товара - код ОКПД2"?
источник

VS

Vladimir Shitov in Natural Language Processing
А никого в последнее время не спамят на почту письмами с рандомным на первый взгляд набором символов?
источник

VS

Vladimir Shitov in Natural Language Processing
источник

VS

Vladimir Shitov in Natural Language Processing
Удивляет две вещи:
1. Гугл не помечает это как спам
2. Некоторые письма он отмечает как "важное"!

Внутри – 1-2 строки таких символов и HTML-файл, которые я, понятно, не открываю
источник

NR

Nikita Repeev in Natural Language Processing
adversarial атака на спам фильтры?
источник

A

Anastasia in Natural Language Processing
Да, мне спамят, уже неделю наверное!
источник

VS

Vladimir Shitov in Natural Language Processing
Вот, также
источник

A

Andrey in Natural Language Processing
здравствуйте, меня зовут Андрей, и я тоже получаю такие письма.

когда я нажал в спам, они стали попадать в спам. удивительный факт, конечно, но что только не бывает)

а так - действительно похоже adversarial
источник

VS

Vladimir Shitov in Natural Language Processing
Я тоже отмечаю как спам и стало меньше просачиваться. Но все ещё прорываются пару раз в неделю
источник

A

Anastasia in Natural Language Processing
Здравствуйте, Андрей! Если бы они попадали в спам автоматически, думаю такой вопрос бы не появился.
Есть ли какой-то способ избавиться от adversarial?
источник

A

Andrey in Natural Language Processing
ну так пока я не нажал в спам, их было много, теперь нет. я про то что фильтры - они слегка индивидуальны.

это единственный способ избавиться, доступный пользователю. еще можно в техподдержку написать, но я думаю там нвписавших уже очередь до Ла-Манша
источник

AP

Alex Peresmeshnik in Natural Language Processing
Способ есть - не пользоваться гуглом :)
источник

ЯЗ

Я — пехотинец Владим... in Natural Language Processing
На мэил больше года такое приходит, стабильно 3-4 письма в день
источник