Size: a a a

Natural Language Processing

2021 November 16

АП

Антон Помещенко... in Natural Language Processing
Hi Cem, ok
источник

I

Igor in Natural Language Processing
наша статья по рукописке
https://habr.com/ru/company/sberbank/blog/589537/
По опыту, на трудовых качество выбить для исключения человека из процесса не получиться
источник

GF

Grigory Frantsuzov in Natural Language Processing
уже же все на электронные переехали
источник

EL

Evgeniy Lashchenov in Natural Language Processing
Количество кандидатов с электронными мало, но переезжают постепенно на них, да
источник

EL

Evgeniy Lashchenov in Natural Language Processing
Спасибо за наводку :)
источник

SS

Sergey Shulga in Natural Language Processing
Меня всегда гложат противоречивые чувства пром таких задачах, сидишь, ищешь соту в очень сложной задаче, которая решает на 95% только ретроспективную проблему. Ещё лет 10-20, и машиночитаемый текст (в крайнем случае просто печатный) будет повсеместно.
источник

Eg

Elena gisly in Natural Language Processing
у меня все знакомые наоборот не хотят переезжать на электронные, особенно кто имел раньше отношение к их разработке) другое дело, что в будущем выбора уже не будет, наверное
источник

B

Banof in Natural Language Processing
🔫 Ruben Gilbert кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@LoneGeek, Natalia, @gislygisly, @Memu_pro_kotow, @wadimiusz
При поддержке Золота Бородача
источник

AP

Arsen Plus in Natural Language Processing
It might be a bit late, but as far as I remember noun chunks and some other common patterns are implemented in textacy
источник

МА

Максим Антонов... in Natural Language Processing
Привет. Играюсь вот с этим https://huggingface.co/cointegrated/rut5-small-chitchat

Хочется потюнить на своем датасете генерацию ответов. Может есть у кого под рукой понятный туториал. Все что нахожу -  во-первых куча каких-то движений с парой-тройкой собственных классов, а во-вторых нет информации как готовить датасет для обучения.
источник
2021 November 17

DD

David Dale in Natural Language Processing
Привет!
Есть такой блокнот с минимумом используемых классов (по факту, голый pytorch) и с очень простой подготовкой данных (обучение на экспортированном чатике из Телеги).
Если хочется готовить датасет как-то более хитро, то уже твоя задача - разобраться, чего конкретно хочется)
источник

К

Кирилл in Natural Language Processing
Ровно то же самое недавно делал:
https://github.com/Kirili4ik/ruDialoGpt3-finetune-colab
источник

МА

Максим Антонов... in Natural Language Processing
Большое спасибо.
источник

V

Valeriia in Natural Language Processing
Да, @mr_B1onde (Егорка), спасибо, что опубликовали этот пост вместо меня👍
Буду рада пообщаться, если вдруг кого-то интересуют digital celebrities 🤑 или может кто "в поиске работы" 👨‍💻
источник

A

Andrey in Natural Language Processing
ничего не понятно, и вообще неинтересно.
источник

KA

Katya Artemova in Natural Language Processing
коллеги, а кто-нибудь видел bertscore, адаптированный для русского?
источник

KA

Katya Artemova in Natural Language Processing
или какой-то простой способ, как в bertscore использовать кастомную модель?
источник

DD

David Dale in Natural Language Processing
!pip install bert-score
from bert_score import score
P, R, F1 = score(left_texts, right_texts, model_type='bert-base-multilingual-cased', verbose=False)
тут model_type передаётся в AutoModel.from_pretrained из huggingface, а значит, модель можно воткнуть практически любую.
источник

DD

David Dale in Natural Language Processing
А адаптаций для русского я не видел, но это, кажется, и не нужно, потому что авторы статьи про bert score берут ванильный берт и никак его не файнтюнят, просто сразу близость эмбеддингов меряют
источник

IG

Ilya Gusev in Natural Language Processing
+, можно просто воткнуть любой русский bert
источник