Size: a a a

Natural Language Processing

2020 July 10

VF

Vadim Fomin in Natural Language Processing
ой, я имел в виду вычислять в датасете, да. даталоадер переписывать не надо. можно, например, в ините подавать на вход тексты в сыром виде, а в getitem'е уже добавлять токенизацию и паддинг
источник

VF

Vadim Fomin in Natural Language Processing
и аттеншен маск вычислять
источник

A

Alexander in Natural Language Processing
Попробую👍
источник

v

vy in Natural Language Processing
What language is this... Cnt u guys talk in English so that everyone could understand.. 🙁....
источник

v

vy in Natural Language Processing
Hope it's btr to leave the group if I dnt knw the language... ... Ryt guys
источник

v

vy in Natural Language Processing
😅
источник

SZ

Sergei Zotov in Natural Language Processing
Maybe it's going to be your new NLP task: to write a translation algorithm that understands that "Klingon" language
источник

VF

Vadim Fomin in Natural Language Processing
Учи олбанский!
источник

t

toriningen in Natural Language Processing
Vadim Fomin
Учи олбанский!
нужен корпус текстов на олбанском
источник

v

vy in Natural Language Processing
Sergei Zotov
Maybe it's going to be your new NLP task: to write a translation algorithm that understands that "Klingon" language
🤣...  Happy that I found smone who could explain what language this is
источник

v

vy in Natural Language Processing
And frnd.. I hope that's not a big deal
источник

v

vy in Natural Language Processing
Wow... I think its an akita with u... 😍
источник

SZ

Sergei Zotov in Natural Language Processing
vy
Wow... I think its an akita with u... 😍
It's a Shiba actually (the famous Doge), but you were almost correct: Akita is like a bigger Shiba, they are from the same family and country (Japan)
источник

v

vy in Natural Language Processing
Yah... Anyhow that dog is not in my country... I had  only seen him from the Japanese flm hachiko 🤣... Any how I appreciate your time to correct me
источник
2020 July 12

A

Anton in Natural Language Processing
Есть ли у кого-то датасет на русском языке размеченный для восстановления пунктуации?
источник

FF

Futorio Franklin in Natural Language Processing
Anton
Есть ли у кого-то датасет на русском языке размеченный для восстановления пунктуации?
Можно же просто взять текст и удалить из него пунктуацию
источник

M

Mineni in Natural Language Processing
Есть метод проверить язык текста? Какая нибудь библиотека или что-то такое
источник

FF

Futorio Franklin in Natural Language Processing
Mineni
Есть метод проверить язык текста? Какая нибудь библиотека или что-то такое
https://fasttext.cc/docs/en/language-identification.html Можно начать с этого
источник

K

Kir in Natural Language Processing
langdetect еще
источник

M

Mineni in Natural Language Processing
Ага, спасибо
источник