Size: a a a

Natural Language Processing

2021 July 15

DD

David Dale in Natural Language Processing
Толока. Нужно много париться с обучающими и контрольными заданиями, но когда всё настроишь, то можно большие объемы размечать.
источник

КМ

Кибер Медик... in Natural Language Processing
А чем отличается т5 от https://huggingface.co/cointegrated/rut5-base?
источник

DD

David Dale in Natural Language Processing
Мой rut5-base - просто русская вырезка из мультиязычного mT5 (плюс multitask версия пофайнтюненная на нескольких небольших русских датасетах), а Сберовский, как я понимаю, обучали с нуля на бОльшем объеме русских текстов.
источник

SancheZz Мов in Natural Language Processing
Угу
источник

SM

Sergei Markoff in Natural Language Processing
Да, мы учили «с нуля».
источник

SS

Sergey Sikorskiy in Natural Language Processing
Пардон. Но там, вроде, куча ссылок разных запощена. Ну и html - это же не plain text, в нем все уже расструктурировано и размечено. Нужно, по большей части, просто добраться до нужного места в этой структуре. Можно, конечно, превратить все в plain text и делать NER на нем 🙂
источник

VL

Valery Lazarev in Natural Language Processing
источник

SP

Sebastian Pereira in Natural Language Processing
Пробуем работать с ребятами из LabelMe
источник

SP

Sebastian Pereira in Natural Language Processing
Напишу, кстати, по результатам.
источник

LS

Lily Sabirzyanova in Natural Language Processing
Всем привет! Подскажите, плиз! Я дообучила фасттекст, получила новые эмбеддинги.  А теперь мне сказали. Все перепиши под Спарк. А можно как-то эмбединги полученные ранее применить в Спарке?
источник

d

dePuff in Natural Language Processing
Мне как-то даже неудобно будет первой ссылкой из гугла ответить
источник

LS

Lily Sabirzyanova in Natural Language Processing
Ответьте, уж пожалуйста, может я запрос неверный пишу
источник

t2

tonko 22 in Natural Language Processing
Ответьте запросом в гугл. Эффективные запросы - это полезные знания
источник

t2

tonko 22 in Natural Language Processing
Можете еще указать какая у вас при этом локация указана :)
источник

t2

tonko 22 in Natural Language Processing
Я обычно на US переключаю, если испытываю проблемы с сомнительной выдачей
источник

LS

Lily Sabirzyanova in Natural Language Processing
Нашла на 7 странице в выдаче от johnsnowlabs... может, про этот ответ имелось ввиду.
источник

t2

tonko 22 in Natural Language Processing
Видали кстати че Яндекс удумал? Как думаете, здоровая затея?
источник

d

dePuff in Natural Language Processing
Может я задачу не так представляю
PySpark можно?

Если да, то: https://futurice.com/blog/classifying-text-with-fasttext-in-pyspark
источник

FF

Futorio Franklin in Natural Language Processing
В гугл колабе при выпадении ошибки, предлагается погуглить её на Stackoverflow  вот этот крутая вещь
источник

t2

tonko 22 in Natural Language Processing
Это да, круто
источник