Size: a a a

Natural Language Processing

2019 December 28

SP

Sebastian Pereira in Natural Language Processing
Alex Surname
\s не гарантирует наличие \n
Что же, повторюсь, в моем случае рег работает, текст бьется на абзацы
источник

A

Aragaer in Natural Language Processing
а если бы там было \n\t?
источник

A

Aragaer in Natural Language Processing
я бы предложил просто побить на строки по \n, а там уже принимать решения об "абзац кончился, начался новый" либо по наличию пустой строки, либо по тому, что строка начинается с пробельного символа
источник

SP

Sebastian Pereira in Natural Language Processing
Aragaer
а если бы там было \n\t?
Ну, повторюсь, именно поэтому я хочу уйти от regex (не хочу об этом думать, есть поинтересней задачи в проекте)- и возвращаюсь к вопросу как можно искать параграфы без regex
источник

V

Vlad in Natural Language Processing
Aragaer
а если бы там было \n\t?
Можно все \t в самом начале заменить на ' '*4
источник
2019 December 29

D

Den in Natural Language Processing
класс, теперь в gpt-2-simple подкатили возможность файнтюнить 774М+
источник

D

Den in Natural Language Processing
надеюсь вам ещё не пофиг
источник

D

Den in Natural Language Processing
а то ведь "вот же пристал со своим gpt-2-simple"
источник

D

Den in Natural Language Processing
и вопрос с нормальными корпусами ещё в силе
источник

AZ

Andrey Zakharov in Natural Language Processing
Den
и вопрос с нормальными корпусами ещё в силе
А что за вопрос ?
источник

D

Den in Natural Language Processing
где достать нормальные txt корпуса в открытом виде без помощи костыльных скриптов?
источник

V

Vlad in Natural Language Processing
Вряд ли такое вообще есть, ибо написать скрипт это дело в худшем случае пол часа-час
источник

V

Vlad in Natural Language Processing
Да и txt бывают с разным содержимым и разметкой, каждому не угодить
источник

D

Den in Natural Language Processing
хотя я уже начинаю задаваться вопросом "а стоит ли вообще файнтюнить?"
источник

V

Vlad in Natural Language Processing
Ну, отказываться от реализации каких-то своих идей просто потому что вы не смогли найти ничего готового (что б взять, добавить пару строк кода, покрутить пару параметров и получить крутой результат) довольно глупо, имхо)
источник

D

Den in Natural Language Processing
не, я не про то, я про использование обученной модели как есть
источник

V

Vlad in Natural Language Processing
И к тому же сейчас у всех корпоративы и нг, вряд ли даже те, кто может помочь, будет это делать, ибо лень и все гуляют)
источник

D

Den in Natural Language Processing
у меня вот блокнотик
https://colab.research.google.com/drive/14I8G1uTUxvUaSF9BG0gaVr4odg5ewYRF,
мне надо запилить:
- интерфейс для I/O
- генерацию на input пользователя
- долговременную/коротковременную (кэш) память
источник

D

Den in Natural Language Processing
я лично сам, повторюсь, особо без понятия как это реализовывать
источник

D

Den in Natural Language Processing
Vlad
И к тому же сейчас у всех корпоративы и нг, вряд ли даже те, кто может помочь, будет это делать, ибо лень и все гуляют)
ну, что уж, надо было раньше реагировать когда спрашивал в первый раз
источник