Size: a a a

Natural Language Processing

2020 May 11

D

Denis in Natural Language Processing
первый раз услышал о Universal dependencies...))
источник

D

Denis in Natural Language Processing
что мне там нужно взять и можно ли вообще на них обучить?
источник

D

Denis in Natural Language Processing
источник

DK

Denis Kirjanov in Natural Language Processing
про сравнительный анализ арабских корпусов ничего не знаю, к сожалению, можно взять просто самый большой
почитайте про формат conllu, там тексты в нем. Можно собрать из них предложения и скормить это, разбив на трейн и тест. И еще сравнить с существующими решениями типа UDPipe, мб не надо велосипеды строить
источник

D

Denis in Natural Language Processing
понял, спасибо) надо поразбираться 🙂
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
День добре
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
Возможно обращаюсь немного не по адресу, но может ли кто-то подсказать...
Есть строчки вида "Author __keyword1 number.. keyword2 number..."
Надо разбить на связные списки, где в начале будет Author а дальше пары keyword number, как проще всего сделать? Желательно в Python
источник

AC

Anton Cherepkov in Natural Language Processing
Хороший Лисичко
Возможно обращаюсь немного не по адресу, но может ли кто-то подсказать...
Есть строчки вида "Author __keyword1 number.. keyword2 number..."
Надо разбить на связные списки, где в начале будет Author а дальше пары keyword number, как проще всего сделать? Желательно в Python
Можно пример строчки? А то по описанию не очень понятно.
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
"©Boris Alexeev. fig 13 cat 25 fig 77"
Что-то вроде такого
источник

AC

Anton Cherepkov in Natural Language Processing
после имени всегда точка?
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
Секунду
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
Ага, совсем не так ,напутал
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
"©Boris Alexeev  fig. 13, cat. 25, fig. 77."
Что-то вроде такого
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
После автора всегда только пробел
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
В номере могут быть латинские буквы
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
Запятые ставятся тоже всегда
источник

AC

Anton Cherepkov in Natural Language Processing
Точки тоже всегда?
источник

ХЛ

Хороший Лисичко... in Natural Language Processing
Anton Cherepkov
Точки тоже всегда?
Да
источник

AZ

Alexander Zdorovets in Natural Language Processing
По строчкам пройтись регулярками. Если очень хочется связные списки, то либо написать самому, либо использовать collections.deques, что в принципе может сойти за них, если не вглядываться особо
источник

AC

Anton Cherepkov in Natural Language Processing
Хороший Лисичко
"©Boris Alexeev  fig. 13, cat. 25, fig. 77."
Что-то вроде такого
источник