Size: a a a

Natural Language Processing

2020 August 09

N

Natalia in Natural Language Processing
где писали? в интернете?
источник

N

Nire in Natural Language Processing
Natalia
где писали? в интернете?
везде, поскольку клава была с русским шрифтом, очень много данных так поломано
источник

N

Natalia in Natural Language Processing
ну так это для всех языков проблема, но зачем начинать с грязных данных? как они помогут в задаче тренировки переводчика?
источник

OS

Oleg Serikov in Natural Language Processing
Nire
везде, поскольку клава была с русским шрифтом, очень много данных так поломано
а полевые лингвисты не публиковали корпусы?
источник

N

Nire in Natural Language Processing
Oleg Serikov
а полевые лингвисты не публиковали корпусы?
не хотят делиться
источник

N

Nire in Natural Language Processing
яндексу дали, своим нет)
источник

N

Natalia in Natural Language Processing
а если конечная цель - это работа с грязными данными, то нужно сначала в них ковыряться и разбираться, что за типы соответствий бывают. может, там правда правила помогут
источник

N

Natalia in Natural Language Processing
Nire
яндексу дали, своим нет)
боже мой, какие ж вы смешные
источник

N

Natalia in Natural Language Processing
а что яндексу и вам от полевых записей, если они с шансами а) на диалектных данных, б) в транскрипции
источник

N

Nire in Natural Language Processing
Natalia
боже мой, какие ж вы смешные
на самом деле есть большой корпус переводов текстов в национальной библиотеке, но их давать на опенсюрс проект никто не хочет
источник

OS

Oleg Serikov in Natural Language Processing
?!!!!
источник

N

Natalia in Natural Language Processing
в якутской библиотеке?
источник

N

Nire in Natural Language Processing
Natalia
в якутской библиотеке?
да
источник

OS

Oleg Serikov in Natural Language Processing
национальная же библиотека
источник

OS

Oleg Serikov in Natural Language Processing
ну всм
источник

OS

Oleg Serikov in Natural Language Processing
библиотека
источник

OS

Oleg Serikov in Natural Language Processing
она же открытая
источник

N

Natalia in Natural Language Processing
ребят, у текстов есть авторы, а дальше привет авторскому праву
источник

OS

Oleg Serikov in Natural Language Processing
а ой(((((
источник

AP

Alex Peresmeshnik in Natural Language Processing
тексты хоть оцифрованы?
источник