Size: a a a

Natural Language Processing

2020 February 11

V

Vlad in Natural Language Processing
Всем привет. Разбираюсь тут с https://github.com/nsu-ai/russian_g2p и возник вопрос: т.к. я первый раз столкнулся с такой транскрипцией, можете пожалуйста объяснить/дать ссылки на статьи, где описывается такая транскрипция? Мне интересно, как отличить ударные звуки от безударных в выводе этой библиотеки

Как я понял, все доступные фонемы перечислены тут https://github.com/nsu-ai/russian_g2p/blob/master/russian_g2p/modes/Phonetics.py#L17

Пытаюсь разобраться, можно ли просто заменить ударные фонемы безударными и наоборот
источник

AK

Anton K. in Natural Language Processing
Квадрат Чёрный
Autosuggestion для дополнения введенной подстроки?

Trie + частотная статистика запросов (если есть, а иначе близость по левенштейну какому-нибудь)
да, для дополнения. частотная статистика это как? это чтобы предугадывать наиболее вероятное следующее слово?
источник

Г

Герман in Natural Language Processing
Anton K.
да, для дополнения. частотная статистика это как? это чтобы предугадывать наиболее вероятное следующее слово?
Думаю, имелось в виду с большей вероятностью подсказывать более частотные запросы
источник

DV

Dima Veselov in Natural Language Processing
👨‍🔧 На днях запустил канал с самими свежими публикациями про Machine Learning, если кому-то это близко и интересно, то велкам: @Recent_AI 🤙

🤖 Всё автоматизировано и статьи парсятся с более чем 180 RSS лент компаний (OpenAI, Google AI, DeepMind и тд) и очень большого числа личных блогов дата-саентистов 👨‍🚀
👹 Уже сейчас там прикручено голосование (лайк/дизлайк), которое удаляет посты, если они набрали большое количество дизов (чтоб фильтровать шлак). В дальнейшем ещё хочу докрутить публикацию дайджеста самого интересного за неделю, плюс предварительную классификацию по тексту статьи 😜

🤝 Буду безмерно благодарен, если подпишитесь или расскажите друзьям!
источник

КЧ

Квадрат Чёрный in Natural Language Processing
Anton K.
да, для дополнения. частотная статистика это как? это чтобы предугадывать наиболее вероятное следующее слово?
да. Тривиальный trie-search будет отдавать список всех терминов у которых префикс совпадает с вводом. если отсортировать по длине суффикса будут выбираться жадные кандидаты (ху -> хуК, в то время как частотным запросом может являться хуРМА).
источник

AK

Anton K. in Natural Language Processing
это всё в памяти надо будет хранить?
источник

КЧ

Квадрат Чёрный in Natural Language Processing
Anton K.
это всё в памяти надо будет хранить?
Тут все зависит от ваших требований к системе. Если база терминов небольшая можно в памяти. Если большая то нужны базы данных и всякие эластиксерчи
источник

AP

Alexandra Panina in Natural Language Processing
Всем привет! Подскажите пожалуйста библиотеку для синтаксического анализа русского текста
источник

W_

Wad _B in Natural Language Processing
Alexandra Panina
Всем привет! Подскажите пожалуйста библиотеку для синтаксического анализа русского текста
источник

AP

Alexandra Panina in Natural Language Processing
Благодарю. Если ещё найдется,то тоже покажите
источник

SS

Sergey Sikorskiy in Natural Language Processing
источник

W_

Wad _B in Natural Language Processing
Alexandra Panina
Благодарю. Если ещё найдется,то тоже покажите
Ну это вторая ссылка в гугле по запросу синтаксический анализ текста. Я думаю, что таких решений уж точно около 10 можно найти ещё в гугле либо на гитхабе
источник

SS

Sergey Sikorskiy in Natural Language Processing
Изучаем синтаксические парсеры для русского языка
Автор этой статьи есть в этом чате.
источник
2020 February 12

A

Alex in Natural Language Processing
день добрый всем… может кто подскажет в какую сторону копать - у меня есть куча документов в каждом из которых описаны характеристики каких-то обьектов (каких не известно) - например, в одном написано /мы провели тестирование с таким то котлом и его температура оказалась слишком высокой при таких-то условиях эксперимента/. Хотелось бы из каждого документа извлечь пары типа /котел: высокая температура/ итд
источник

V

Viktor in Natural Language Processing
а что есть годного для перевода RU->EN?

yandex translate редактора сказали что не особо понравилось
источник

A

Aragaer in Natural Language Processing
на хабре ж недавно было про какой-то новый DeepL чтле
источник

VB

Vladimir Bougay in Natural Language Processing
Viktor
а что есть годного для перевода RU->EN?

yandex translate редактора сказали что не особо понравилось
источник

VB

Vladimir Bougay in Natural Language Processing
но за полгода думаю много чего поменялось
источник

VB

Vladimir Bougay in Natural Language Processing
попробуйте вживую на сайте у https://inten.to
источник

V

Viktor in Natural Language Processing
спс
источник