Size: a a a

Natural Language Processing

2021 March 22

DD

David Dale in Natural Language Processing
Andrei
А по теме кластеризации новостей, какие есть основные работы?

Или где такое лучше искать, кроме гугл-школяр.
На Диалоге буквально вчера закончилась дорожка по кластеризации новостей
https://github.com/dialogue-evaluation/Russian-News-Clustering-and-Headline-Generation
Там есть и данные, и лидерборд, и телеграм-чатик, где можно вопросы позадавать
источник

A

Andrei in Natural Language Processing
David Dale
На Диалоге буквально вчера закончилась дорожка по кластеризации новостей
https://github.com/dialogue-evaluation/Russian-News-Clustering-and-Headline-Generation
Там есть и данные, и лидерборд, и телеграм-чатик, где можно вопросы позадавать
Угу, как раз в этом контексте спрашиваю)
источник

A

Andrei in Natural Language Processing
Там чёт оч мало участников так-то, на лидерборде с десяток.
источник
2021 March 23

АЖ

Алексей Жданов... in Natural Language Processing
Доброго дня! Подскажите пожалуйста, подойдет ли Ярги парсер для извлечения из текста предложений такого вида: "
ПК 1.1. Анализировать объект производства : конструкцию летательного  аппарата, агрегатов, узлов, деталей, систем, конструкторскую документацию на их изготовление  и  монтаж.
ПК 1.2. Обеспечивать  технологическую  подготовку  производства  реализации  технологического  процесса .
 и т.д.
То есть в этих предложениях начало всегда с ПК и глагола. Взять нужно то, что идет после.
Или Ярги не подходит для этого?
источник

M

Maxim in Natural Language Processing
Алексей Жданов
Доброго дня! Подскажите пожалуйста, подойдет ли Ярги парсер для извлечения из текста предложений такого вида: "
ПК 1.1. Анализировать объект производства : конструкцию летательного  аппарата, агрегатов, узлов, деталей, систем, конструкторскую документацию на их изготовление  и  монтаж.
ПК 1.2. Обеспечивать  технологическую  подготовку  производства  реализации  технологического  процесса .
 и т.д.
То есть в этих предложениях начало всегда с ПК и глагола. Взять нужно то, что идет после.
Или Ярги не подходит для этого?
Думаю, yargy хорошо подойдёт, если у всех текстов именно такая структура
источник

АЖ

Алексей Жданов... in Natural Language Processing
Maxim
Думаю, yargy хорошо подойдёт, если у всех текстов именно такая структура
спасибо!
источник

M

Minty in Natural Language Processing
Здравствуйте, мы приглашаем всех вас принять участие в четвертом Тесте Тьюринга, который состоится в онлайн-формате!

🔹 Что это такое?
Это масштабное онлайн мероприятие, на котором мы будем определять, умеет ли машина мыслить, и можно ли отличить человека от чат-бота во время анонимной переписки.

🔹 Ты разработчик и хочешь доказать, что твой чат-бот самый умный?
Тогда регистрируйся по ссылке https://www.turing-test.net/ и сможешь побороться за главный приз. Каждый разработчик сможет выставить на конкурс до 3-х ботов. Это отличная возможность заявить о себе, ведь ты сможешь не только замерить динамику качества своих ботов, но и определить лучшие сценарии для разговорного интерфейса.

🔹 А призы будут?
Для трех лучших чат-ботов, которых максимальное количество независимых судий признает человеком, мы подготовили крутые призы.

🔹 1-е место – 200 тыс. рублей
🔹 2-е место – 125 тыс. рублей
🔹 3-е место – 75 тыс. рублей.

За всеми обновлениями конкурса следите на сайте мероприятия https://www.turing-test.net/
источник

AK

Alexander Kukushkin in Natural Language Processing
источник

B

Banof in Natural Language Processing
🔫 @Coracosteon1974 кикнут — вернуть этого пользователя можно только разбаном в настройках чата.

Проголосовавшие за кик:
@alexkuk, @krokha_18, @alexkhrystoforov, @bazhanRO, @tzekunosyosha
При поддержке Золота Бородача
источник

КМ

Кибер Медик... in Natural Language Processing
Всем здравствуйте, нужен совет.

Cейчас ищу библиотечки/статьи по методам исправления контекстуальных ошибок для русского языка (когда род, спряжение, склонения нееправильные в предложении).

Из готовых решений нашел только для английского.

Посоветуйте какие-нибудь библиотеки, статьи, репы, подходы пожалуйста)

Сам думал сделать что-то на трансформерах, тк по опыту всякие марковские модели работают похуже чем нейронки. Например, взять корпус текста, токенизировать, с помощью pymorphy2 изменить форму слова, склонение, род и на этом обучить seq2seq.
источник

A

Andrei in Natural Language Processing
Кибер Медик
Всем здравствуйте, нужен совет.

Cейчас ищу библиотечки/статьи по методам исправления контекстуальных ошибок для русского языка (когда род, спряжение, склонения нееправильные в предложении).

Из готовых решений нашел только для английского.

Посоветуйте какие-нибудь библиотеки, статьи, репы, подходы пожалуйста)

Сам думал сделать что-то на трансформерах, тк по опыту всякие марковские модели работают похуже чем нейронки. Например, взять корпус текста, токенизировать, с помощью pymorphy2 изменить форму слова, склонение, род и на этом обучить seq2seq.
вопрос интересный

на эту тему @cointegrated советовал дообучить какуюнть генеративную трансформенную модель которая претрейнилась для перефразирования

у меня руки не дошли
источник

D

Danila Milovanov in Natural Language Processing
Доброго времени суток. Хотел узнать какие есть хорошие способы для извлечения ключевых слов из текста, уже пробовал RAKE и подобные, есть ли решения получше для русских текстов?
источник

AO

Alex Orgish in Natural Language Processing
Danila Milovanov , мне понравились результаты https://github.com/shangjingbo1226/AutoPhrase
Работал с английским, но русский прикрутить не должно быть сложно.
источник

D

Danila Milovanov in Natural Language Processing
Спасибо, ознакомлюсь
источник

ОК

Оля Криволейко... in Natural Language Processing
Добрый день, мне нужно классифицировать данные на правду/ложь, можно ли дообучить модель rusentiment_bert на датасете с правдой/ложью? Если можно, можете плис поделиться примером?
источник

E

Elena in Natural Language Processing
Оля Криволейко
Добрый день, мне нужно классифицировать данные на правду/ложь, можно ли дообучить модель rusentiment_bert на датасете с правдой/ложью? Если можно, можете плис поделиться примером?
а почему именно сентимент? почему  не взять обычный BERT и обучить его на своем датасете?
источник

ОК

Оля Криволейко... in Natural Language Processing
ну да, можно и так, я просто пока не очень разбираюсь в этом) не знаете, где можно найти пример?
источник

E

Elena in Natural Language Processing
посмотрите библиотеку Simple Transformers
источник

E

Elena in Natural Language Processing
там есть примеры того, как сделать файн-тюнинг
источник

AG

Alex Gruzdev in Natural Language Processing
Есть набор слов - профессии в форме женского рода. Как получить аналоги мужского рода?
источник