Есть задача по логам чата выявить пары сообщений, потенциально полезные для обучения чат-бота. Типо вопросы-ответы, реакции на утверждения ("не забудь купить молоко" - "хорошо, не забуду", "они молодцы" - "да, я за них болел") и возможно что-то ещё. Как к такой задаче стоит подойти? Помню была статья, где юзался датасет для классифицирования двух суждений, как они с друг другом соотносятся, но там был берт и это как -то жирно
нет, сорян. ну там не очень интересно на самом деле, просто взяли датасет пар и пытались предсказывать, является ли правая чать объяснением левой, или они нейтральны (но про одно и то же)
Да, но там эта информация не в инфобоксах, нужно парсить именно HTML для извлечения нужной информации. Лучше даже не Вики-шаблоны из выгрузки, а именно html.
Друзья, знакомый разрабатывает онлайн редактор семантических графов biomindmap.com, подскажите пожалуйста какие продукты с ИИ можно применять для создания и улучшения подобных семантических графов ? Для NLP научных статей в графы, привязки весов/метрик итп ?