Нашёл только решения для предобученных моделей. А мне нужно обучать с нуля. Может кстати есть какие-то полезные статьи для обучения моделей doc2vec.
У Fasttext есть тренировка с нуля, пожалуйста, посто нужен большой массив текста и много времени, а в результате получишь по сути тоже самое решение как уже готовую модель
Здравствуйте кто-то делал real-time кластеризацию новостей? Сейчас использую BERT(multilang) поверх заголовков для формирования векторов, и Faiss для сохранения и поиска по векторам. Но иногда новости похожие по смыслу, но вектора сильно отличаются. Для сравнения использую косинусное расстояние.
Здравствуйте кто-то делал real-time кластеризацию новостей? Сейчас использую BERT(multilang) поверх заголовков для формирования векторов, и Faiss для сохранения и поиска по векторам. Но иногда новости похожие по смыслу, но вектора сильно отличаются. Для сравнения использую косинусное расстояние.
Честно говоря исследовательский интерес в первую очередь. Хочу summary всех книг, которые ещё не прочёл)
Хорошо бы для начала сделать предметный указатель, потом относительно предметного указателя (набора терминов в нем) - извлечение определений, наиболее емкие утверждения и взаимосвязи с другими терминами в виде графа отношений...
Всем привет, у меня есть небольшое задание, которое вряд ли займет больше нескольких часов, разумеется, за оплату. Есть шанс, что найду здесь исполнителя?
С чем может быть связано, что при обучении модели на торче, каждый следующий батч на первой эпохе занимает времени больше чем предыдущий, но при этом со 2-3 эпохи в целом время выравнивается и становится сильно меньше?
Всем привет, у меня есть небольшое задание, которое вряд ли займет больше нескольких часов, разумеется, за оплату. Есть шанс, что найду здесь исполнителя?
Насколько я знаю, размещать тут задания/проекты по теме NLP вполне нормально. Предлагаю раскрыть суть задачи и возможную оплату)