Size: a a a

ML Boot Camp Official

2020 November 22

T

Timur in ML Boot Camp Official
USE/SentenceBert там всякие
источник

T

Timur in ML Boot Camp Official
Андрей S[A]M Сергеев
Всем доброго времени суток. Сейчас появилась проблема: сравнить два текста по содержания. Например, он написал текст за урок, и, он успел написать текст за урок, идентичны. Я думаю, что надо как-то CNN строить с выходом 1 или 0, но даже не знаю с какой стороны подходить... Может кто подскажет. Заранее спасибо.
тебе нужно тексты по смыслу сравнивать или там должны быть одинаковые словосочетания, как у тебя в примере?
источник

АС

Андрей S[A]M Сергеев... in ML Boot Camp Official
Именно по смыслу
источник

АС

Андрей S[A]M Сергеев... in ML Boot Camp Official
Чтобы фразы говорили об одном и том же
источник

d

dePuff in ML Boot Camp Official
Sentence Bert мне нра
источник

T

Timur in ML Boot Camp Official
тогда можно попробовать получать эмбеддинги текстов опять же каким-нибудь SentenceBERT/USE/LASER и потом сравнивать их по косинусной близости
источник

T

Timur in ML Boot Camp Official
если близость выше какого-то порога, то тексты похожи по смыслу
ну это в идеале)))
источник

АС

Андрей S[A]M Сергеев... in ML Boot Camp Official
Благодарю
источник

D

Denis in ML Boot Camp Official
в сверточную сеть приходят массивы 1000*1000*10, как определить какие из 10 матриц  1000*1000 в таких массивах вносят больший вклад в результат?
источник

T

Timur in ML Boot Camp Official
Можно попробовать какие-нибудь integrated gradients заюзать и усреднить веса по матрицам
источник
2020 November 23

EZ

Evgenii Zheltonozhsk... in ML Boot Camp Official
Поясните дураку, code-only на кагле значит что оно должно прямо в сабмите тренироваться?
источник

SancheZz Мов in ML Boot Camp Official
Evgenii Zheltonozhskii🇮🇱
Поясните дураку, code-only на кагле значит что оно должно прямо в сабмите тренироваться?
Ага
источник

DR

Dmitry Raevsky in ML Boot Camp Official
разве предобученные модели нельзя?
источник

SancheZz Мов in ML Boot Camp Official
Dmitry Raevsky
разве предобученные модели нельзя?
Смотря что в правилах написано
источник

SancheZz Мов in ML Boot Camp Official
Вообще можно и предобученные туда залить
источник

SancheZz Мов in ML Boot Camp Official
Главное в ограничения влезать
источник

SancheZz Мов in ML Boot Camp Official
По времени и памяти
источник

DR

Dmitry Raevsky in ML Boot Camp Official
Ну вот я тоже помню, что от правил вроде конкретного соревнования зависит, где-то тренировать самому можно, где-то прямо в сабмите надо
источник

GE

Gleb Erofeev in ML Boot Camp Official
Dmitry Raevsky
Ну вот я тоже помню, что от правил вроде конкретного соревнования зависит, где-то тренировать самому можно, где-то прямо в сабмите надо
"code-only" - это значит сабмитишь ноут. В нем тренировка и предикт. Разве нет?
источник

EZ

Evgenii Zheltonozhsk... in ML Boot Camp Official
SancheZz Мов
Смотря что в правилах написано
Если написано что надо публичные предобученные только
источник