Size: a a a

Machine learning

2020 June 04

АГ

Артём Глазунов... in Machine learning
Выборку наберите от 2 т отзывов, отрицательных как правило мало, дона брать нужно, скорее всего
источник

AO

Alex Ololo in Machine learning
Ivan Nazhestkin
чисто на параметрах векторайзера и классификатора?
А лемматизацию Вы не использовали, или ещё какую обработку текста?
я так понимаю это про тональность?
может просто - очень малая обучающая выборка?
источник

AO

Alex Ololo in Machine learning
Артём Глазунов
Выборку наберите от 2 т отзывов, отрицательных как правило мало, дона брать нужно, скорее всего
да
источник

АГ

Артём Глазунов... in Machine learning
Vowpalwabbit можно попробовать
источник

АГ

Артём Глазунов... in Machine learning
Но там заморочится немного придется
источник

IN

Ivan Nazhestkin in Machine learning
25 к отзывов напарсил с mail.ru, как на форуме советовали.
Отрицательных было где-то 1/5 от общего объёма, я сделал undersampling
источник

АГ

Артём Глазунов... in Machine learning
А так grid search  и в путь
источник

АГ

Артём Глазунов... in Machine learning
Зря так легко избавляетесь
источник

АГ

Артём Глазунов... in Machine learning
Лучше бы оверсемплинг
источник

АГ

Артём Глазунов... in Machine learning
Обратите внимание на метод ближ соседей при оверсемпл
источник

IN

Ivan Nazhestkin in Machine learning
Пытался и oversampling, но там вообще 19(!!!) гб потребовалось для PCA
источник

АГ

Артём Глазунов... in Machine learning
Хотя мне обычный рэндом помог
источник

АГ

Артём Глазунов... in Machine learning
У меня была выборка 3 тыс отзывов
источник

АГ

Артём Глазунов... in Machine learning
Pca не особо там нужен
источник

АГ

Артём Глазунов... in Machine learning
Посмотрите ещё раз на алгоритм, возможно где то проблема в коде
источник

АГ

Артём Глазунов... in Machine learning
У меня сразу побит был безлайн, даже без настройки
источник

АГ

Артём Глазунов... in Machine learning
Ivan Nazhestkin
SVM я и пробую сейчас)
Svc это как раз линейный вариант, для текстов самое то
источник

АГ

Артём Глазунов... in Machine learning
Только вероятностей не даёт, что не очень
источник

IN

Ivan Nazhestkin in Machine learning
У меня 75-80% при LinearSVC и CountVectorizer.
Как ни странно, Tfidf даёт на 2-3 процента меньшую (!) accuracy
источник

MK

Mikhail Konyukhov in Machine learning
Коллеги, не подскажете, как можно из ежедневных розничных продаж качественно определить оптовые продажи? куда копать? пока кроме верхнего квартиля боксплота ничего не приходит в голову
источник