Size: a a a

Язык программирования Julia / Julia programming language

2020 June 16

A

Arthur in Язык программирования Julia / Julia programming language
Я бы сказал, что C++, там, где пишут серьезные вычисления, скорее всего он будет
источник
2020 June 17

VG

Viktor G. in Язык программирования Julia / Julia programming language
Можно ли как-то оптимизировать ансамбль из 7 классификаторов, если отдельные классификаторы могут отваливаться и не выдавать вообще никакой информации?
источник

MV

Mitya Volodin in Язык программирования Julia / Julia programming language
Viktor G.
Можно ли как-то оптимизировать ансамбль из 7 классификаторов, если отдельные классификаторы могут отваливаться и не выдавать вообще никакой информации?
Какую метрику ансамбля вы хотите оптимизировать?
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
общее предсказание
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
допустим, кроссэнтропия или софтмакс какой-нибудь от суммы выходов ансамбля
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Какой-то вариант стекинга?
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
ансамбль однородный, т.е. один алгоритм не может получить преимущество перед другим
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
просто они работают над разными источниками данных, иногда часть источников может отваливаться
источник

VS

Vladimir Samoylov in Язык программирования Julia / Julia programming language
Надо запустить процедуру метаобучения над выборкой решений классификатров включающих NULL значения.
Ну если действительно классификаторы абсолютно однородные и имеют одинаковые веса вне зависимости от поступающих данных (что практически нереально) и у Вас там просто среднее или голосование  - то эти процедуры не зависят от объема основания, что на 7 значениях что на 3 должны среднее / голосование посчитать
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
Классификаторы идентичные, источники данных разные. Можно воспринимать как последовательный анализ с добавлением источников
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
Ну хорошо, а как складывать их голосования? Удаляем NULL и тупо считаем среднее всех вероятностей?
источник

VS

Vladimir Samoylov in Язык программирования Julia / Julia programming language
Как у вас сейчас сделано, когда все дают решения?
Скорее всего есть порого, с которым вы сравниваете вероятность данную классификатором каждым (возможно порог общий, надеюсь что индивидуальный) и потом считаете количество ЗА и ПРОТИВ превысивших пороги? Или вы считаете просто среднее вероятностей?
источник

PY

Popov Yuri in Язык программирования Julia / Julia programming language
Viktor G.
Классификаторы идентичные, источники данных разные. Можно воспринимать как последовательный анализ с добавлением источников
Напрашивается байесовский вывод  апосториорное распределение первого используется в качестве априорного второго уточняется использованием правдоподобия второго и так далее. Что хорошо работало надо чтоб классификаторы работали на независимых данных то есть корреляция может подпорить. Также можно рассмотреть  em алгоритм на сухих 7 мм классификаторах
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
Vladimir Samoylov
Как у вас сейчас сделано, когда все дают решения?
Скорее всего есть порого, с которым вы сравниваете вероятность данную классификатором каждым (возможно порог общий, надеюсь что индивидуальный) и потом считаете количество ЗА и ПРОТИВ превысивших пороги? Или вы считаете просто среднее вероятностей?
Сейчас считается среднее по тем, у кого выше определенного порога ЗА.
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
Popov Yuri
Напрашивается байесовский вывод  апосториорное распределение первого используется в качестве априорного второго уточняется использованием правдоподобия второго и так далее. Что хорошо работало надо чтоб классификаторы работали на независимых данных то есть корреляция может подпорить. Также можно рассмотреть  em алгоритм на сухих 7 мм классификаторах
Данные зависимы - скажем это повторные тесты одного пациента.
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
Только общее количество тестов всегда одинаковое, из них часть может отсеиваться как невалидные (отсутствие результата)
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
скажем, лаборант был пьян
источник

VG

Viktor G. in Язык программирования Julia / Julia programming language
но небольшую часть ошибок не удается определить как невалидные
источник

VS

Vladimir Samoylov in Язык программирования Julia / Julia programming language
Ну в постейшем случае - просто оставьте ту же самую логику просто корректируя размер вектора решений подаваемого на вход.

Но действительно хороший эффект при работе с missing values даст именно метаобучение второго уровня. Там можно использовать различные алгоритмы, в том числе и байесовский, но в принципе любой стандартный умеющий работать с missing values подойдет
источник

PY

Popov Yuri in Язык программирования Julia / Julia programming language
Viktor G.
Данные зависимы - скажем это повторные тесты одного пациента.
Какая ж это зависимость. Самая настоящая независимость. Наблюдение объекта на фоне шумов и помех
источник