Телеграмм чат группы natural_language_processing страница 1100

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2549 membersпожаловаться на группу

2021 March 10

FF

Futorio Franklin in Natural Language Processing

В математике есть доказательства )

Есть, но изначально вопрос не стоял что-то строго доказывать, а просто поделиться опытом, если вдруг кто-то решал похожую задачу подобным образом

источник

21:08пожаловаться #1

FF

Futorio Franklin in Natural Language Processing

в принципе нет так нет

источник

21:08пожаловаться #2

FF

Futorio Franklin in Natural Language Processing

А если да, то как

источник

21:08пожаловаться #3

VR

Vladimir R in Natural Language Processing

Futorio Franklin

Есть, но изначально вопрос не стоял что-то строго доказывать, а просто поделиться опытом, если вдруг кто-то решал похожую задачу подобным образом

Ясно. Так никто не будет делать, потому, что не может быть положительного результат, т.е. кто не верил теории — убедился в этом на практике, другого быть не может )

источник

21:09пожаловаться #4

VR

Vladimir R in Natural Language Processing

Всю информацию из закономерности модель уже извлекает

источник

21:10пожаловаться #5

VR

Vladimir R in Natural Language Processing

Соотвественно нельзя натренировать модель сверху другой модели, которая будет говорить, когда врет первая

источник

21:10пожаловаться #6

VR

Vladimir R in Natural Language Processing

Только если нет временных последовательностей, например если добавляется параметр время, и ряда ответов во времени..

источник

21:11пожаловаться #7

Е

Егорка in Natural Language Processing

Соотвественно нельзя натренировать модель сверху другой модели, которая будет говорить, когда врет первая

Если я так выразился, то прошу прощения. Я не имел ввиду что-то дополнительно тренировать. А скорее усреднять результат.
Хотя то, что вы говорите, на мой взгляд, противоречит положительным результатам использования стекинга и других методов композиции.

источник

21:15пожаловаться #8

VR

Vladimir R in Natural Language Processing

Ну так стекинг происходит внутри модели

источник

21:16пожаловаться #9

DD

David Dale in Natural Language Processing

Добрый вечер. Не могли бы вы, пожалуйста, подсказать в следующей задаче:
Есть несколько моделей для поиска именованных сущностей (например, только организаций). Есть одни модели с наилучшей прецизиозностью, а другие с наилучшей полнотой.
Отсюда вопрос: можно ли получить лучший результат (F-мера), если каким-то способом ансамблировать две модели (например с наилучшими precision и recall) ? Быть может просто пересечь их результаты.
Есть какие-то исследования, статьи или просто практический опыт по проверке такой методики ?

Мне кажется, сама идея ансамблирования моделей для NER - хорошая.
Другое дело, что эту идею можно декомпозировать на две независимые:
1) Как склеить две модели в одну, потеряв минимум информации?
2) Как настроить модель таким образом, чтобы оптимально сбалансировать precision и recall?

Лично я бы подступился к этой задаче из первых принципов.
Большинство моделей для sequence labeling - вероятностные. Следовательно:
1) ансамблировать модели можно, просто усреднив предсказанные ими вероятности с какими-то весами (веса надо будет подобрать по сетке или выбрать интуитивно)
2) чтобы повлиять на precision/recall полученной модели, надо домножить предсказанные вероятности каждого класса на какие-то константы, отражающие важность ложноположительных и ложноотрицательных срабатываний.

Вот теоретический пост про правильное балансирование предсказаний вероятностного классификатора: http://www.machinelearning.ru/wiki/index.php?title=Байесовский_классификатор

источник

21:16пожаловаться #10

VR

Vladimir R in Natural Language Processing

Т.е. ты получаешь просто модель глубже, но она от этого не станет сразу точнее

источник

21:16пожаловаться #11

FF

Futorio Franklin in Natural Language Processing

Да, нашла коса на камень. Хоть дополнительный трек в Диалоге открывай

источник

21:17пожаловаться #12

VR

Vladimir R in Natural Language Processing

Мне кажется, сама идея ансамблирования моделей для NER - хорошая.
Другое дело, что эту идею можно декомпозировать на две независимые:
1) Как склеить две модели в одну, потеряв минимум информации?
2) Как настроить модель таким образом, чтобы оптимально сбалансировать precision и recall?

Зачем это делать =) у тебя есть dropout он при обучении активирует "подсети" внутри твоей модели, и получается тот же самый ансамбль, только естественным путем, и при этом не нужно думать как складывать информацию из дух моделей - т.к. ответ "как" уже заложен в таком решении в DL.

источник

21:19пожаловаться #13

Е

Егорка in Natural Language Processing

Мне кажется, сама идея ансамблирования моделей для NER - хорошая.
Другое дело, что эту идею можно декомпозировать на две независимые:
1) Как склеить две модели в одну, потеряв минимум информации?
2) Как настроить модель таким образом, чтобы оптимально сбалансировать precision и recall?

Лично я бы подступился к этой задаче из первых принципов.
Большинство моделей для sequence labeling - вероятностные. Следовательно:
1) ансамблировать модели можно, просто усреднив предсказанные ими вероятности с какими-то весами (веса надо будет подобрать по сетке или выбрать интуитивно)
2) чтобы повлиять на precision/recall полученной модели, надо домножить предсказанные вероятности каждого класса на какие-то константы, отражающие важность ложноположительных и ложноотрицательных срабатываний.

Вот теоретический пост про правильное балансирование предсказаний вероятностного классификатора: http://www.machinelearning.ru/wiki/index.php?title=Байесовский_классификатор

Спасибо огромное за исчерпывающий ответ

источник

21:19пожаловаться #14

VR

Vladimir R in Natural Language Processing

Спасибо огромное за исчерпывающий ответ

@cointegrated ну я же помочь хотел человеку не терять лишнее время на этих бесов =)

источник

21:20пожаловаться #15

DD

David Dale in Natural Language Processing

Мне кажется, сама идея ансамблирования моделей для NER - хорошая.
Другое дело, что эту идею можно декомпозировать на две независимые:
1) Как склеить две модели в одну, потеряв минимум информации?
2) Как настроить модель таким образом, чтобы оптимально сбалансировать precision и recall?

Зачем это делать =) у тебя есть dropout он при обучении активирует "подсети" внутри твоей модели, и получается тот же самый ансамбль, только естественным путем, и при этом не нужно думать как складывать информацию из дух моделей - т.к. ответ "как" уже заложен в таком решении в DL.

Ансамблировать две нейросетки с одинаковой архитектурой, обученные на одинаковых данных - действительно идея так себе.
Но если две модели обучались на разных датасетах или используют разные фичи или у них сильно разная архитектура, то польза может быть.

источник

21:22пожаловаться #16

DD

David Dale in Natural Language Processing

@cointegrated ну я же помочь хотел человеку не терять лишнее время на этих бесов =)

Фишка в том, что мы не знаем, в каких условиях автор вопроса находится

источник

21:22пожаловаться #17

VR

Vladimir R in Natural Language Processing

Мудрый человек

источник

21:22пожаловаться #18

DD

David Dale in Natural Language Processing

И допущение, что ты понимаешь, что человеку нужно, лучше, чем он сам - довольно героическое

источник

21:23пожаловаться #19

Е

Егорка in Natural Language Processing

Да, именно так. Я написал, что используются разные модели натренированные на разных датасетах.

источник

21:24пожаловаться #20