Телеграмм чат группы bigdata

Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

4858 membersпожаловаться на группу

2021 June 07

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Пройдись только по весам на которых надо изменить

источник

15:49пожаловаться #1

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Если я правильно понимаю, у вас есть 3 вида лосс функций, первый, как я понимаю, это обычный CrossEntropyLoss, второй - это Angular Margin Softmax Loss, третий - что-то еще. Если все так - то можно сделать просто:

predictions = model(inputs)
blue_loss = cross_entropy_loss(inputs, targets)
cyan_loss = am_softmax_loss(inputs, targets)
total_loss = blue_loss + cyan_loss * 0.1
total_loss.backward()

источник

15:50пожаловаться #2

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

И на них измени

источник

15:50пожаловаться #3

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

А на тех на которых не надо менять не меняй

источник

15:50пожаловаться #4

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

они все одинаковые, в графе градиентов они дублируются ))

источник

15:50пожаловаться #6

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

с помощью .view

источник

15:51пожаловаться #7

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

они не разные )) забавный алгоритм )

источник

15:51пожаловаться #8

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ну не делай так)

источник

15:52пожаловаться #9

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Продублируй явно веса

источник

15:52пожаловаться #10

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

близко, два вида, один кросс энтропи а второй который как бы состоит из двух факторов, которые как раз если бы можно было легко разделить, то было бы удобно сделать один + другой на 0.1.

источник

15:53пожаловаться #11

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Умножь один из факторов на 0.1.

источник

15:56пожаловаться #12

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

ну вот либо с переписью функции backward с каким нибудь if то град разделить на 10 else как обычно.
Либо иначе, этот фактор проявляется только на части бэкпэса через am loss, он не явный.

источник

15:57пожаловаться #13

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

либо через явную дубляцию и копирование сетки и т.д. чего пока избегаю

источник

15:58пожаловаться #14

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Давай по-порядку тогда - выход am loss используется где-либо, кроме как в .backward()?

Забавно, то на "Вы" обращаюсь, то на "ты"...

источник

15:59пожаловаться #15

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

am loss из этой статьи без модификаций?
https://arxiv.org/abs/1801.05599

источник

16:02пожаловаться #16

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

нет. Но am_loss, его граф градиентов, это и голубой и синий (который проходит там же где зеленый).
А надо градиенты только на голубом в 10 раз умножить. А еще это одни и те же параметры, поэтому .grad/10 двойное влияние даст.
Просто в точре юзеру не дали интерфейс и более того сам граф градиентов не создали как отдельный объект с интерфейсом для BFS, DFS например,
по мне это не самый эффективный способ создать пару .grad и BackFunc(). В таких манипуляциях, которую я хочу сделать немного безтолковая реализация.

источник

16:03пожаловаться #17

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

не, Guided-Attention-Infference-Network

источник

16:03пожаловаться #18

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

https://arxiv.org/abs/1802.10171

источник

16:04пожаловаться #19

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ладно, в проблему сложно вникнуть сразу, не читая статьи. По идее, torch.autograd.Function может решить практически все кейсы с кастомным беквардом.

источник

16:06пожаловаться #20