разделение на голубой и на синий условное (и на зеленый). am loss получается в результате голубого, синего и зеленого как одного (то есть в результате двух форвардов а не одного).
В этом одном надо уменьшить магнитуду только на голубом. Суть am loss-a во влияние на самую верхнюю часть картинки (градиенты текут через "второй" инпут").
То есть для "посчитай первым лосс который дает голубой путь; умножь на нем градиенты на 1/10" нужно разделить голубой от остального, например детачом.
Потом второй вопрос что синего в отдельности нет, есть по сути "голубой" и "синий&голубой" (один путь), и нужно только голубой в 10 раз уменьшить.
"если голубой путь больше ни от чего не зависит" - голубой нет, но как я написал, синий зависит от голубого.