Ребят, а когда мы рассчитываем объем выборки, он должен быть таким для каждой из сравниваемых двух групп или объем выборки это кол-во наблюдений вообще в сумме двух групп ?
Лос бинарный нужен, это у вас правильно. У вас по сути большое количество бинарных классификаций. Categorical, если надо выбрать только один класс. Далее на выходе лучше поставить активацию сигмоиду, тогда диапазон результатов будет 0-1.
У вас relu стоит на выходе, если сигмоиду. Также можно посмотреть может в оптимизаторе тоже проблемы, ещё могут быть баги с данными. Можно уменьшить размер сети. Сейчас важно доказать, что сеть может обучаться.