Спасибо всем, пойду дальше изучать
Количество нейронов придётся подбирать из собственного опыта. По поводу больших нейросетей, не всегда огромная нейросеть будет решать твою задачу, ибо если 2 слоя справятся, то нет необходимости делать 3, 4, 5 и т.д. слоев. При тренировке нейросети, чтобы избежать ошибок, лучше данные приводить к одному масштабу (MinMaxScaler, надеюсь, правильно написал, он есть в Scikit-Learn), чтобы не попасть в локальный минимум, а ближе к глобальному инициализируй веса не просто случайно из нормального распределения, а из Кси-квадрат распределения (не знаю, есть ли такая функция в той библиотеке, с помощью которой ты пишешь нейросеть, но в Keras она точно есть)