Всем спасибо, отвечаю.
1.Классика, бустинги работают, дают 85 проц. Хочу попробовать улучшить сетями.
2. Сигнал - параметры пакетов трафика. Задача - предсказать разрешение, с которым смотрят видео.
3. Данные - Примерно 20к видео на трейне. Каждое виде описано рядом временных точек - от 30 до сотен. В каждом ряду 7 разных сигналов - фич.
4. Исходя из размера минимального видео, я режу все эти ряды на кусочки по 30 временных точек, и рассматриваю, как отдельные примеры. Получается от 30 тыс до 700 тыс примеров (в зависимости от шага, с которым я двигаю скользящее окно, режущее ряд). С шагом 1 - много данных, но похожих. С шагом 30 - меньше, но примеры разные.
Гипотеза: 30 точек в примере - мало. Даже в маленькой картинке их пара сотен, правда там и свертки двумерные. Попробовала сделать 200 точек в примере. Результат стал лучше - на первой эпохе 81% на тесте против 84 на трейне, на второй - 84 на тесте против 91 на трейне. С третьей - падение. Получается - маленькие видео - в пролете, вернее, надо требовать несглаженные данные, где больше точек.