Глупо с моей стороны советовать(тк еще не устроился), но что мешает взять данные и сделать не игрушечный?) На выхах у Яндекса хакатон был, щас от ВТБ стартует + датасетов много + кагл...
по стат.анализу данных сложно выбрать таску, а на мл я в 2 хакатонах участвовал, правда ничего не взял, но было интересно