"Чем собака отличается от пуделя?" Пудель - это частный случай собаки.
А RL - это частный случай ML.
RL отличается от остальных видов ML тем, что обучающие данные для RL генерируются непосредственно во время обучения, поскольку в ходе обучения модель вынуждена взаимодействовать со "средой".
А в более классических видах ML (таких как supervised и self-supervised learning) все обучающие данные, как правило, уже собраны/сгенерированы заранее, и в ходе обучения модель только воспроизводит их.