Из вашего описания не очень понятно, что такое “слушать” и “команды”, поэтому сложно ответить) Чтобы было проще и вам и отвечающим, нужно более подробное описание того, что вы делаете - текстом, картинками, схемами, как угодно.
Приложение для слепых.Оно должно воспроизводить все сообщения которые поступают,а также с помощью микрофона слушать речь человека и выполнять определенные действия.Например возспроизвести все не прочитанные смс от "Вовы".Писать весь функционал в один сервис по мне немного странно,вам так не кажется?
чаще всего да, роль интерактора берет на себя VM. Но когда фича состоит больше чем из одного экрана, нужен медиатор между этими VM. Interactor берет на себя эту задачу