есть метод mapEntity(String line); а есть класс Controller, который отвечает за все преобразования ввода в модели. И можно сказать что Controller занимается преобразованием (но не имеет значения каким)
так же и модуль отвечает за более высокую абстракцию - преобразовать голос в текст (там будут классы состояния, коннекторы к микрофону, http для отправки на сервер). И это все одно действие - STT