У меня стоит задача различить чем является фраза юзера, вопросом или не вопросом. Фразы задаются голосовым вводом, поэтому по знаку вопроса в конце предложения не вариант.
Парсишь корпус литературы, делишь на две группы предложений по наличию в конце знака вопроса. Тренируешь на этих двух наборах сетку. Например.