Возможно, имеет смысл сначала решить задачу удаления из текста междометий и прочих малозначимых слов, а потом уже запускать NER.
По такому пути идут, в частности, в навыках яндексовской Алисы - сначала нейронка (с учётом контекста) и/или словарь предсказывает значимость каждого слова, а потом запускаются правиловые парсеры и NER, которые могут слова с низкой предсказанной значимостью просто игнорировать.