ща будут вопросы!
1) а что ищете наташей?
2) зачем opencv? для препроцессинга сканов?
3) регулярки для проверки на ошибки? а опечатки и кривые символы от распознавание? O вместо нуля например?
Наташей ищем даты и имена для выставления тегов для дальнейшего поиска.
Опенсв это препроцессинг сканов, затем выделение областей сканов (унифицированная форма), и оттуда вытягиваем спец текст (например номера накладных, разные сервис данные, кому или куда)
Регулярки для выделения по тексту спец совпадений. Например у нас есть товар(какой-то параметр), вот регулярки ищут скобки и текст вытаскивают.