Есть отличный и "бесплатный" OCR, о котором мало кто знает. И встроен он в Microsoft Office. Да-да! Это MODI - Microsoft Office Document Imaging. Прекрасно работает с русским языком, есть API. Правда, в современные инсталляционные пакеты он с 2010 года не входит, однако спрятан в дистрибутиве SharePoint Designer (
https://www.microsoft.com/en-us/download/details.aspx?displaylang=en&id=21581), который пока свободно можно скачать с сайта. При этом следует выбирать русскую версию, чтобы там был русский язык. Там можно отключить все опции, оставив только "Office Tools"\"Microsoft Office Document Imaging". Разумеется, FineReader лучше, зато этот - бесплатный, и на порядок лучше кривого tisseract. Есть мелкий нюанс: работает строго для одного языка. Если в тексте есть английские вставки, то в режиме "русский" будет их пытаться представить кириллицей. Я делал так: сначала для "русского", потом для "английского", а затем объединял результат (там для каждого слова даётся вероятность).