Распознаём 50 видов текста на C++ с PlywoodТекстовый файл не так прост, как иногда кажется. Из 50 кодировок и их форматов Блокнот Windows распознаёт 42, Notepad++ 38, VSC - 40. C++ фреймворк Plywood, нацеленный на простоту внедрения сторонних библиотек, понимает все 50 форматов текста. Как указывает автор, файлы с текстами написаны вручную специально для фреймворка. Тем не менее, Plywood справляется лучше других. Как устроено обнаружение кодировки в новом фреймворке? Давайте разберёмся. Код детектора вы найдёте в конце статьи. Лицензия - MIT.
https://nuancesprog.ru/p/9157@nuancesprog #статьи #CPP