Тем временем при поддержке
@konhis был опубликован в CRAN
ещё один пакет для авто-определения кодировки.
Пакет основан на гугловской либе, которая использованиется для определения веб-страниц в хроме. Она используется только в том, случае если на веб-странице отсутствуют указания в HTML-коде.
На вход можно подавать строковый вектор или raw-вектор. Пути к файлам, в отличии от uchardet напрямую нельзя, но можно читать файл или его часть в raw-вектор.
Из недостатков по сравнению с uchardet можно отметить меньшее количество языков и кодировок.
Не смотря на некоторые недостатоки, я посчитал, что чем больше инструментов, решающих задачу, тем лучше, особенно в такой тонкой теме как авто-определение кодировки.
https://artemklevtsov.gitlab.io/ced/