я понял, ты троллишь, молчу
Да нет же, вот возьми lwp, скачай главную страницу русскоязычного сайта и попробуй ее перлом парсить. Надо будет encode вызывать.
А в python таких проблем нет. Если ты там видишь "ъ", это это тот самый и однозначный "ъ", который будет в файле, который ты видишь с помощью cat/less/more и т.д. и который передается по сети.
И никогда там не будет wide character on stdout, там нет этой головной боли