Ну смотри. У меня ж рекурсивно будет искать открытые/закрытые теги. А как потом извлекать содержимое между ними? Я пока придумал только указывать смещение символов закрытия и открытия тега.
Типа
<div>
<lala></lala>
</div>
Если представить этот xml как одну строку или руны, то утега див получается внутреннее содержимое начинается с 5го символа. А у закрывающего дива с 17 символа начинается. И когда я найду пары между токенами, мне тогда легче будет извлекать их содержимое