Ребят, всем привет!
Есть HTML-таблица, формат может быть рандомным. То есть, использовать пути - не вариант. Выше скинул примеры.
Нужно научиться как-то вытаскивать все позиции, при этом возможно такое, что значение для позиции указано внизу, после каких-то под-позиций. Плюс количество колонок бегает от 2 до 7. Есть список позиций, которые нас интересуют - и вот вытаскивай как хочешь.
И таких вариантов просто огромное количество. Я написал очень сложный алгос, который всем этим занимается, но он всё равно работает недостаточно круто.
Собственно, вопрос - есть ли какие-то классные методы, как это делать?
Есть опыт с NLP, а так же сейчас активно читаю книгу по МЛ'у, но это непохоже на регрессию или классификацию))