Всем привет!
А правильно я понимаю, что модели на основе bert можно дофайнтьюнить, чтобы они искали не просто стандартные named entities (типа организации, персоны, деньги), а более специфические?
Например в том же кредитном договоре есть сумма кредита, есть процентная ставка, график платежей с суммами платежей. Все это ДЕНЬГИ (ну или ок, проценты), но, скажем так, деньги разного типа.
И мне соответственно нужен датасет с размеченными этими разными суммами, чтобы дообученная модель их правильно распознавала?
И еще, правильно я понимаю, что bert сможет это сделать (если сможет конечно), т к учитывает контекст, т е текст окружающий ту или иную сумму денег?