Логика образования, логика разметки и логика предсказания это не одно и то же. Первое это все же про физику нуклеации и элонгации, о том, какие взаимодействия и в каком балансе приводят к тому, что замыкается вторичка, что это термодинамически выгодно. Про это можно в Финкельштейне почитать.
А второе это наш способ автоматизировать pattern recognition, чтобы навесить лейблы на позиции белка по имеющейся структуре. Тут да, DSSP и ко.
А третье это попытка инференса закономерностей между сочетаниями букв и secondary structure propensity, чтобы вывести этот лейбл (с или без вероятности) для буквы без информации о структуре, только по сиквенсу. Весьма давно на этом строились исследования по предсказанию структуры. Сейчас такие тулы особо никому не нужны, ибо моделлер, свиссмодел, Розетты, альфафолды...