из вордстата врядли получится набрать именно длинных, живых низкочастотных
Про общий случай не скажу, у меня такого опыта нет.
Но например когда мне весной нужно было получить выборку вопросов про коронавирус, из вордстата удалось вытащить довольно длинные, сложные и разнообразные вопросы.
И подозреваю, что для любой достаточно определенной и достаточно популярной предметной области такое можно провернуть.