Очень забавный пост про то, как быстро составить частотный словарь из любого текстового корпуса (автор использовал субтитры всех серий "Как я встретил вашу маму" и "Друзей" на шведском), чтобы быстро на базовом уровне освоить язык. Метод неидеальный (формы слов не почищены), но там и скрипт в 10 строк.
Частотные словари – это то, что позволяет наиболее быстро освоить лексику, покрывающую 80-85% произносимых в повседневной речи слов (вся фишка в оставшихся 15-20%, но это уже другие уровни владения языка). Это просто-напросто список самых используемых слов в языке, отсортированный по убыванию цитируемости.
Габриэль Уайнер, автор Fluent Forever, определяет их использование как один из ключевых секретов своего успеха. Логика довольно простая: на самом начале вашего пути, когда вам необходимо очень много запоминать (не зубрить! как работать с запоминанием и самым важным навыком вспоминанием – я уже писала), следует направить ваши усилия именно на те слова, которые вы с наибольшей вероятностью будете встречать в речи.
https://hackernoon.com/learning-languages-very-quickly-with-the-help-of-some-very-basic-data-science-cdbf95288333?source=linkShare-72351ce9f558-1490772237Давно хотела написать пост про подборку открытых источников частотных словарей для "наших" языков, надо не полениться.
Ну и чудо современных технологий: такой словарь можно составить самому! (Пользуясь вышеописанной технологией.)