Привет чат, а кинте в меня статьями по статам пожалуйста, у меня есть датасет допустим содержащий 3 миллиарда записей за несколько лет. Какой процент из него надо провалидировать что бы получить вероятность в 95% что он правильный, не хочу все 3 миллиарда проверять. Я сделал быстрый тест с выборкой по 1k, 10k, 100k с честным распределением по годам, но подозреваю что 3 миллиардов это очень мало.