Size: a a a

Сообщество Python Программистов

2020 October 31

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Что за данные и по какому признаку сортировать?
По возрастанию блоков
источник

ВП

Винни Пух.d in Сообщество Python Программистов
Бензофуран Гетероцикл
Интересный квест
Есть файл ~50Гб
Внутри записаны данные блоками по 48 байт
Нужно отсортировать эти данные
в озу захуячить)
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Бензофуран Гетероцикл
Интересный квест
Есть файл ~50Гб
Внутри записаны данные блоками по 48 байт
Нужно отсортировать эти данные
Очевидная ебанутость задачи в том что файл точно не поместится в оперативку
источник

R3

Rud 356 in Сообщество Python Программистов
Дак а в чом квест? Ты не поставил лимиты на озу и память на жд: беру и открываю файл в озу, а потом сортирую и пишу
источник

ВП

Винни Пух.d in Сообщество Python Программистов
Винни Пух.d
в озу захуячить)
как их отсортировать? По какому признаку?
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Rud 356
Дак а в чом квест? Ты не поставил лимиты на озу и память на жд: беру и открываю файл в озу, а потом сортирую и пишу
4Гб ОЗУ, 120Гб дискового места
источник

ВП

Винни Пух.d in Сообщество Python Программистов
Бензофуран Гетероцикл
4Гб ОЗУ, 120Гб дискового места
и как их сортировать-то?
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Винни Пух.d
как их отсортировать? По какому признаку?
Прям по возрастанию байтесов в блоках
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Бензофуран Гетероцикл
4Гб ОЗУ, 120Гб дискового места
120Гб из которых, очевидно, исходный файл занимает 50Гб, ага
источник

ВП

Винни Пух.d in Сообщество Python Программистов
Бензофуран Гетероцикл
Прям по возрастанию байтесов в блоках
о нихуя там число получается
источник

ВП

Винни Пух.d in Сообщество Python Программистов
ну в принципе, я вижу такое решение
источник

in Сообщество Python Программистов
Бензофуран Гетероцикл
Прям по возрастанию байтесов в блоках
Можно сортировкой слиянием с записью частей на диск
источник

R3

Rud 356 in Сообщество Python Программистов
Я бы сортировал чанки, а потом сортировал по паре чанков, т.к. их было бы меньше
источник

ВП

Винни Пух.d in Сообщество Python Программистов
Rud 356
Я бы сортировал чанки, а потом сортировал по паре чанков, т.к. их было бы меньше
хз, я думал заполнять файл по ходу итерации по чанкам
источник

ВП

Винни Пух.d in Сообщество Python Программистов
но чёт не ебу, как это на деле сделать
источник

ВП

Винни Пух.d in Сообщество Python Программистов
к примеру, максимально возможный чанк сразу в конец файла, и т.д.
источник

ВП

Винни Пух.d in Сообщество Python Программистов
но выходит странная хуйня, ещё и нереализуемая
источник

ИХ

Иван Ходненко... in Сообщество Python Программистов
А что если первым проходом определить минимальный/максимальный байт. Разбить на те же 100 блоков от и до. И потом в проходах по очереди каждый блок заполнять, Если он в диапазон попадает блока.
Тож дохера выходит, но сложность сводится к логарифмической + константа (количество блоков)
?
источник

l

let45fc in Сообщество Python Программистов
Бензофуран Гетероцикл
Интересный квест
Есть файл ~50Гб
Внутри записаны данные блоками по 48 байт
Нужно отсортировать эти данные
Да ты зае..
источник
2020 November 01

ВП

Винни Пух.d in Сообщество Python Программистов
Иван Ходненко
А что если первым проходом определить минимальный/максимальный байт. Разбить на те же 100 блоков от и до. И потом в проходах по очереди каждый блок заполнять, Если он в диапазон попадает блока.
Тож дохера выходит, но сложность сводится к логарифмической + константа (количество блоков)
?
так я об этом и говорил
источник