Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 January 06

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
Может, внутри функции дублируются временные данные?
источник

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
David Dale
Питоновский сборщик мусора довольно ленив. Если ты вызовешь явно import gc; gc.collect() , как расход памяти меняется?
нет, ничего не происходит
пробовал
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Вроде бы concat создаёт дубликат как раз.
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
А сколько весит сам датасет?
источник

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
Вроде бы concat создаёт дубликат как раз.
а куда он его пишет? как можно убить? или избежать?
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Leonid
а куда он его пишет? как можно убить? или избежать?
К сожалению, моих знаний недостаточно. Попробую загуглить. Навскидку можно удалять сразу же те два датасета, которые клеите.
источник

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
А сколько весит сам датасет?
как раз примерно 11 гб в памяти после загрузки из паркета
источник

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
Вроде бы concat создаёт дубликат как раз.
ты прав! без конката вернул память, после завершения функции
как теперь избежать последствий конката?
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Leonid
ты прав! без конката вернул память, после завершения функции
как теперь избежать последствий конката?
По-моему, никак, потому что, грубо говоря, concat берёт из двух ячеек памяти данные и клеит их в новую того же размера. А потом старые данные чистятся. Можно посмотреть, как клеить данные на месте.
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

ЕТ

Евгений Томилов... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Может, проще будет преобразовать в np.array(), склеить на месте через какой-нибудь append, а в конце уже переделать в DataFrame. Думаю, так в принципе меньше памяти займёт.
источник

SL

Sergey L in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Чисть неиспользующиеся чего-нибудь можно с помощью del, например (грубо говоря)
источник

SL

Sergey L in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Т.е. контакт вам создал дубликат данных, вы можете предыдущие данные пометить, как удаленные с помощью del,что освободит память
источник

SL

Sergey L in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Евгений Томилов
Вроде бы concat создаёт дубликат как раз.
Он несовсем так делает. Большинство функции, как и конкат резервируют новую память и в нее копируют данные
источник

S

Ssv in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну так всё верно. ты определил данные, склеил их и присвоил переменной, которая и держит их в памяти. в чем трабл?
источник

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ssv
ну так всё верно. ты определил данные, склеил их и присвоил переменной, которая и держит их в памяти. в чем трабл?
трабл в том, чтобы от нее избавиться..
только проблема в том, что переменной уже нет этой - функция завершила работу и всю локальную область почистила
источник

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Sergey L
Чисть неиспользующиеся чего-нибудь можно с помощью del, например (грубо говоря)
нечему del делать - нет переменной после окончания работы функции
источник

S

Ssv in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Leonid
трабл в том, чтобы от нее избавиться..
только проблема в том, что переменной уже нет этой - функция завершила работу и всю локальную область почистила
т.е она ничего не возвращает?
источник

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ssv
т.е она ничего не возвращает?
нет
источник

S

Ssv in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ну тогда ясно. есть такая штука в питоне как кэширование данных
источник