Телеграмм чат группы PiterPy страница 59

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

PiterPy Conf Сhat

175 membersпожаловаться на группу

1
«
…
‹
54
55
56
57
58
59
60
›
…
»

2020 August 06

BY

Bulat Yaminov in PiterPy Conf Сhat

Bulat я еще извиняюсь, если упустила в докладе - а что про изменение данных? мы вообще как-то можем манипулировать с апдейтом данных? допустим нам надо не репорт сделать, а подготовить файл дальше - какие-то значения левые поменять на корректные

Да, Vaex может экспортировать данные в разные форматы. Так что я представляю так: читаем из исходного большого файла, делаем все трансформации memory-efficient, пишем конечный результат в другой большой файл (или коллекцию файлов). В общем то же, что сделал бы Spark.

источник

19:26пожаловаться #1

BY

Bulat Yaminov in PiterPy Conf Сhat

Я не упомянул, что Vaex умеет также читать из списка файлов.

источник

19:27пожаловаться #2

YV

Yuliya Volkova in PiterPy Conf Сhat

Bulat Yaminov

Я не упомянул, что Vaex умеет также читать из списка файлов.

очень круто

источник

19:28пожаловаться #3

YV

Yuliya Volkova in PiterPy Conf Сhat

Bulat Yaminov

хм, а можешь плиз прислать ссылку на доку? Я смотрю сюда: https://www.pytables.org/usersguide/index.html#contents . Я честно говоря ни разу не пользовался.

он интегрируется с пандасом https://pandas.pydata.org/pandas-docs/dev/user_guide/io.html#io-tools-text-csv-hdf5 по факту не корректно выразилась )

источник

19:29пожаловаться #4

YV

Yuliya Volkova in PiterPy Conf Сhat

можно использовать пандас с hdf5

источник

19:29пожаловаться #5

YV

Yuliya Volkova in PiterPy Conf Сhat

Bulat Yaminov

Да, Vaex может экспортировать данные в разные форматы. Так что я представляю так: читаем из исходного большого файла, делаем все трансформации memory-efficient, пишем конечный результат в другой большой файл (или коллекцию файлов). В общем то же, что сделал бы Spark.

супер, спасибо за ответ!

источник

19:30пожаловаться #6

BY

Bulat Yaminov in PiterPy Conf Сhat

он интегрируется с пандасом https://pandas.pydata.org/pandas-docs/dev/user_guide/io.html#io-tools-text-csv-hdf5 по факту не корректно выразилась )

а, понял! Да, это видел. Ответ такой: действительно, Pandas тоже умеет работать out-of-core в некоторых случаях. Кроме HDF5 там можно и read from CSV by chunks, и таким образом прочитать большую таблицу. Vaex будет быстрее, потому что использует columnar format in the HDF5 file.

источник

19:36пожаловаться #7

YV

Yuliya Volkova in PiterPy Conf Сhat

Bulat Yaminov

а, понял! Да, это видел. Ответ такой: действительно, Pandas тоже умеет работать out-of-core в некоторых случаях. Кроме HDF5 там можно и read from CSV by chunks, и таким образом прочитать большую таблицу. Vaex будет быстрее, потому что использует columnar format in the HDF5 file.

а есть вообще какие-то сложности, чтобы не лезть в Vaex? что-то что может блокировать или в целом библиотека уже в максимально юзер-френдли состоянии и можно не бояться каких-то проблем и идти с большими файлами сразу в Vaex?

источник

19:39пожаловаться #8

BY

Bulat Yaminov in PiterPy Conf Сhat

Не знаю, все ли знают, но HDF5 файл - это скорее "контейнер", в котором можно создавать списки и их метаданные, в виде дерева. То есть можно записать в HDF5 как построчные данные, по колонкам, или гибридно, как в Parquet. Но в итоге не каждая библиотека читает HDF5 файл другой библиотеки - потому что не обязательно даже знает названия списков из метаданных.

источник

19:39пожаловаться #9

BY

Bulat Yaminov in PiterPy Conf Сhat

а есть вообще какие-то сложности, чтобы не лезть в Vaex? что-то что может блокировать или в целом библиотека уже в максимально юзер-френдли состоянии и можно не бояться каких-то проблем и идти с большими файлами сразу в Vaex?

есть ограничения, по сравнению с Pandas. Например, пока не поддерживаются lists/maps as column types. Также rolling/window пока нет. Но у создателей много энтузиазма сделать Vaex популярным, так что если вам нужна фича - с большой вероятностью мы можем ее заимплементить достаточно быстро 🙂

Например, поддержка lists/maps придет скоро "забесплатно" из новой версии Apache Arrow.

Тут можно посмотреть API, если интересует какая-то конкретная фича: https://vaex.readthedocs.io/en/latest/api.html

источник

19:47пожаловаться #10

IS

Irina Saribekova in PiterPy Conf Сhat

Вопросы Рувену :)

источник

19:49пожаловаться #11

DK

Dmitry Karpov in PiterPy Conf Сhat

for x := (yield y) will it stop by := rather then StopIteration exception in the same way as in previous versions before := would be reached?

источник

19:53пожаловаться #12

AB

Aleksandr Borgardt in PiterPy Conf Сhat

AnimatedSticker.tgs

источник

19:53пожаловаться #13

IS

Irina Saribekova in PiterPy Conf Сhat

Reuven Lerner thank you for the talk 🎉

источник

20:02пожаловаться #14

RL

Reuven Lerner in PiterPy Conf Сhat

HI, @dakarpov !

The StopIteration is produced *by* the generator when it reaches the end. So if you're using "while x := yield" in your generator, the yield happens first (because it's on the right hand side), and is replaced by what it got from .send. If that's False in a boolean context, then the while will exit, and then the generator will raise StopIteration.

источник

20:02пожаловаться #15

YV

Yuliya Volkova in PiterPy Conf Сhat

Bulat Yaminov

есть ограничения, по сравнению с Pandas. Например, пока не поддерживаются lists/maps as column types. Также rolling/window пока нет. Но у создателей много энтузиазма сделать Vaex популярным, так что если вам нужна фича - с большой вероятностью мы можем ее заимплементить достаточно быстро 🙂

Например, поддержка lists/maps придет скоро "забесплатно" из новой версии Apache Arrow.

Тут можно посмотреть API, если интересует какая-то конкретная фича: https://vaex.readthedocs.io/en/latest/api.html

поняла, спасибо за подробный ответ )

источник

20:03пожаловаться #16

RL

Reuven Lerner in PiterPy Conf Сhat

In other words, the order is:

- yield returns a value
- yield receives a value (from .send)
- the value is False in a boolean context
- the while loop exits
- the generator exits, raising StopIteration

источник

20:03пожаловаться #17

MM

Maria Mikheyenko in PiterPy Conf Сhat

AnimatedSticker.tgs

источник

20:03пожаловаться #18

RL

Reuven Lerner in PiterPy Conf Сhat

@IrinaSaribekova My pleasure, thanks for having me!

источник

20:04пожаловаться #19

IS

Irina Saribekova in PiterPy Conf Сhat

Reuven Lerner

@IrinaSaribekova My pleasure, thanks for having me!

🤗

источник

20:04пожаловаться #20

1
«
…
‹
54
55
56
57
58
59
60
›
…
»