Size: a a a

Чат | Google Таблицы и скрипты

2020 February 12

PK

Petr Kondaurov in Чат | Google Таблицы и скрипты
то есть, имена могут прибавляться или убавляться, и месяца тоже
источник

K

Kanat in Чат | Google Таблицы и скрипты
Petr Kondaurov
то есть, имена могут прибавляться или убавляться, и месяца тоже
в решение предусмотрено это
источник

A

Admin in Чат | Google Таблицы и скрипты
Petr Kondaurov
Круто! Теперь следующий этап усложнения - Мы не знаем, сколько может быть срок в формуле, но итоговая должна всегда перемножать
Вместо диапазона можно FILTER и СЧЁТ применить на открытом диапазоне
источник

VP

Vitaliy P. in Чат | Google Таблицы и скрипты
Nazar Bulavko
https://devpew.com/blog/google-sheets-for-finance тут ИТ-шник взял и сделал себе учёт финансов

даже по категориям разбивать можно
> Ведь банковские приложения хотят чтобы вы больше тратили, а не больше экономили.

такое впечатление, что человек живет в какой-то альтернативной реальности)
источник

NB

Nazar Bulavko in Чат | Google Таблицы и скрипты
Vitaliy P.
> Ведь банковские приложения хотят чтобы вы больше тратили, а не больше экономили.

такое впечатление, что человек живет в какой-то альтернативной реальности)
ну, у меня в Приват24 после каждого платежа появляется предложение какое-то рекламное
так, что да — банк хочет, чтобы клиент тратил больше
источник

PK

Petr Kondaurov in Чат | Google Таблицы и скрипты
Kanat
в решение предусмотрено это
я добавил данных и расширил диапазон, получилось больше
источник

VP

Vitaliy P. in Чат | Google Таблицы и скрипты
volond
Новые иконки гугла теперь окончательно слились. Аж глаз начинает дергаться, а Assistant вообще похож на Авито
из этих иконок фотки и хром не изменились, гуглвайфай, фит, ос нужны единицам. А живых людей, кто тыкает в Google ещё надо поискать)
источник

K

Kanat in Чат | Google Таблицы и скрипты
Petr Kondaurov
я добавил данных и расширил диапазон, получилось больше
к каждому открытому диапазону - =filter(диапазон;диапазон<>"")
источник

VP

Vitaliy P. in Чат | Google Таблицы и скрипты
Nazar Bulavko
ну, у меня в Приват24 после каждого платежа появляется предложение какое-то рекламное
так, что да — банк хочет, чтобы клиент тратил больше
в райфазене нет никаких реклам, есть статистика расходов, но строго по mcc кодам, что дает конкретные неточности)
источник

A

Admin in Чат | Google Таблицы и скрипты
Или так вычислять количество значений для повтора и все
источник

A

Admin in Чат | Google Таблицы и скрипты
Petr Kondaurov
я добавил данных и расширил диапазон, получилось больше
источник

K

Kanat in Чат | Google Таблицы и скрипты
@PKondaurov  вообщем давай уже сам дальше))) двссыл() тоже может понадобиться
источник

PK

Petr Kondaurov in Чат | Google Таблицы и скрипты
Друзья, прошу прощения, я спать.
Еще покручу, но вам за помощь очень благодарен!
Спокойной ночи!
источник
2020 February 13

v

volond in Чат | Google Таблицы и скрипты
Как обучить нейросеть на ноутбуке?
Готовим миллиард сэмплов за 5 минут!

Важнейший этап машинного обучения (ML) – подготовка данных. Их нужно собрать, привести к единому формату, отфильтровать и проверить прежде, чем передать на вход нейросети.

Такая подготовка может растянуться на неопределённое время, поскольку даже среди специалистов по ML единицы владеют современными инструментами обработки больших данных.

Тысячу строк ещё можно «причесать» в Excel, а вот если их миллионы – требуется принципиально другой подход из области Big data.

В статье для TowardsDataScience cтарший специалист по обработке данных в XebiaLabs и соучредитель vaex.io Йован Веляноски (Jovan Veljanoski) показывает на реальном примере, как  можно быстро обучить нейросеть на сырой выборке из миллиарда образцов.

Для этого используется обычный ноутбук без каких-либо нейропроцессоров и других специализированных ускорителей. Звучит как фантастика? Вовсе нет, всё дело в рациональном использовании ресурсов.

Перед Йованом была поставлена задача: создать алгоритм ML, предсказывающий продолжительность поездки в такси для оптимизации работы автопарка. Из публичной базы он взял данные обо всех поездках в Нью-Йорке за семилетний период и сохранил их в одну таблицу.

Размер файла получился более 100 Гб, а количество строк в таблице превысило один миллиард. Ни одна программа не способна обработать такой массив за разумное время (а большинство даже не в состоянии открыть).

Проблема в том, что традиционные приложения создают временные файлы и преобразуют все данные в свой формат, затрачивая на это уйму ресурсов. Поэтому Йован использовал нетривиальный инструмент с открытым исходным кодом: Vaex - библиотеку DataFrame на Python.

Vaex использует memory mapping (динамическое отображение блоков данных в ОЗУ), за счёт чего открывает огромные файлы мгновенно. Трансляция ссылок на блоки данных не требует физического выделения дополнительной памяти до тех пор, пока данные не подвергались модификации. При этом добавление и удаление целых столбцов также происходит за доли секунды, поскольку это виртуальные операции со ссылками, а не запись новых файлов.

Йован применил серию фильтров для удаления отменённых поездок и неполных данных, после чего сразу получил готовую подборку для обучения нейросети из 812 816 595 образцов.

Интересно, что время поездки в ней не хранилось статично в отдельном столбце, а динамически вычислялось как разница между временными штампами окончания и начала заказа. Аналогично рассчитывалось расстояние, поэтому даже при обработке 100-гигабайтного файла требования к объёму ОЗУ и накопителя оставались весьма скромными.

Вся подготовительная работа заняла около пяти минут чистого времени, а дальше началась исследовательская часть. Йован пробовал разные методы группировки, выделял отдельные направления поездок и неизменно получал быстрый результат.

Источник:  https://towardsdatascience.com/ml-impossible-train-a-1-billion-sample-model-in-20-minutes-with-vaex-and-scikit-learn-on-your-9e2968e6f385
источник

VK

Viktor Kazakov in Чат | Google Таблицы и скрипты
Парни, подскажите плиз, достаю importrange дату с другого листа (данные - дата)
вот вставка на два разных листа
источник

VK

Viktor Kazakov in Чат | Google Таблицы и скрипты
источник

VK

Viktor Kazakov in Чат | Google Таблицы и скрипты
источник

VK

Viktor Kazakov in Чат | Google Таблицы и скрипты
в первом случае вставлено как дата (и применено форматирование вида)
во втором случае вставлено как текст O_0
источник

VK

Viktor Kazakov in Чат | Google Таблицы и скрипты
проблема решена, суть была в том, что он сам определял необходимый формат по наибольшему количеству передаваемых форматов
источник

EN

Eugeny Namokonov in Чат | Google Таблицы и скрипты
Viktor Kazakov
в первом случае вставлено как дата (и применено форматирование вида)
во втором случае вставлено как текст O_0
Формат столбца определяются по форматированию первых строк исходных данных.
источник