Size: a a a

2021 August 23
PythonDigest
Talk Python to Me: #330: Apache Airflow Open-Source Workflow with Python
https://talkpython.fm/episodes/show/330/apache-airflow-open-source-workflow-with-python

Audio
источник
PythonDigest
источник
PythonDigest
источник
PythonDigest
Сводка новостей от pythonz 15.08.2021 — 22.08.2021
https://pythonz.net/articles/390/

А теперь о том, что происходило в последнее время на других ресурсах.
источник
PythonDigest
ETL в задаче анализа данных для тех, кто не любит кофе и курилку
https://habr.com/ru/post/574110/?utm_campaign=574110&utm_source=habrahabr&utm_medium=rss

В первую очередь, материал ориентирован на аналитиков, которые манипулируют разумными объемами данных, необходимых для решения практических задач. ETL из Бигдаты в котором перекачиваются сотни Тб ежесуточно живет своей отдельной жизнью.
источник
2021 August 24
PythonDigest
The Digital Cat Books - Clean Architectures in Python
https://www.thedigitalcatbooks.com/

A new home for the book "Clean Architectures in Python" that can be read online for free and is published in PDF by Leanpub. This website will host other books in the future, stay tuned!
источник
PythonDigest
Как автоматизировать сбор статистики из Яндекс.Дзен при помощи кода
https://habr.com/ru/post/574224/?utm_campaign=574224&utm_source=habrahabr&utm_medium=rss

У Яндекс.Дзен нет готового API, чтобы агрегировать статистику привычным для аналитиков и маркетологов образом. Чтобы собрать данные, нужно пройти 8 шагов: зайти на zen.yandex.ru, перейти в кабинет, затем в раздел «Статистика», потом на вкладку «Кампании», выбрать период и нажать на «Отчеты». Затем в сформировавшихся отчете Excel перейти на вкладку «Статистика кампаний по дням», выбрать нужную кампанию и создать сводную таблицу.
источник
PythonDigest
Comparing Datetime with Delorean in Python - With and Without Timezones
https://stackabuse.com/comparing-datetime-with-delorean-in-python-with-and-without-timezones/
источник
2021 August 25
PythonDigest
источник
PythonDigest
Принимаем на работу брокера для Celery: подбор, аджаст и выкатка
https://habr.com/ru/post/551432/?utm_campaign=551432&utm_source=habrahabr&utm_medium=rss

У Яндекса много самописных сервисов для внутренних задач: Яндекс.Формы, Яндекс.Диск, трекер, календарь. Со временем их решили использовать не только внутри компании, но и за ее пределами. Так появилась платформа Яндекс.Коннект.
Большинство сервисов Коннекта построено на Python V3. В качестве web-фреймворка используется Django, реже Flask и Tornado, а новые чаще пишутся на FastAPI. Сервисы, как и базы PostgreSQL, MySQL и MongoDB, живут в облаке. В качестве очереди сообщений почти везде используется Celery с MongoDB в качестве брокера. Он и стал проблемой.
источник
PythonDigest
Задача, которую предлагали разработчикам на собеседованиях в Reddit: разбор и решение от сотрудника компании
https://habr.com/ru/post/574372/?utm_campaign=574372&utm_source=habrahabr&utm_medium=rss

Впервые я столкнулся с техническими собеседованиями еще в 2012 году, когда искал свою первую работу в IT. Я выслушал условия задачи, нацарапал решение на доске, ответил на несколько вопросов и ушел, весь перепачканный черный маркером. В то время я совершенно не представлял, как выглядит весь этот процесс с другой стороны; всё, что мне оставалось – в тревоге ждать результатов и надеяться, что я вписался в неизвестные мне критерии тех, кто проводил собеседование.
источник
PythonDigest
Calculating Spearman's Rank Correlation Coefficient in Python with Pandas
https://stackabuse.com/calculating-spearmans-rank-correlation-coefficient-in-python-with-pandas/
источник
PythonDigest
источник
2021 August 26
PythonDigest
Пишем генератор API тестов и данных для них
https://habr.com/ru/post/565424/?utm_campaign=565424&utm_source=habrahabr&utm_medium=rss

Каждый день мы пишем и актуализируем большое количество тестов для API. Поэтому сегодня я хочу обсудить тему автоматической генерации таких тестов и поделиться с сообществом нашими решениями и опытом.
Для начала давайте подумаем, что приходит вам в голову, когда вы слышите слово «автотесты».
источник
PythonDigest
Построение тепловой карты именованных сущностей
https://habr.com/ru/post/573024/?utm_campaign=573024&utm_source=habrahabr&utm_medium=rss

Именованные сущности – это слово или сочетание, обозначающее объект либо явление определенной категории. Говоря о таких объектах в контексте анализа данных, чаще всего имеют в виду ограниченный набор видов: имя (псевдоним), дата, должность (роль), адрес, денежная сумма, название организации и др.
Расположение данных объектов в строгой структуре документа формирует отдельное признаковое пространство визуальной стороны страницы и может повысить качество классификации (или кластеризации). Предлагаем разобраться, как можно получить и использовать координаты именованных сущностей в документе.
источник
PythonDigest
Podcast.__init__: Making Automated Machine Learning More Accessible With EvalML
https://www.pythonpodcast.com/evalml-automated-machine-learning-episode-329/

Audio
источник
PythonDigest
Low-Level Cache API in Django
https://testdriven.io/blog/django-low-level-cache/

This article looks at how to use the low-level cache API in Django.
источник
2021 August 27
PythonDigest
Создание приложения для анализа данных машинного обучения
https://habr.com/ru/post/574698/?utm_campaign=574698&utm_source=habrahabr&utm_medium=rss

Нейронные сети очень мощны для выполнения предиктивного анализа и решения аналитических задач. Они широко используются для классификации данных, чтобы обнаруживать закономерности и делать прогнозы. Бизнес-кейсы варьируются от классификации и защиты данных клиентов до классификации текста, поведения потребителей и многих других задач.
 
источник
2021 August 29
PythonDigest
Анализируем данные с помощью визуализации: рисуем поверх Google Maps
https://habr.com/ru/post/574736/?utm_campaign=574736&utm_source=habrahabr&utm_medium=rss

Одна из первых задач, которую мне поручили здесь — проверить качество географических данных. Формально эта задача больше относится к анализу данных, чем к системному анализу. Но меня она очень заинтересовала, ведь требовался не только анализ, но и исследование и, по возможности, реализация решения, а для меня это самое интересное в работе.
источник
PythonDigest
Python Bytes: #247 Do you dare to press "."?
https://pythonbytes.fm/episodes/show/247/do-you-dare-to-press-.

Audio
источник