Size: a a a

2021 August 15
PythonDigest
Cross-Fold Generation или как генерировать длинные последовательности с ruGPT-3
https://habr.com/ru/post/572940/?utm_campaign=572940&utm_source=habrahabr&utm_medium=rss

RuGPT-3 - AI-модель для русского языка, которая умеет писать тексты. Она может генерировать истории, стихи и новости, которые люди не могут отличить от настоящих. Похожая модель лежит в основе Балаболы от Яндекса. В этой статье мы описываем способ генерации длинных текстов без потери смысла на примере модели ruGPT-3 Large. Мы назвали этот метод Cross-Fold Generation. С ним можно генерировать последовательности более 2000 токенов с сохранением идеи текста.
источник
PythonDigest
[Видео] Moscow Python Podcast. Python в банковской сфере (level: all)
https://www.youtube.com/watch?v=ZRHqo7FeIMY

В гостях у Moscow Python Podcast разработчик в Raiffeisen Bank Влад Лоухин. Поговорили с Владом о том, что Python делает в банке, специфике Python в банковской сфере и о многом другом.
источник
2021 August 16
PythonDigest
Weekly Python StackOverflow Report: (cclxxxviii) stackoverflow python report
http://python-weekly.blogspot.com/2021/08/cclxxxviii-stackoverflow-python-report.html
источник
PythonDigest
Podcast.__init__: Network Analysis At The Speed Of C With The Power Of Python Using NetworKit
https://www.pythonpodcast.com/networkit-efficient-network-analysis-episode-327/

Audio
источник
PythonDigest
#python #pydigest

Сборник Python новостей уже перед вами.

В выпуске Python Дайджест вы найдете:

- HuggingArtists | Генерируем текст песен с трансформером за 5 минут
- Простые запросы SNMP в Python (с помощью pysnmp)
- Автоботы, трансформируемся: как быстро и недорого победить 400 систем-десептиконов
- Cross-Fold Generation или как генерировать длинные последовательности с ruGPT-3
- Парсинг Instagram в промышленных масштабах
- Продолжаем ковырять Тинькофф API. Рассчитываем эффективность инвестиций
- Lona - Write responsive web apps in full python

Заходите в гости - https://pythondigest.ru/issue/399/
Присылайте интересные новости через форму на сайте.
источник
PythonDigest
Владивосток, оползни и логистическая регрессия
https://habr.com/ru/post/573012/?utm_campaign=573012&utm_source=habrahabr&utm_medium=rss

27-28 августа 2019 года во Владивостоке и Приморском крае произошли массовые оползни. К счастью, обошлось без жертв. Однако, материальные потери оказались существенными: разбитые автомобили, перекрытые дороги, поврежденные здания и детские площадки. Оползни сошли в момент прохождения мощного циклона с обильными дождями. Мы робко предположили что "осадки виновны", распаковали методы классической статистики и приступили к исследованию.
источник
PythonDigest
Поиск адресов в «испорченных» данных
https://habr.com/ru/post/573018/?utm_campaign=573018&utm_source=habrahabr&utm_medium=rss

Для проведения проверки мне необходимо было установить адреса нескольких сотен объектов недвижимости. Проблема в том, что адреса были написаны в разных частях документов, документы имели различные форматы, и сам адрес также мог быть написан разнообразными способами.
источник
2021 August 22
PythonDigest
Как я боролся с анти-читом
https://habr.com/ru/post/573072/?utm_campaign=573072&utm_source=habrahabr&utm_medium=rss

Насколько мне известно, в большинстве русскоязычных тестировщиков скорости печати используется метрика CPM, наткнувшись на следующее видео (https://www.youtube.com/watch?v=mMLmCViaFKI&ab_channel=Beluga), мне стало интересно посмотреть на свои показатели метрики WPM.

По окончанию тестирования пользователю показывается результат написанный на картинке. И мне она показалась не совсем корректной.
источник
PythonDigest
В шоке от цен на авиабилеты по России: как летать дешевле
https://habr.com/ru/post/572704/?utm_campaign=572704&utm_source=habrahabr&utm_medium=rss

Люди делятся на два типа: одни летают за тысячу рублей из Питера во Владивосток, другие сутками скрупулезно высчитывают маршруты через Казахстан, отказываются от багажа, соглашаются на микро-кресла и в итоге все равно получают космический ценник.
Почему так происходит, как формируются цены на авиабилеты и как в итоге покупать их дешевле — рассказываю под катом.
источник
PythonDigest
Как устроен Domain-Driven Design
https://habr.com/ru/post/551428/?utm_campaign=551428&utm_source=habrahabr&utm_medium=rss

Многие проекты на Django начинаются просто: есть база данных и к приложению, которое крутится на сервере, идут обращения. Например, так начиналась Dodo IS (информационная система компании Додо Пицца, где работал автор сегодняшней статьи). Но если использовать Django из коробки, можно натворить много бед и встретить пачку антипаттернов. Возможно, вы встречали такое на старых legacy-проектах.
источник
2021 August 23
PythonDigest
Functools – сила функций высшего порядка в Python
https://habr.com/ru/post/573164/?utm_campaign=573164&utm_source=habrahabr&utm_medium=rss

В стандартной библиотеке Python есть множество замечательных модулей, которые помогают делать ваш код чище и проще, и functools определенно является одним из них. В этом модуле есть множество полезных функций высшего порядка, которые можно использовать для кэширования, перегрузки, создания декораторов и в целом для того, чтобы делать код более функциональным, поэтому давайте отправимся на экскурсию по этому модулю и посмотрим, что он может нам предложить.
источник
PythonDigest
Структура + предположения > ML? Моделирование продаж байесовскими методами
https://habr.com/ru/post/573098/?utm_campaign=573098&utm_source=habrahabr&utm_medium=rss

Не так давно участвовал в проекте, где мы применяли методы байесовского моделирования для ритейлинговой сети. Тема непростая и интересная. Так как проект под NDA, решил на примере похожего гипотетического проекта показать, как мы решали поставленные перед нами задачи.Также подробно расскажу об основах Байесовского моделирования. Ну и бонусом, тем кто дочитает до конца и захочет углубиться в эту тему – «куча» ссылок. ​
источник
PythonDigest
Podcast.__init__: Making Automated Machine Learning More Accessible With EvalML
https://www.pythonpodcast.com/evalml-automated-machine-learning-episode-328/

Audio
источник
PythonDigest
Finereader, Tesseract и Easyocr или нуджно ли срочно менять инструмент для OCR
https://habr.com/ru/post/573030/?utm_campaign=573030&utm_source=habrahabr&utm_medium=rss

По сравнению со старшими товарищами, EasyOCR очень молодой проект, но с большими амбициями. В статье приводится сравнение качества работы, удобства работы, особенности установки и производительности трёх инструментов.
Одна из популярных задач в аудиторской практике – распознавание текста с документов. Казалось бы, инструменты для решения этой задачи давно известны, всё работает и ничего больше особо и не хочется: бесплатно и руками – Tesseract, платно и легко в использовании – FineReader.
источник
PythonDigest
Podcast.__init__: Growing And Supporting The Data Science Community At Anaconda
https://www.pythonpodcast.com/anaconda-python-data-science-episode-328/

Audio
источник
PythonDigest
predict_proba в Python не прогнозирует вероятности (и как с этим бороться)
https://habr.com/ru/post/573924/?utm_campaign=573924&utm_source=habrahabr&utm_medium=rss

Специалисты по анализу данных часто оценивают свои прогностические модели с точки зрения точности и погрешности, но редко спрашивают себя:
«Способна ли моя модель спрогнозировать реальные вероятности?»
Однако точная оценка вероятности чрезвычайно ценна с точки зрения бизнеса (иногда она даже ценнее погрешности). Хотите пример?
источник
PythonDigest
#python #pydigest

Сборник Python новостей уже перед вами.

В выпуске Python Дайджест вы найдете:

- В шоке от цен на авиабилеты по России: как летать дешевле
- Finereader, Tesseract и Easyocr или нужно ли срочно менять инструмент для OCR
- Как устроен Domain-Driven Design
- ETL в задаче анализа данных для тех, кто не любит кофе и курилку
- Как я боролся с анти-читом
- predict_proba в Python не прогнозирует вероятности (и как с этим бороться)
- Weekly Python StackOverflow Report: (cclxxxix)

Заходите в гости - https://pythondigest.ru/issue/400/
Присылайте интересные новости через форму на сайте.
источник
PythonDigest
The Real Python Podcast – Episode #74: Python's Assignment Expressions and Fixing a Botched Release to PyPI
https://realpython.com/podcasts/rpp/74/

Audio
источник
PythonDigest
источник
PythonDigest
Test and Code: 163: pip install ./local_directory - Stéphane Bidoul
https://testandcode.com/163

Audio
источник