Size: a a a

2021 October 10
PythonDigest
Сохранение озвучки книги средствами Google TTS и python
https://habr.com/ru/post/581352/?utm_campaign=581352&utm_source=habrahabr&utm_medium=rss

В последнее время я полюбил слушать аудиокниги. Однако те книги, которые я хочу слушать, никто не озвучивает. Не думаю что кому то будет интересна моя драматичная история о выборе лучшего tts, проблемы в процессе написания, солнце в монитор и т.п., так что я просто представлю вам уже готовое решение.
источник
PythonDigest
Многозадачная модель T5 для русского языка
https://habr.com/ru/post/581932/?utm_campaign=581932&utm_source=habrahabr&utm_medium=rss

Модель T5 – это нейросеть, которая уже обучена хорошо понимать и генерировать текст, и которую можно дообучить на собственную задачу, будь то перевод, суммаризация текстов, или генерация ответа чат-бота.
источник
PythonDigest
Компиляция Python
https://habr.com/ru/post/581374/?utm_campaign=581374&utm_source=habrahabr&utm_medium=rss

Предположим, вы разработали приложение или библиотеку на Python и уже готовитесь передать его / её  заказчику. И в этот момент возникают вопросы, о которых многие даже не задумываются.
Во-первых, так может оказаться, что вы разработали супер крутой алгоритм, которого ни у кого нет, и показывать его хочется только избранным.
Во-вторых, возникает вопрос окружения - хочется быть уверенным, что заказчик справится с установкой правильной версии Python и всех вспомогательных библиотек, но это не всегда простая задача. Было бы удобно упаковать приложение в автономный исполняемый файл.
И, наконец, хочется,  чтобы конечное приложение работало быстрее, чем в среде разработки.
источник
PythonDigest
Python service layer: основы оформления бизнес-логики на примере Django-приложений
https://habr.com/ru/post/581964/?utm_campaign=581964&utm_source=habrahabr&utm_medium=rss
источник
PythonDigest
Мы опубликовали модель, расставляющую знаки препинания и заглавные буквы в тексте на четырех языках
https://habr.com/ru/post/581946/?utm_campaign=581946&utm_source=habrahabr&utm_medium=rss

При разработке систем распознавания речи (https://habr.com/ru/post/559640/) мы сталкиваемся с заблуждениями среди потребителей и разработчиков, в первую очередь связанными с разделением формы и сути. Одним из таких заблуждений является то, что в устной речи якобы "можно услышать" грамматически верные знаки препинания и пробелы между словами, когда по факту реальная устная речь и грамотная письменная речь очень сильно отличаются (устная речь скорее похожа на "поток" слегка разделенный паузами и интонацией, поэтому люди так не любят монотонно бубнящих докладчиков).
источник
2021 October 11
PythonDigest
источник
PythonDigest
Тестируем собственную батарейку для Django с pytest и tox
https://habr.com/ru/post/582030/?utm_campaign=582030&utm_source=habrahabr&utm_medium=rss

Итак, у нас есть идея потрясающей и всем необходимой батарейки для Django. После того, как мы написали весь код мы готовы релизнуть нашу батарейку в PyPI. Однако перед этим мы должны разобраться с несколькими моментами
источник
PythonDigest
Нейродайджест: главное из области машинного обучения за сентябрь 2021
https://habr.com/ru/post/581840/?utm_campaign=581840&utm_source=habrahabr&utm_medium=rss

Первая бестекстовая NLP-модель от FAIR, предсказание погоды от DeepMind, неожиданное применение CLIP в робототехнике и много другое в сентябрьской подборке
источник
PythonDigest
Самостоятельная разметка данных для распознавания русского рукописного текста
https://habr.com/ru/post/581528/?utm_campaign=581528&utm_source=habrahabr&utm_medium=rss

В данной статье я опишу наш опыт создания датасета для обучения модели распознавания рукописного текста.
источник
PythonDigest
AntiToxic Bot — бот, распознающий токсичных пользователей в телеграм чатах
https://habr.com/ru/post/582130/?utm_campaign=582130&utm_source=habrahabr&utm_medium=rss

Есть известная проблема с токсичными людьми в чатах. У модераторов чатов не всегда получается отслеживать и банить токсичных людей, хотелось бы автоматизировать процесс.
источник
PythonDigest
Как написать генератор изображений, который вас понимает
https://habr.com/ru/post/581794/?utm_campaign=581794&utm_source=habrahabr&utm_medium=rss

Автор статьи рассказывает, как за неделю создал Text2Art.com — генератор изображений на основе VQGAN+CLIP, способный рисовать пиксель-арт и живопись, а также изображать то, что вы напишите в текстовом поле. Для интерфейса используется Gradio, модель работает на сервере FastAPI, а системой очереди сообщений служит Firebase. Подробностями делимся к старту курса по ML и DL.
источник
PythonDigest
Построение модели оттока сотрудников для разработки стратегии удержания
https://habr.com/ru/post/582304/?utm_campaign=582304&utm_source=habrahabr&utm_medium=rss

Увольнение сотрудников дорого обходится компаниям. Стоимость замены ушедшего сотрудника зачастую очень высока. Исследования Центра Американского прогресса говорят, что компании обычно тратят около одной пятой части годовой зарплаты сотрудника, чтобы найти ему замену. И траты эти могут изрядно возрасти, если требуется замена для руководящего или высокооплачиваемого сотрудника. Затраты приходятся на проведение интервью в процессе поиска замены, бонусы на входе, и потерю производительности работы в течение первых месяцев, пока сотрудник входит в новую роль.Понимание когда и почему сотрудники более всего склонны к уходу из компании поможет качественнее их удерживать, или хотя бы заранее планировать работы по поиску новых сотрудников.
источник
PythonDigest
#python #pydigest

Сборник Python новостей уже перед вами.

В выпуске Python Дайджест вы найдете:

- Аудио-графическое шифрование или как звук в картинку спрятать
- Как написать генератор изображений, который вас понимает
- Нейросети для Natural Language Inference: логические умозаключения на русском языке
- Построение модели оттока сотрудников для разработки стратегии удержания
- Самостоятельная разметка данных для распознавания русского рукописного текста
- Модель, расставляющая знаки препинания и заглавные буквы в тексте
- Многозадачная модель T5 для русского языка
- Распознаем медицинские тексты

Заходите в гости - https://pythondigest.ru/issue/407/
Присылайте интересные новости через форму на сайте.
источник
PythonDigest
Нейросети для Natural Language Inference: логические умозаключения на русском языке
https://habr.com/ru/post/582620/?utm_campaign=582620&utm_source=habrahabr&utm_medium=rss

NLI (natural language inference) – это задача автоматического определения логической связи между текстами. Обычно она формулируется так: для двух утверждений A и B надо выяснить, следует ли B из A. Эта задача сложная, потому что она требует хорошо понимать смысл текстов. Эта задача полезная, потому что "понимательную" способность модели можно эксплуатировать для прикладных задач типа классификации текстов. Иногда такая классификация неплохо работает даже без обучающей выборки!
источник
PythonDigest
RAD для софт-процессоров и немного «сферических коней в вакууме»
https://habr.com/ru/post/582650/?utm_campaign=582650&utm_source=habrahabr&utm_medium=rss
источник
2021 October 13
PythonDigest
Разбираемся с параллельными и конкурентными вычислениями в Python
https://habr.com/ru/post/581994/?utm_campaign=581994&utm_source=habrahabr&utm_medium=rss

Я собираюсь рассказать историю о еде, раскрывающую различные возможности конкурентного и параллельного выполнения кода в Python.

 
источник
PythonDigest
Выбираем логин на Яндекс.Почте
https://habr.com/ru/post/582816/?utm_campaign=582816&utm_source=habrahabr&utm_medium=rss

Много лет назад я зарегистрировал себе несколько трех- и четырехсимвольных адресов на Яндекс.Почте. Они оказались очень удобными, потому что их легко писать и диктовать, особенно вместе с доменом ya.ru (https://ya.ru/).
источник
PythonDigest
Как понять ROC-кривые с помощью Python
https://habr.com/ru/post/582756/?utm_campaign=582756&utm_source=habrahabr&utm_medium=rss

Если вы погуглите ROC curve machine learning, то Википедия выдаст вам такой ответ: Кривая рабочих характеристик приёмника, или ROC-кривая, представляет собой график функции, который иллюстрирует диагностические возможности системы двоичного классификатора при изменении её порога распознавания.
источник
PythonDigest
источник
PythonDigest
Веб приложение для анализа и визуализации выборов в Государственную Думу в 2021
https://habr.com/ru/post/582840/?utm_campaign=582840&utm_source=habrahabr&utm_medium=rss

Выборы прошли 17-19 сентября, и новости о них постепенно уходят из повестки. Однако, результаты выборов - это не только таблица с итоговым процентом голосов за партии и кандидатов. Это большой массив данных, который был сформирован при участии миллионов людей. Эти данные содержат в себе тысячи историй, которые не расскажет итоговая таблица.
 
источник