Ну, то есть может в среднем и поменьше, но вот одна из вакансий, к примеру
Доброго всем,
:sberbank: is hiring Senior Data Scientist, Data Scientist(s), Data engineer(s).
Локация - Москва, новый БЦ Поклонка Плейс - рядом с МЦК и метро Кутузовская, Парк Победы.
Работодатель Сбербанк, Департамент по работе с проблемными активами. Работа департамента - разобраться у должника сложная жизненная/бизнес ситуация или проблемная задолженность носит злонамеренный характер, найти метод урегулирования и довести процесс до своего завершения. Департамент состоит из нескольких тысяч операционных сотрудников розничного и корпоративного взыскания, 2 agile-трайбов (100+ чел каждый) разрабатывающих внутренние продукты и автоматизирующих процессы, нескольких дочерних компаний и небольшой но бойкой команды Data Sciencе.
Что мы вместе с коллегами делали последние год-полтора (как пример):
* Модели скоринга и принятия решений - классический ML на python SciKit-Learn и XGBoost
* Анализ транзакционных данных и модели на них - Pyspark, Impala, Hive
* Распознавание в телефонном канале и синтез русской речи (глубокие сети), телефонный сценарный чат-бот
Сейчас работаем над развитием этих тем +
* Над продуктивизацией тех прототипов что уже полетели
* Рефакторингом из серии ML engineering (хотим привести работу в пром среде к лучшим инженерным практикам - версионированный api, devops/cd и т.п.)
* Новые модели outlier detection, process mining
Впереди в ближайшее время нас ждут
* MVP с near-realtime обработкой video+audio - хотим попробовать научить мультимодальные сеточки решать наши задачи
* RL в оптимизации стратегий розничного сбора задолженности
Так что пришла пора расширяться.
*Ожидания по роли Senior DS:*
* Опыт Software Engineer в зрелой команде -> Data Scientist либо практика запуска ML в продакшн
* Опыт работы в ML от 3 лет, в том числе с Deep Learning задачами
* Готовность делится опытом, в том числе через code review, pair programming
* Разработка и оптимизация моделей самостоятельно и в команде
* Хороший английский, готовность прокопать свежие статьи, найти релевантное и объяснить суть команде
* Быстрое погружение в новые темы
*Для роли DS важно:*
* От полугода практического ML (pandas+scikit и/или keras/pytorch)
* Опыт Feature design/engineering, хорошее знание SQL будет плюсом
* Готовность работать как в режиме исследования/прототипирования, так и продуктивизации
* Позитивный настрой, нацеленность на результат, продукты приносящие value. Одновременно принятие факта что прототипы с высокой вероятностью могут ничем не закончится, и мы будем делать следующий
* Желание и готовность инвестировать в профессиональное развитие и soft skills
*Для DE важно:*
* хорошее знание и опыт работы с SQL и процедурами, желательно в диалектах Oracle и Teradata
* Хорошее понимание как работают MPP системы и BigData - Spark, Hive, знание или готовность освоить HQL/SparkSQL
* Понимание что такое модель данных, семантический слой и как пользоваться этими вещами
* Хороший навык поиска информации, коммуникабельность
* Готовность работать как в режиме быстрого прототипирования/ad-hoc запросов, так и продуктивизации (разработки стабильных пром-витрин)
* Желательно знание linux (shell scripting, понимание unix-way обработки данных)
* Инженерный подход к решению задач. Python/Java/Scala будут плюсом. Чтение кода на python/pandas.
* Работа в паре с DS
*Плюшки:*
Департамент - очень интересная команда, мотивированная на эффективность, цивилизованное отношение к должникам и здравый смысл, старающаяся сделать классные и технологичные продукты: робот-коллектор, legal tech (
bankro.tech), bpm-системы.
Разнообразные ML задачи - как классика так и хайповые вещи. Корпоративное обучение, спортзал.
С указанием :fork: в :sberbank: все не просто.
Вилка DS/DE 80-300 тыс. руб. оклад + квартальные и годовая премии от результатов команды, зависит, пишите.
Если есть интерес готов рассказать по команду, задачи, себя подробнее. Вопросы, предложения, рекомендации - в личке, или Troshnev.N.N@sberbank.ru
Спасибо!