Size: a a a

Data Science Kazakhstan (DS/ML kz)

2020 April 06

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
т адекватно собеседовать людей в команду (как минимум, по технической части)
-умеет избегать хождения по бесполезным совещаниям и общения с людьми, которые только тратят время (а также защищать от этого свою команду). Здесь обращаю внимание - ходить по полезным встречам - это ок. Но далеко не все встречи, которые предлагают вам посетить в большой компании - это что-то полезное. И если никто не может сохранить время сотрудников - его просто съедят все, кому не лень.
-умеет выстраивать процесс работы в команде - всякие стендапы, ревью результатов, обмен опытом и вся вот эта вот работа с людьми
-чувствует команду и может работать с тем, что кто-то приуныл, кто-то хочет другие задачи, кто-то уже вырос до более крутых задач или вообще перерос самого тимлида.

"Может работать" в последнем пункте значит "может действовать адекватно в конкретной ситуации", а не "подавить возражения и зафорсить свое мнение". Например, если к вам приходит человек и говорит, что хочет больше денег, то нормальная тема - услышать вопрос и ответить, что для этого нужно сделать. НЕ нормальная тема - лечить ему, что у него все уже зашибись, денег он не хочет и просто с жиру бесится, а вообще ему уже и сейчас нехило переплачивают. Да, в некоторых компаниях последний паттерн больше приветствуют, но сильной команды вы так не соберете, а уходя от вас люди будут вас ненавидеть. Более того, люди к вам приходят и говорят о проблеме не чтобы слушать отмазы - они уже круто сделали, что вообще с вами поговорили. Могли и молча получить другой оффер, благо рынок дата саентистов сейчас в таком нестабильном состоянии, что всегда можно найти место, где сотрудника оценят заметно выше, хотя бы из-за большого разброса в оценке навыков.

Про деньги. В общем-то всё как у синьоров. Но в случае, если руководить надо парой джуниоров, роль лида может выполнять и хороший мидл, с мидловой ЗП. Но вообще лучше на лидах не экономить.

Кстати, важно затронуть подробней историю с премиями и бонусами. С уровня синьоров и лидов в некоторых компаниях уже бывают приличного размера денежные бонусы или опционы. Да и доля квартальных/проектных премий иногда может зависеть от уровня. В итоге на серьезных уровнях мы можете получать 50-100% годовой ЗП бонусами или опционами. А в быстро растущем стартапе и того больше (только и риски тоже больше, да и распоряжаться опционами вы сможете далеко не сразу, и их ценность будет зависеть от времени). Только не надо из этого делать вывод, что став хоть немножечко синьором/лидом будет адекватно требовать от работодателя бонус в размере годовой зарплаты - доход растет постепенно. Просто имейте ввиду, что потолок у опытных специалистов довольно высокий.

Все это надо также учитывать при сравнении двух позиций в разных компаниях, т.е. смотреть на среднемесячный доход, а не "голую" ЗП. При этом те, кто будут заниматься вашим удержанием или переманиванием, не всегда заинтересованы в вашей сознательности и умении считать (хотя дальновидные эйчары, имхо, должны быть заинтересованы). Например, я иногда сталкивался с ситуацией, когда в компании Х есть ЗП и небольшой (до одной ЗП) годовой бонус, в компании Y помимо ЗП - квартальные премии и опционная программа, при этом уровни и зарплатные вилки без учета бонусов примерно одинаковые. В итоге на начальных уровнях примерно все равно, где работать, а дорастая до высоких уровней, сотрудники Х охотно перетекают в Y.

6. Chief Data Scientist (CDS)

Обычно это тот, у кого в подразделении несколько групп с лидами или кто возглавляет достаточно большое подразделение ML. Еще это часто тот, кто отвечает за весь ML в компании или значимое его направление. Например, у нас в Такси на момент написания текста два вида ML: в беспилотнике и во всем остальном (ML в мобильном приложении, привлечение/удержание/активация/просто анализ поведения пользователей и водителей, контроль качества машин и выполнения некоторых правил водителем). Про меня часто говорят (в т.ч. наши топы), что я руковожу ML в Такси, но по факту я отвечаю только за "всё, что не беспилотники" (чему очень рад, т.к. в беспилотниках ничего не понимаю, особенно по срав
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
нению с теми крутыми ребятами, которые у нас их делают :). В Сбере вообще на каждое большое подразделение по CDS. В Yandex Data Factory их CDS (Эмели) отвечает прям вообще за весь ML. Впрочем, можно наверно провести какую-то аналогию между бизнес-юнитами Яндекса и департаментами Сбера, хотя конечно организации разные.

В общем, я бы определил CDS как человека, который отвечает за достаточно большое направление, в котором применяется ML, набирает команду, планирует развитие направления, работает с командой. Как следствие, нужно это уметь. Работать руками тоже нужно уметь, но я вижу ситуацию так: нужно быть морально готовым как-то сделать все задачи самому, но приложить все усилия, чтобы это делать самому не пришлось. В случае жесткой нехватки ресурсов, кризиса, необходимости сделать быстро и много, CDS небольшой компании в моей идеальной картине мира должен либо сесть и превозмогать, делая работу руками, либо придумать и реализовать другое быстрое решение.

Также нужно иметь ввиду, что в роли CDS вы в любом случае взаимодействуете с топами компании, оказываете влияние на бизнес, имеете доступ ко всякому супер-NDA (а значит, должны хорошо уметь "фильтровать базар", причем не только при разговорах с внешними людьми) и, кроме того, не можете абстрагироваться от политики внутри и вне компании. Насчет политики и интриг - самое плохое, что вы можете сделать, это погрязнуть в них (и продолбать технические вопросы) или игнорировать их существование (и принимать чужие манипуляции как что-то, с чем вы не можете работать). Крайности - это всегда плохо, а тут - особенно. На позиции CDS вам точно надо понимать, что у людей есть амбиции и планы, уметь их отслеживать и деликатно решать конфликтные ситуации. Помимо всего этого неплохо бы иметь опыт решения большого количества задач с пользой для общества, а не только болтания языком.

Кстати, чтобы обозначить как-то, что человек отвечает прям вообще за весь-весь ML в компании и принимает "стратегические решения" придумали на манер эппловского "Chief Design Officer" другого нового CxO: "Chief Data Officer". Порой это может подразумевать в целом ответственность за всю работу с данными (сбор, хранение, стратегия извлечения из них пользы для бизнеса) или вообще рассматривается именно как топ-менеджер, который больше про бизнес, чем про data science (см. картинку в аттаче). Иногда компании не оригинальничают настолько и просто называют такого человека CTO (Chief Technical Officer, технический директор). Но стоит заметить, что CTO чисто из области Data Science - это особенность компаний, core business которых построен именно на анализе данных. Обычно все-таки CTO - это человек, который шарит разработку и инфраструктурные решения. В общем, топовая позиция в линейке Data Science может называться по-разному. Еще бывает, что в большой компании на много тысяч человек есть несколько CDS департаментов и, кроме них, CDS всея компании (насколько я слышал, в Сбере, например, так).

Остался один вопрос: что с деньгами. Тут я скажу прям очень мало конкретного. Дело в том, что на такие позиции особенно заманчиво брать людей с каким-то именем и узнаваемостью в отрасли, чтобы за ними потянулись и другие крутые специалисты. Поэтому здесь разговор уже не просто про специалиста, а про бренд. Так что, начиная с того, что бедные стартапчики могут искать тимлида под пафосным названием CDS и за 170-190к, а в компании побольше можно получить и 200-400к gross среднемесячного дохода на старте, вы оказываетесь в ситуации, когда "потолок" очень, очень высоко. Бывает и 500-700-1000к, и 1500к. Только, конечно, очень маловероятно дойти до такого уровня, если ваша основная мотивация - деньги :) Нужно реально упарываться и любить то, что вы делаете.
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
И должности повыше
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Авторство Виктор Кантор
источник

MK

Minhyun Kim in Data Science Kazakhstan (DS/ML kz)
жесть стена
источник

S

Sagimbayev Zhuldyzzhan in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
нению с теми крутыми ребятами, которые у нас их делают :). В Сбере вообще на каждое большое подразделение по CDS. В Yandex Data Factory их CDS (Эмели) отвечает прям вообще за весь ML. Впрочем, можно наверно провести какую-то аналогию между бизнес-юнитами Яндекса и департаментами Сбера, хотя конечно организации разные.

В общем, я бы определил CDS как человека, который отвечает за достаточно большое направление, в котором применяется ML, набирает команду, планирует развитие направления, работает с командой. Как следствие, нужно это уметь. Работать руками тоже нужно уметь, но я вижу ситуацию так: нужно быть морально готовым как-то сделать все задачи самому, но приложить все усилия, чтобы это делать самому не пришлось. В случае жесткой нехватки ресурсов, кризиса, необходимости сделать быстро и много, CDS небольшой компании в моей идеальной картине мира должен либо сесть и превозмогать, делая работу руками, либо придумать и реализовать другое быстрое решение.

Также нужно иметь ввиду, что в роли CDS вы в любом случае взаимодействуете с топами компании, оказываете влияние на бизнес, имеете доступ ко всякому супер-NDA (а значит, должны хорошо уметь "фильтровать базар", причем не только при разговорах с внешними людьми) и, кроме того, не можете абстрагироваться от политики внутри и вне компании. Насчет политики и интриг - самое плохое, что вы можете сделать, это погрязнуть в них (и продолбать технические вопросы) или игнорировать их существование (и принимать чужие манипуляции как что-то, с чем вы не можете работать). Крайности - это всегда плохо, а тут - особенно. На позиции CDS вам точно надо понимать, что у людей есть амбиции и планы, уметь их отслеживать и деликатно решать конфликтные ситуации. Помимо всего этого неплохо бы иметь опыт решения большого количества задач с пользой для общества, а не только болтания языком.

Кстати, чтобы обозначить как-то, что человек отвечает прям вообще за весь-весь ML в компании и принимает "стратегические решения" придумали на манер эппловского "Chief Design Officer" другого нового CxO: "Chief Data Officer". Порой это может подразумевать в целом ответственность за всю работу с данными (сбор, хранение, стратегия извлечения из них пользы для бизнеса) или вообще рассматривается именно как топ-менеджер, который больше про бизнес, чем про data science (см. картинку в аттаче). Иногда компании не оригинальничают настолько и просто называют такого человека CTO (Chief Technical Officer, технический директор). Но стоит заметить, что CTO чисто из области Data Science - это особенность компаний, core business которых построен именно на анализе данных. Обычно все-таки CTO - это человек, который шарит разработку и инфраструктурные решения. В общем, топовая позиция в линейке Data Science может называться по-разному. Еще бывает, что в большой компании на много тысяч человек есть несколько CDS департаментов и, кроме них, CDS всея компании (насколько я слышал, в Сбере, например, так).

Остался один вопрос: что с деньгами. Тут я скажу прям очень мало конкретного. Дело в том, что на такие позиции особенно заманчиво брать людей с каким-то именем и узнаваемостью в отрасли, чтобы за ними потянулись и другие крутые специалисты. Поэтому здесь разговор уже не просто про специалиста, а про бренд. Так что, начиная с того, что бедные стартапчики могут искать тимлида под пафосным названием CDS и за 170-190к, а в компании побольше можно получить и 200-400к gross среднемесячного дохода на старте, вы оказываетесь в ситуации, когда "потолок" очень, очень высоко. Бывает и 500-700-1000к, и 1500к. Только, конечно, очень маловероятно дойти до такого уровня, если ваша основная мотивация - деньги :) Нужно реально упарываться и любить то, что вы делаете.
Ооо полезности, надо почитать
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Sagimbayev Zhuldyzzhan
Ооо полезности, надо почитать
Еще не читал?) ИМХО самая крутая классификация дсов. Но у дип лернингу нет привязки
источник

S

Sagimbayev Zhuldyzzhan in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
Еще не читал?) ИМХО самая крутая классификация дсов. Но у дип лернингу нет привязки
Че то как то проворонил) здесь было?
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Sagimbayev Zhuldyzzhan
Че то как то проворонил) здесь было?
31 декабря 2017 года. Я только вкатывался
источник

AS

Ahmad Sumekenov in Data Science Kazakhstan (DS/ML kz)
кто-нибудь собирается поступать на магу Науки о данных в вышку(ВШЭ)?
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Ahmad Sumekenov
кто-нибудь собирается поступать на магу Науки о данных в вышку(ВШЭ)?
Уже учёба началась там
источник

AS

Ahmad Sumekenov in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
Уже учёба началась там
это как?) там же с сентября обучение? не путаете с онлайн-магистратурой случайно?
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Ahmad Sumekenov
это как?) там же с сентября обучение? не путаете с онлайн-магистратурой случайно?
А да онлайн, сорри)
источник

AZ

Agggzhl Zhhhh in Data Science Kazakhstan (DS/ML kz)
Renat Alimbekov
нению с теми крутыми ребятами, которые у нас их делают :). В Сбере вообще на каждое большое подразделение по CDS. В Yandex Data Factory их CDS (Эмели) отвечает прям вообще за весь ML. Впрочем, можно наверно провести какую-то аналогию между бизнес-юнитами Яндекса и департаментами Сбера, хотя конечно организации разные.

В общем, я бы определил CDS как человека, который отвечает за достаточно большое направление, в котором применяется ML, набирает команду, планирует развитие направления, работает с командой. Как следствие, нужно это уметь. Работать руками тоже нужно уметь, но я вижу ситуацию так: нужно быть морально готовым как-то сделать все задачи самому, но приложить все усилия, чтобы это делать самому не пришлось. В случае жесткой нехватки ресурсов, кризиса, необходимости сделать быстро и много, CDS небольшой компании в моей идеальной картине мира должен либо сесть и превозмогать, делая работу руками, либо придумать и реализовать другое быстрое решение.

Также нужно иметь ввиду, что в роли CDS вы в любом случае взаимодействуете с топами компании, оказываете влияние на бизнес, имеете доступ ко всякому супер-NDA (а значит, должны хорошо уметь "фильтровать базар", причем не только при разговорах с внешними людьми) и, кроме того, не можете абстрагироваться от политики внутри и вне компании. Насчет политики и интриг - самое плохое, что вы можете сделать, это погрязнуть в них (и продолбать технические вопросы) или игнорировать их существование (и принимать чужие манипуляции как что-то, с чем вы не можете работать). Крайности - это всегда плохо, а тут - особенно. На позиции CDS вам точно надо понимать, что у людей есть амбиции и планы, уметь их отслеживать и деликатно решать конфликтные ситуации. Помимо всего этого неплохо бы иметь опыт решения большого количества задач с пользой для общества, а не только болтания языком.

Кстати, чтобы обозначить как-то, что человек отвечает прям вообще за весь-весь ML в компании и принимает "стратегические решения" придумали на манер эппловского "Chief Design Officer" другого нового CxO: "Chief Data Officer". Порой это может подразумевать в целом ответственность за всю работу с данными (сбор, хранение, стратегия извлечения из них пользы для бизнеса) или вообще рассматривается именно как топ-менеджер, который больше про бизнес, чем про data science (см. картинку в аттаче). Иногда компании не оригинальничают настолько и просто называют такого человека CTO (Chief Technical Officer, технический директор). Но стоит заметить, что CTO чисто из области Data Science - это особенность компаний, core business которых построен именно на анализе данных. Обычно все-таки CTO - это человек, который шарит разработку и инфраструктурные решения. В общем, топовая позиция в линейке Data Science может называться по-разному. Еще бывает, что в большой компании на много тысяч человек есть несколько CDS департаментов и, кроме них, CDS всея компании (насколько я слышал, в Сбере, например, так).

Остался один вопрос: что с деньгами. Тут я скажу прям очень мало конкретного. Дело в том, что на такие позиции особенно заманчиво брать людей с каким-то именем и узнаваемостью в отрасли, чтобы за ними потянулись и другие крутые специалисты. Поэтому здесь разговор уже не просто про специалиста, а про бренд. Так что, начиная с того, что бедные стартапчики могут искать тимлида под пафосным названием CDS и за 170-190к, а в компании побольше можно получить и 200-400к gross среднемесячного дохода на старте, вы оказываетесь в ситуации, когда "потолок" очень, очень высоко. Бывает и 500-700-1000к, и 1500к. Только, конечно, очень маловероятно дойти до такого уровня, если ваша основная мотивация - деньги :) Нужно реально упарываться и любить то, что вы делаете.
Один вопрос, сколько времени ушло на то чтобы написать это? Хотя карантин , че удивляться )
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
Agggzhl Zhhhh
Один вопрос, сколько времени ушло на то чтобы написать это? Хотя карантин , че удивляться )
Автор Виктор Кантор, 31 декабря 2017 года
источник

AZ

Agggzhl Zhhhh in Data Science Kazakhstan (DS/ML kz)
Понял
источник
2020 April 07

AB

Azamat Berdysh in Data Science Kazakhstan (DS/ML kz)
У Теренса Тао есть эссе (не могу найти ссылку), где он выделяет 3 стадии развития профессионального математика в новой для него сфере матеши. В моём перефразировании:
1) стадия пре-формализма: математик сначала выстраивает интуитивную нестрогую аргументацию, а потом пытается формализовать её. Но так как у него ещё нет глубокого понимания формализма он часто допускает глобальные ошибки. Когда ему указывают на эти ошибки он не способен их исправить. Интуиция часто вводит его в заблуждение
2) стадия формализма: после первой стадии математик понимает, что интуиция тут бесполезна и полностью отказывается от неё. Строгий математический формализм становится его единственным инструментом. Каждый маленький шаг в аргументации закрепляется строгим доказательством, из-за чего ошибается он редко (реже чем в двух других стадиях), но достижение результатов занимает колоссальные объёмы усилий. Развивается паранойя над формализмом и строгостью и нетерпимость к её отсутствию
3) стадия пост-формализма: промучавшись через вторую стадию математик развивает "правильную" интуицию вокруг формализма. Он вовращается к нестрогости и к интуитивной аргументации, так как более не "нуждается" в формализме для суждения. Но при необходимости он может превратить свою верную интуитивную аргументацию в строгое формальное доказательство. Он ошибается чаще, чем формалист, но это локальные ошибки и не влияют на верность конечного результата, а когда ему указывают на них он легко может их исправить
источник

AB

Azamat Berdysh in Data Science Kazakhstan (DS/ML kz)
Я думаю, что-то подобное обобщается и за пределы матеши, включая DS/ML. Но важный ньюанс: формалист не способен отличить глобальные ошибки пре-формалиста от локальных ошибок пост-формалиста. Поэтому если вас будет собесить DS эквивалент формалиста, то все эти чеклисты тем и вопросов которые выкладывали выше сильно пригодятся. Если вы допустите локальную ошибку, то он заключит, что вы не шарите в заданном вопросе. Если же будет собесить пост-формалист, то он сможет проверить наличия понимания не прогоняя вас по длинным чеклистам тем
источник

S

Sneddy in Data Science Kazakhstan (DS/ML kz)
Кантор кажется потом признал что пережестил в этой классификации
источник

S

Sneddy in Data Science Kazakhstan (DS/ML kz)
Хорошая попытка заманить выпускника шада на джуна лол
источник