Промо
21 сентября 2020

Что такое дата-сайенс и почему средняя зарплата в этой сфере — 120 тысяч рублей в месяц?

Как с помощью больших данных предотвращают пробки и прогнозируют продажи, почему эта работа хорошо оплачивается и можно ли стать специалистом в сфере дата-сайенс без технического образования?

«Бумага» отвечает на главные вопросы о профессии дата-сайентиста вместе с Сергеем Щукиным, экспертом по направлению дата-сайенс в онлайн-школе SkillFactory.

Для чего нужна наука о данных?

Задача дата-сайенс — анализ больших данных и поиск оптимальных решений на их основе. Большие данные — это массив неструктурированной информации: их объем исчисляется в терабайтах и петабайтах. Например, 1 терабайт данных позволяет хранить 6,5 миллиона страниц документов в форматах файлов Office, PDF и презентаций. Раньше компьютерные емкости не позволяли накапливать и хранить такое количество информации, но с увеличением часов, проведенных пользователями онлайн, и развитием технологий это стало возможным.
Например, к большим данным относятся: лайки в социальных сетях, данные о пассажиропотоке в транспорте, адреса электронной почты, информация об онлайн-покупках, погоде, геноме и так далее. Всю эту информацию можно извлекать, исследовать, систематизировать и выявлять закономерности.
Сергей Щукин, эксперт по направлению Data Science в онлайн-школе SkillFactory, в качестве примера использования больших данных приводит автомобильный навигатор «Яндекса». «Сел в машину, забил маршрут, и тебе сразу же предлагают вариант. При этом система предсказывает, какой будет трафик на том или ином маршруте, и предлагает разным водителям разные пути, таким образом сокращая пробки. То есть в системе навигатора есть данные о том, в какой день недели, в какое время и в каких местах наблюдаются наибольшие скопления машин», — объясняет специалист.

Чем занимаются дата-сайентисты?

Это люди, которые работают с большими данными, находя в них закономерности и на их основе предлагая решения для оптимизации тех или иных процессов.
Рекомендательные системы, поисковики, сервисы проверки орфографии и перевода, программы для распознавания лиц, беспилотные автомобили — всё это создано с участием дата-сайентистов.
Например, специалист в сфере дата-сайенс может проанализировать, как погода сказывается на продаже лекарств в аптеке, и сделать вывод о том, что средство от простуды лучше всего покупают, когда температура опускается ниже 10 градусов. Это значит, что аптека может снизить складские издержки летом, когда спрос на это лекарство меньше, и пополнять запасы с началом холодов.

Какова средняя зарплата в этой сфере?

Согласно исследованию «Хабр Карьера», средняя зарплата дата-сайентиста в России в первой половине 2020 года — 120 тысяч рублей в месяц. Но на то, сколько получает специалист по работе с большими данными, влияет его или ее должность и компетенции.
Первая позиция в дата-сайенс — как и в других IT-специальностях — джуниор. Это должность для человека с небольшим опытом работы. По словам Сергея Шукина, на этой позиции люди разбираются с программами, которые наилучшим образом комплектуют данные в так называемые дата-сеты, чтобы более подготовленные специалисты могли с ними работать — формулировать и проверять гипотезы.
В Петербурге зарплата джуниор-специалиста в Data Science на HeadHunter в среднем начинается от 80 тысяч рублей в месяц. На эту должность можно претендовать, окончив два семестра курса «Профессия Data Scientist» от SkillFactory.
На позиции мидл-специалиста люди выполняют задачи для бизнеса, то есть на основе больших данных создают новые продукты или технологии и делают прогнозы. Средняя зарплата таких специалистов — от 120–180 тысяч рублей в месяц.
Третья ступень в карьере дата-сайентиста — синьор. Как правило, на ней люди занимают руководящие должности и принимают оптимальные технологические решения в процессе работы над проектом. Зарплата синьоров обычно начинается от 200 тысяч рублей в месяц.

Почему дата-сайентистам столько платят?

Набор навыков, которыми должен обладать дата-сайентист, пока встречается нечасто. Для работы с большими данными нужно знать линейную алгебру, матанализ, основы статистики и теории вероятности, уметь программировать на Python и понимать основные модели машинного обучения.
При этом компаний, которые начинают работать с большими данными, становится всё больше. По данным исследования Mail.ru Group и HeadHunter, в 2019 году в России вакансий в области анализа данных стало больше в 9,6 раза, а в области машинного обучения — одного из направлений дата-сайенс — в 7,2 раза, чем в 2015 году. Спрос на специалистов в сфере дата-сайенс превышает предложение.
По словам Щукина, рынок дата-сайенс еще не до конца сформировался, и сейчас подходящий момент для того, чтобы на него зайти. «Самые продвинутые, стремящиеся к оптимизации своей работы компании уже пользуются этим вовсю, но миллион других крупных фирм пока не до конца понимает все возможности работы с данными. Поэтому сейчас идет два параллельных процесса: с одной стороны, рынок развивается, возникают новые запросы, а с другой — появляются специалисты», — говорит эксперт.

Можно ли стать дата-сайентистом без технического образования?

Можно. Важную роль играет желание разбираться и развиваться в этой области. «Для работы в дата-сайенс не обязательно быть Лобачевским в математике. Но хотелось бы, чтобы вам нравилась эта дисциплина, потому что математику, безусловно, нужно знать», — объясняет Сергей Щукин.
Например, курс «Профессия Data Scientist» от SkillFactory выстроен таким образом, чтобы на нем могли учиться не только программисты, но и люди, которые до этого изучали только гуманитарные науки.
Обучение длится два года и состоит из нескольких блоков: программирование на Python, математическая статистика, машинное обучение, нейронные сети, информационные технологии и менеджмент. Студенты осваивают базовые навыки работы с данными на практике и в процессе учебы могут углубиться в ту область, которая покажется им самой интересной.
В течение всего процесса участников курса сопровождают менторы — практикующие дата-сайентисты — которые помогают им с решением сложных задач, возникающих во время учебы. Кроме того, со студентами работают тьюторы: они учат их настраивать тайм-менеджмент, справляться с прокрастинацией и мотивационными кризисами.

А как устроиться на работу в сфере дата-сайенс?

В дата-сайенс опыт работы с реальными бизнес-проектами важнее диплома. Собрать портфолио, решая практические задачи, можно на специальных платформах. Кроме того, многие компании предлагают стажировки для начинающих специалистов.
На курсах дата-сайенс обучение тоже обычно строится на практике. В процессе учебы студенты выполняют проекты, которые затем могут включить в свое портфолио.
Кроме того, Сергей Щукин рассказывает, что компании, которым интересно решать задачи, связанные с дата-сайенс, предоставляют свои данные студентам курсов, чтобы они формулировали по ним гипотезы и строили модели. Таким образом, к концу учебы у участников курса появляется портфолио с собственными проектами.

Хочу получше вникнуть в эту тему. Что еще можно почитать про дата-сайенс?

Сергей Щукин советует начать с этих книг: «Статистика и котики» Владимира Савельева и «Введение в машинное обучение с помощью Python» Андреаса Мюллера и Сары Гвидо.


SkillFactory — онлайн-школа, в которой можно освоить профессию дата-сайентиста. Здесь вас не только научат работать с большими данными, но и помогут найти работу. С первых недель обучения специалисты SkillFactory помогают студентам определить карьерные цели и не сойти с намеченного пути, а в конце курса подсказывают, как оформить резюме и попасть на собеседование.

До 30 октября на все курсы SkillFactory действует 50 % скидка по промокоду PAPER. 

Ольга Кузина
Авторы: Ольга Кузина
Если вы нашли опечатку, пожалуйста, сообщите нам. Выделите текст с ошибкой и нажмите появившуюся кнопку.
Подписывайтесь, чтобы ничего не пропустить
Образование
В новом учебном году учителям истории рекомендовали уделить особое внимание «нашим героям» — в списке Дарья Дугина и участники войны в Украине
В России запустили множество философских курсов. На какие проекты стоит обратить внимание и зачем нужна философия во время кризисов
Студентов Горного университета будут отчислять за пропуск трех занятий или более одного учебного дня без уважительной причины
«Кино — это игра вдолгую». Почему «Сеанс» запускает курсы сценаристов и кураторов на фоне цензуры и запрета фильмов
Администрация СПбГУ прокомментировала рост цен в общежитиях. Студенты раскритиковали объяснения вуза
К сожалению, мы не поддерживаем Internet Explorer. Читайте наши материалы с помощью других браузеров, например, Chrome или Mozilla Firefox Mozilla Firefox или Chrome.