ML Engineer

договорная
Полный день, до 3 лет, полная занятость

Описание вакансии

Команда «Гео и графы» развивает несколько направлений: витрины данных о связанности ЮЛ, клиентские данные ЮЛ, транзакционные витрины данных, графы связей ЮЛ, геовитрины по данным ЮЛ. Все витрины используются для построения моделей в различных бизнес-блоках Банка. Совместно с командой Sber Ai Lab команда «Гео и графы» кластера «AI360» корпоративного блока Сбербанка ведет проект по созданию мультимодальной модели эмбеддингов.

Обязанности

  • Разработка и проектирование потоков данных, алгоритмов загрузки и обработки данных
  • Подготовка датасетов из больших массивов сырых данных, первичный анализ данных
  • Выявление артефактов в данных
  • Инженерная часть разработки наукоемких технологий в части инжиниринга данных
  • Взаимодействие с прикладными командами банка по внедрению технологий, разработанных лабораторией, а также мультимодальных моделей в процессы банка
  • Организация инфраструктуры хранения данных для исследований
  • Участие в сложных интеграционных проектах по развитию гибридного DWH Сбербанка (Hadoop, GreenPlum)
  • Участие во внедрении моделей на основе алгоритмов machine learning

Требования

  • Высшее техническое образование
  • Наличие практического опыта работы с Apache Spark обязательно
  • Хорошее знание Python (в том числе опыт работы с фреймворками Python по подготовке данных (Pandas, NumPy, SciPy, PySpark)
  • Опыт разработки от 1 года
  • Знание SQL
  • Умение анализировать научную литературу, разбираться в незнакомой теме
  • Желание заниматься инженерной и инфраструктурной стороной проблемы
  • Scripting (bash/powershell) обязателен, поднимать и настраивать сервера в облачных средах часто приходится самостоятельно
  • Опыт разработки под Linux среды (Ubuntu, RedHat)
  • Знание систем контроля версий, опыт коллективной разработки. У нас Git (BitBucket внутри сети банка и GitHub/GitLab в остальных случаях)
  • Фундаментальные знания принципов построения распределенных систем хранения и обработки данных

Будет плюсом:

  • Навыки программирования на Scala/Java или C++
  • Опыт работы с реляционными СУБД (Oracle, MS/SQL), навыки оптимизации запросов
  • Опыт работы с МРР GreenPlum
  • Опыт работы с системами версионирования данных типа DVC
  • Опыт работы с ETL-инструментами
  • Знания предметной области «Банки и финансы»

Условия

  • Высококвалифицированный коллектив
  • Конкурентный уровень заработной платы, а также годовые премии по результатам работы
  • ДМС, страхование от несчастных случаев, социальные гарантии, корпоративные мероприятия
  • Сниженные ставки по кредитованию, программы лояльности для сотрудников
  • Возможность профильного обучения (обучение, сертификация, конференции)
  • Интересные, сложные, амбициозные задачи
  • Адрес офиса: пр-кт Старо-Петергофский, 30 к1 литерА

Адрес места работы

Вакансия №207836, обновлена 5 июля, 14:41