Data Scientist (Sberspace)

договорная
Полный день, до 3 лет, полная занятость

Описание вакансии

В команду Knowledge Management, разрабатывающую retrieval augmented расширения для LLM GigaChat требуется Data/Prompt Engineer. Наша команда работает над расширением возможностей GigaChat в работе со специализированной инженерной и IT-тематикой.

Обязанности

  • Подготовка данных для LLM-модели
  • Разработка метрик качества и тестирование LLM-модели
  • Дообучение языковой модели
  • Разработка навыков и оптимизация запросов (prompt-engineering)
  • Подготовка валидационных датасетов

Требования

  • Опыт работы с большими языковыми моделями
  • Понимание принципов и основ обучения языковых моделей
  • Понимание основ работы индексации и поисковых решений
  • Понимание алгоритмов улучшения качества поисковой выдачи
  • Навыки программирования на Python

Будет плюсом:

  • Контейнеризация: Docker
  • Виртуализация: OpenShift
  • Брокеры сообщений: Kafka
  • Инструменты DevOps: Git, Bitbucket, Nexus, Jenkins
  • Опыт работы с ранжированием, рекомендациями, NLP-механиками
  • Опыт работы с SFT-обучением моделей, подготовка разметки
  • Знание Elastic Search
  • Знание C#

Условия

  • Офис БЦ «Даниловский форт» (м.Нагатинская, м.Тульская);
  • График с гибким началом рабочего дня;
  • График 5/2, возможен гибридный формат работы;
  • Отсутствие строго дресс-кода;
  • Стабильный оклад и социальную поддержку сотрудников;
  • ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких;
  • Корпоративная пенсионная программа;
  • Корпоративное обучение за счет компании;
  • Реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей;
  • Официальное оформление с первого дня;
  • Корпоративный спортзал;
  • Скидки на продукты Сбера и компаний экосистемы.

Адрес места работы

Вакансия №183486, обновлена 26 марта, 14:55