Middle NLP Data Scientist – GigaChat

договорная
Полный день, до 3 лет, полная занятость

Описание вакансии

Команда разработки голосового ассистента IVR работает над созданием AI-помощника, который может решать вопросы клиента без привлечения оператора службы поддержки.

Наш продукт IVR помогает ежемесячно обслуживать быстро, качественно и эффективно по 13 млн звонков в месяц.

Мы ищем NLP Data Scientist`а для работы в проектной команде, для создания новых NLP моделей на базе LLM и для проверки гипотез с использованием генеративной модели GigaChat.

Обязанности

  1. Разработка и внедрение LLM моделей для решения NLU задач бизнеса (с фокусом на RAG (Retrieval Augmented Generation), Intent Classification, Summarization, Text Ranking, Text Matching, Language Modeling, Prompt Engineering and Tuning)
  2. Разработка новых подходов и процессов разметки данных для оценки качества работы LLM, разработка и внедрение новых prompt-ов (промт-ов) в LLM
  3. Оптимизация работы моделей для промышленного контура на CPU/GPU
  4. Работа с командой бизнес-представителей, DS-разработчиков
  5. Организация проверки и генерация гипотез для решения технических и бизнесовых задач

Требования

  1. Опыт разработки на python + numpy, sklearn, pandas + библиотеки обработки текстовых данных
  2. Отличные теоретические знания классического и нейросетевого NLP
  3. Опыт работы с pytorch для построения DL текстовых моделей
  4. Опыт дообучения BERT-like и GPT-like трансформеров
  5. Опыт работы с разнородными данными для RecSys
  6. Знание sql
  7. Linux, Git

Будет плюсом:

  1. Практический опыт, эксперименты, внедрение в прод – transformer’ных архитектур для NLP задач
  2. Работа с инструментами Hadoop (HDFS, Hive), Spark
  3. Опыт постановки и проведения a/b тестов

Условия

  1. БК Президент Плаза, Кутузовский 32к1, метро/МЦК Кутузовская, опенспейс
  2. Профессиональное обучение, семинары, тренинги, конференции
  3. ДМС, фитнес в офисе, программы лояльности для сотрудников

Адрес места работы

Вакансия №217872, обновлена 21 августа, 15:42