Middle NLP Data Scientist – GigaChat
договорная
Полный день, до 3 лет, полная занятость
Описание вакансии
Команда разработки голосового ассистента IVR работает над созданием AI-помощника, который может решать вопросы клиента без привлечения оператора службы поддержки.
Наш продукт IVR помогает ежемесячно обслуживать быстро, качественно и эффективно по 13 млн звонков в месяц.
Мы ищем NLP Data Scientist`а для работы в проектной команде, для создания новых NLP моделей на базе LLM и для проверки гипотез с использованием генеративной модели GigaChat.
Обязанности
- Разработка и внедрение LLM моделей для решения NLU задач бизнеса (с фокусом на RAG (Retrieval Augmented Generation), Intent Classification, Summarization, Text Ranking, Text Matching, Language Modeling, Prompt Engineering and Tuning)
- Разработка новых подходов и процессов разметки данных для оценки качества работы LLM, разработка и внедрение новых prompt-ов (промт-ов) в LLM
- Оптимизация работы моделей для промышленного контура на CPU/GPU
- Работа с командой бизнес-представителей, DS-разработчиков
- Организация проверки и генерация гипотез для решения технических и бизнесовых задач
Требования
- Опыт разработки на python + numpy, sklearn, pandas + библиотеки обработки текстовых данных
- Отличные теоретические знания классического и нейросетевого NLP
- Опыт работы с pytorch для построения DL текстовых моделей
- Опыт дообучения BERT-like и GPT-like трансформеров
- Опыт работы с разнородными данными для RecSys
- Знание sql
- Linux, Git
Будет плюсом:
- Практический опыт, эксперименты, внедрение в прод – transformer’ных архитектур для NLP задач
- Работа с инструментами Hadoop (HDFS, Hive), Spark
- Опыт постановки и проведения a/b тестов
Условия
- БК Президент Плаза, Кутузовский 32к1, метро/МЦК Кутузовская, опенспейс
- Профессиональное обучение, семинары, тренинги, конференции
- ДМС, фитнес в офисе, программы лояльности для сотрудников
Адрес места работы
Вакансия №217872,
обновлена 21 августа, 15:42