Стажер NLP Sber AI Lab

договорная
Полный день, без опыта, полная занятость

Описание вакансии

Мы приглашаем исследователей в области NLP на стажировку в центр ML инструментов Лаборатории ИИ Сбербанка. Основная задача центра - применение классического и глубокого обучения для нетривиальных задач банка и экосистемы Сбера. Наши проекты включают исследования в области анализа больших объемов текстовых, табличных (и не только) данных, а также написание opensource библиотек.

Обязанности

  • Разработка алгоритмов кластеризации и тематического моделирования диалогов, методы суммаризации, развитие генеративных и retrieval подходов, интерпретации моделей
  • Быстрая апробация новых DS подходов и методов, в том числе не типовых
  • Разработка, обучение и оптимизация моделей
  • Оценка качества моделей, трекинг и анализ результатов экспериментов.

Требования

  • Неоконченное высшее техническое образование с хорошей подготовкой в области математики и алгоритмов;
  • Хорошее знание Python и библиотеками для машинного обучения, такими как NumPy, Pandas, Scikit-learn, PyTorch.
  • Знание основ NLP и опыт работы с базовыми алгоритмами обработки естественного языка и библиотеками, такими как Transformers, spaCy, NLTK, Gensim.
  • Базовое знание статистики и алгоритмов машинного обучения.
  • Уверенный английский язык для чтения и анализа научных статей и документации.
  • Опыт работы в Linux средах обязателен.
  • Опыт работы Git.

Преимуществом будет:

  • Опыт в соревнованиях (к примеру Kaggle Expert+, или успехи на других платформах).
  • Опыт работы с глубоким обучением в области NLP, в том числе с BERT, T5, GPT, и другими моделями.
  • Знание других языков программирования (например, C++, Java).

Условия

  • Профессиональный коллектив (в группе разработки AutoML работают грандмастера и мастера Kaggle).
  • Интересные задачи на переднем крае науки, активная работа с новыми технологиями.
  • Возможность совмещать работу с соревнованиями на Kaggle и написанием научных статей.

Адрес места работы

Вакансия №190309, обновлена 21 мая, 14:47