Data Engineer (Python, Apache Spark)

OSA Hybrid Platform – первый в мире сервис, построенный на основе машинного обучения, повышающий уровень наличия товара на полке с целью увеличения роста товарооборота. Сервис работает в режиме реального времени.


OSA (On Shelf Availability) - показатель наличия продукции на полке магазина

Задачи:

Разработка, оптимизация и сопровождение процессов подготовки данных для обучения и применения моделей машинного обучения.

Обязательные требования:

  • Опыт промышленной разработки с применением Apache Spark (от 6 месяцев) или аналогичного решения;
  • Знание технологий обработки и хранения данных (термины b-дерево, write ahead log, партицирование для вас не пустой звук);
  • Умение оптимизировать структуру данных под конкретный use-case.

Желательно:

  • Знание Python или готовность его освоить (используем PySpark);
  • Опыт оптимизации современных SQL СУБД (PostgreSQL/Oracle);
  • Умение профилировать и находить узкие места в java приложениях.

Мы предлагаем:

  • Достойную зарплату по результатам собеседований.
  • Посещение тематических конференций.
  • Участие в митапах компании.
  • Работу по Аgile в самоуправляемой команде.
  • Гибкий график работы.
  • Приятные условия работы и уютный офис в Москва Сити.

Контактная информация

Шварева Евгения, 7-916-1844409
shvareva.evgeniya@gmail.com