Ведущий разработчик Python на проект Customer Data Platform (CDP)

В Rambler Group активно занимаются созданием технологий и продуктов основанных на обработке и анализе данных. Мы ищем Ведущего Python-разработчика в отдел, который занимается созданием и развитием разнообразных веб-приложений и API, Big Data DWH, а также большого ETL-слоя. Вам предстоит принять участие в создании нового продукта: CDP (Customer Data Platform), который представляет собой создание платформы для обработки и использования 1st party данные.

Среди ключевых направлений, которые сейчас находятся в разработке, можно отметить несколько:

  • Платформа DMP - задачи сегментации пользователей на основе их онлайн-активности;
  • Платформа торговли рекламой реального времени (RTB) - задачи, связанные с предсказанием CTR, CPA, postclick;
  • Рекомендательные системы - разработка рекомендательной системы Рамблера, включает успешные интеграции с сторонними партнерами (Ecco, Price.ru), а так же с медиа-проектами Рамблера;
  • Прогноз кинопроката - задачи предсказания аудитории кинотеатров;
  • Компьютерное зрение - различные задачи по анализу контента видео и картинок, включая задачу определения соцдем-портрета посетителей кинотеатра;

В компании Rambler&Co накоплена большая экспертиза по решению практических задач по обработке больших данных и по использованию машинного обучения. У нас есть действительно большие данные: счетчик Топ100, наши рекламные системы, кинотеатры и внешние поставщики генерируют около 10ТБ логов в день - это миллиарды уникальных событий. Для их обработки мы используем стек Apache Hadoop/Hive/Spark.

Чем предстоит заниматься:

  • Создание и развитие продуктов, основанных на обработке данных;
  • Разработка веб-приложений и API (Python, Flask, asyncio);
  • Создание ETL слоя (Airflow, Celery) и развитие Big Data DWH (Yarn, Hive (Tez), Spark);
  • Работа с различными базами данных (PostgreSQL, Aerospike, ElasticSearch, Clickhouse, etc).

Что мы ожидаем от кандидата:

  • Опыт использования Python от 3-х лет;
  • Опыт руководства небольшой командой разработки;
  • Хорошее знание базовых алгоритмов и структур данных;
  • Опыт работы с веб фреймворками для Python;
  • Уверенное знание SQL и опыт работы с различными БД;
  • Опыт построения ETL-слоя;
  • Умение работать в команде, ответственность за результат.

Несомненным плюсом будет:

  • Опыт использования экосистемы Hadoop (MapReduce, Hive, Spark, etc);

  • Привычка писать тесты;
  • Опыт работы с ETL слоем.

Мы с радостью предложим:

  • Полное соблюдение ТК РФ;
  • Качественная медицинская страховка;
  • Красивый и удобный офис недалеко от центра Москвы, куда легко добраться пешком или на трамвае от м. Тульская, на бесплатном шаттле от м. Павелецкая или на автомобиле по Даниловской набережной;
  • Интересная работа среди профессионалов #ВХорошейКомпании;
  • Пинг-понг и настольный футбол;
  • Помощь в релокации для людей из других регионов;
  • Уровень заработной платы по результатам собеседования.

Контактная информация

Мяченкова Евгения, 7-965-3732441
e.myachenkova@rambler-co.ru