Ведущий разработчик Python на проект Customer Data Platform (CDP)
В Rambler Group активно занимаются созданием технологий и продуктов основанных на обработке и анализе данных. Мы ищем Ведущего Python-разработчика в отдел, который занимается созданием и развитием разнообразных веб-приложений и API, Big Data DWH, а также большого ETL-слоя. Вам предстоит принять участие в создании нового продукта: CDP (Customer Data Platform), который представляет собой создание платформы для обработки и использования 1st party данные.
Среди ключевых направлений, которые сейчас находятся в разработке, можно отметить несколько:
- Платформа DMP - задачи сегментации пользователей на основе их онлайн-активности;
- Платформа торговли рекламой реального времени (RTB) - задачи, связанные с предсказанием CTR, CPA, postclick;
- Рекомендательные системы - разработка рекомендательной системы Рамблера, включает успешные интеграции с сторонними партнерами (Ecco, Price.ru), а так же с медиа-проектами Рамблера;
- Прогноз кинопроката - задачи предсказания аудитории кинотеатров;
- Компьютерное зрение - различные задачи по анализу контента видео и картинок, включая задачу определения соцдем-портрета посетителей кинотеатра;
В компании Rambler&Co накоплена большая экспертиза по решению практических задач по обработке больших данных и по использованию машинного обучения. У нас есть действительно большие данные: счетчик Топ100, наши рекламные системы, кинотеатры и внешние поставщики генерируют около 10ТБ логов в день - это миллиарды уникальных событий. Для их обработки мы используем стек Apache Hadoop/Hive/Spark.
Чем предстоит заниматься:
- Создание и развитие продуктов, основанных на обработке данных;
- Разработка веб-приложений и API (Python, Flask, asyncio);
- Создание ETL слоя (Airflow, Celery) и развитие Big Data DWH (Yarn, Hive (Tez), Spark);
- Работа с различными базами данных (PostgreSQL, Aerospike, ElasticSearch, Clickhouse, etc).
Что мы ожидаем от кандидата:
- Опыт использования Python от 3-х лет;
- Опыт руководства небольшой командой разработки;
- Хорошее знание базовых алгоритмов и структур данных;
- Опыт работы с веб фреймворками для Python;
- Уверенное знание SQL и опыт работы с различными БД;
- Опыт построения ETL-слоя;
- Умение работать в команде, ответственность за результат.
Несомненным плюсом будет:
Мы с радостью предложим:
- Полное соблюдение ТК РФ;
- Качественная медицинская страховка;
- Красивый и удобный офис недалеко от центра Москвы, куда легко добраться пешком или на трамвае от м. Тульская, на бесплатном шаттле от м. Павелецкая или на автомобиле по Даниловской набережной;
- Интересная работа среди профессионалов #ВХорошейКомпании;
- Пинг-понг и настольный футбол;
- Помощь в релокации для людей из других регионов;
- Уровень заработной платы по результатам собеседования.