Модератор митапа — Ирина Бурко, старший менеджер по работе с большими данными, X5 Tech
18:00-18:30 — PySpark Pipeline в помощь аналитикам больших данных для построения качественных ETL-процессов
Дмитрий Чернышев, старший менеджер по анализу больших данных, X5 Tech
Расскажу про метод написания кода на PySpark таким образом, чтобы он был более читаем, легко тестируем и поддерживаем. Слушатели узнают как решить проблему документирования кода и логики пайплайнов, а также как стандартизировать работу с аналитическими пайплайнами.
18:30-19:00 — Propensity Score: как оценить эффект без стандартных A/B-тестов
Наталья Илюнькина, аналитик, группа клиентской аналитики Яндекс Маркета
Недавно нашей команде поставили задачу — оценить, как Маркет15, который раскатили в некоторых городах, влияет на частотность заказов в Маркете. Аналитики часто встречаются с подобными кейсами, где нельзя провести стандартный A/B тест. Давайте разберём, как можно их решить с помощью квази-экспериментов методом Propensity Score.
В докладе будет, где нужны подобные квази-эксперименты, их разбор, подводные камни подхода и реальная задача от постановки до получения финальных результатов.
19:00-19:30 — SLOVO: датасет русского жестового языка. Мотивация, проблемы и применения
Александр Нагаев, CV engineer, SberDevices
Почему проблема распознавания жестового языка была всегда и почему только сейчас можно говорить о ее решениях. С какими трудностями может столкнуться разработчик при сборе данных и какие есть современные подходы для решения этой задачи на основе нейронных сетей.
Свои вопросы вы можете смело задавать в комментариях к трансляции, мы постараемся на них ответить.
Присоединяйтесь, мы вас ждём!
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.