X5 Data science meetup #2

5 июля проводим X5 Data science meetup #2. В этот раз поговорим как с помощью PySpark Pipeline писать читаемый, легко тестируемый и поддерживаемый код, про квази-эксперименты методом Propensity Score в кейсах, где нельзя провести стандартный A/B-тест и подходы распознавания жестового языка.

ИТ и интернет 0+

Модератор митапа — Ирина Бурко, старший менеджер по работе с большими данными, X5 Tech

18:00-18:30 — PySpark Pipeline в помощь аналитикам больших данных для построения качественных ETL-процессов

Дмитрий Чернышев, старший менеджер по анализу больших данных, X5 Tech

Расскажу про метод написания кода на PySpark таким образом, чтобы он был более читаем, легко тестируем и поддерживаем. Слушатели узнают как решить проблему документирования кода и логики пайплайнов, а также как стандартизировать работу с аналитическими пайплайнами.

18:30-19:00 — Propensity Score: как оценить эффект без стандартных A/B-тестов

Наталья Илюнькина, аналитик, группа клиентской аналитики Яндекс Маркета

Недавно нашей команде поставили задачу — оценить, как Маркет15, который раскатили в некоторых городах, влияет на частотность заказов в Маркете. Аналитики часто встречаются с подобными кейсами, где нельзя провести стандартный A/B тест. Давайте разберём, как можно их решить с помощью квази-экспериментов методом Propensity Score.

В докладе будет, где нужны подобные квази-эксперименты, их разбор, подводные камни подхода и реальная задача от постановки до получения финальных результатов.

19:00-19:30 — SLOVO: датасет русского жестового языка. Мотивация, проблемы и применения

Александр Нагаев, CV engineer, SberDevices

Почему проблема распознавания жестового языка была всегда и почему только сейчас можно говорить о ее решениях. С какими трудностями может столкнуться разработчик при сборе данных и какие есть современные подходы для решения этой задачи на основе нейронных сетей.

Свои вопросы вы можете смело задавать в комментариях к трансляции, мы постараемся на них ответить.

Присоединяйтесь, мы вас ждём!

Регистрация

X5 Data science meetup #2

782 дня назад
5 июля 2023 18:00–19:30

Событие пройдет онлайн

Уже есть билет
Ссылка на онлайн-событие рассылается за час до его начала.
Получить ссылку

Получить ссылку на трансляцию

Связь с организатором

Подпишитесь на рассылку организатора

Получение ссылок для участия

Возврат билета