Skip to content

Финальное задание с курса "Введение в Data Science и машинное обучение"

Notifications You must be signed in to change notification settings

ynbudarin/Stepik_ml_contest

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 

Repository files navigation

Соревнование Stepik ML

course website: https://stepik.org/course/4852/info

Нужно было предсказать, сможет ли пользователь успешно закончить онлайн курс "Анализ данных в R". Результатом проверки точности предсказаний было значение ROC AUC score. В качестве алгоритма использован RandomForest

Данные

Для обучения

  • /datasets/event_data_train.zip — данные о действиях, которые совершают студенты со стэпами:

    • step_id - id стэпа
    • user_id - анонимизированный id юзера.
    • timestamp - время наступления события в формате unix date.
    • action - событие, возможные значения:
      • started_attempt - начало попытки решить.
      • passed - удачное решение практического шага.
  • /datasets/submissions_data_train.zip — данные о времени и статусах сабмитов к практическим заданиям:

    • step_id - id стэпа.
    • timestamp - время отправки решения в формате unix date.
    • submission_status - статус решения.
    • user_id - анонимизированный id юзера.

Для предсказания

  • /datasets/event_data_test.zip — как и event_data_train.zip, но содержит данные за первые 2 дня.

  • /datasets/submissions_data_test.zip — как и submissions_data_train.zip, но содержит данные за первые 2 дня.

Результаты

В финале формируется csv файл с оценкой веростности классов Пример таблицы с результатами:

user_id is_gone
4 0.0
6 0.0
10 0.0
12 0.12749724059498363
13 0.5751964349895761

Результат соревнования на тестовой выборке

ROC AUC: 0.8908. Входит в 5ку лучших результатов среди участников

About

Финальное задание с курса "Введение в Data Science и машинное обучение"

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%