Skip to content

MaximIgitov/alfa_hack_credit_scoring

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 

Repository files navigation

alfa_hack_credit_scoring

Задача

Создайть универсальную модель для бинарной классификации, ко торая справляется с разными наборами данных и может адаптиро ваться к изменениям в признаках и распределениях.

Данные

6 открытых датасетов для тестирования AutoML-решения: https://www.kaggle.com/datasets/maxigitov/ds-for-automl

Для проверки - 9 датасетов(4 открытых для лидерборда, 5 закрытых для прайвет части)

Решение

Решение имеет следующий пайплайн:

  • Предобработка данных: Обработка категориальных признаков и фильтрация значимых признаков.
  • Оптимизация модели: Использование Optuna для оптимизации гиперпараметров модели XGBoost.
  • Обучение и предсказание: Обучение модели на тренировочных данных и предсказание на тестовых данных.

Компоненты

  1. FeatureFiltration:

    • Предобработка данных: Конвертация категориальных признаков в числовые.
    • Feature Engineering: использование OpenFE для генерации новых признаков.
    • Фильтрация признаков: Использование важности признаков (gain) и пермутационного импортанса для отбора значимых признаков.
  2. Model:

    • Оптимизация гиперпараметров: Использование Optuna для оптимизации гиперпараметров модели XGBoost.
    • Обучение и предсказание: Обучение модели на тренировочных данных и предсказание на тестовых данных.

Использование

Использование универсального решения для задач бинарной классификации в банковском секторе.

  1. Установка зависимостей:

    pip install pandas xgboost optuna scikit-learn
  2. Запуск скрипта:

    python main.py

Технологии и инструменты

  • Библиотеки:
    • XGBoost
    • Optuna
    • OpenFE

Команда

  • Богодист Всеволод
  • Игитов Максим
  • Ворсин Андрей
  • Захаров Тимур

Лицензия

Этот проект распространяется под лицензией MIT.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •