Data Analyst / Data Scientist
Работаю с данными и моделями машинного обучения: от постановки задачи и EDA до обучения моделей, оценки качества и интерпретации результатов.
Фокус: прикладной ML, метрики, качество данных и бизнес-результат.
- scikit-learn
- CatBoost / LightGBM
- Feature Engineering
- Cross-validation
- Hyperparameter tuning
- Model evaluation (ROC-AUC, F1, RMSE и др.)
- Handling imbalanced data
- Python
- pandas, numpy
- scipy, statsmodels
- SQL
- matplotlib, seaborn
- Jupyter Notebook
- recommendation_systems_als — рекомендательная система (ALS, implicit feedback)
- ml_classification_models — сравнение моделей классификации
- feature_engineering_practice — генерация и отбор признаков
- real_estate_eda — анализ рынка недвижимости
- game_market_research — анализ рынка видеоигр, гипотезы
- statistical-research — статистические тесты и бизнес-гипотезы
- формулирую задачу через метрики
- внимательно работаю с данными и выбросами
- не обучаю модель без базового бейзлайна
- интерпретирую результат, а не только “score”
GitHub: @Romannelo
Telegram: @Romannelo