Este projeto tem por escopo o desenvolvimento de um Pipeline de Machine Learning com uso do Spark, para avaliação na Unidade Curricular de Big Data Para Gestão.
É necessário que sejam satisfeitas as seguintes etapas:
- Feature engineering;
- Criação do pipeline;
- Treino/avaliação do modelo desenvolvido.
Para tanto, deve ser utilizado o Data Set "Credit Card Fraud Detection", tendo como principal objetivo prever com a maior acurácia possível o target, que neste caso é a variável binária "Class".