Este projeto implementa um modelo simples de machine learning para identificar e-mails de phishing usando Regressão Logística.
A ideia é treinar um classificador capaz de diferenciar mensagens legítimas de tentativas de fraude, ajudando a detectar quando alguém tenta “pescar” suas informações.
- Pré-processamento de texto com regex, stopwords e stemming
- Extração de características com TF-IDF
- Treinamento e avaliação de um modelo de Regressão Logística
- Visualização de métricas de desempenho
- Pipeline de processamento e classificação
- Python
pandas,numpy,matplotlib,seabornnltkpara processamento de linguagem naturalscikit-learnpara modelagem e métricas
Fornecer um exemplo claro e comentado de classificação de e-mails maliciosos, servindo como base para estudos em Segurança Cibernética e Processamento de Linguagem Natural.