Data Science Portfolio - Chinmay S Nadgir

Overview

This repository contains five comprehensive, publish-quality Jupyter notebooks that demonstrate end-to-end data science workflows with a strong focus on practical, production-ready techniques. These modules cover:

Module 1: Data Loading

Techniques and best practices to ingest data efficiently from multiple file formats with robust error handling and memory optimization.

Module 2: Data Preprocessing

Systematic data cleaning, missing value treatment, outlier detection, feature engineering, and categorical encoding strategies.

Module 3: Statistics & Probability

Core statistical concepts including hypothesis testing, probability distributions, correlation analysis, and regression modeling with rigorous interpretation.

Module 4: Data Visualization

Design and implementation of static and interactive visualizations following best practices to enhance data understanding and communication.

Module 5: Exploratory Data Analysis (EDA)

A business-driven, end-to-end EDA workflow from data quality assessment to hypothesis testing, insights extraction, and actionable recommendations.

Other Data Science Projects

In addition to the modules above, prior data science work includes foundational projects in data mining and machine learning covering:

Data Preprocessing: Comprehensive handling of raw, noisy, and missing data; transformation methods such as normalization and discretization; and dimensionality reduction techniques for large datasets.
Algorithm Implementations: Application of Apriori algorithm for association rule mining to analyze market basket datasets and discover frequent itemsets. Implementation of K-means clustering on insurance policy data for customer segmentation and risk analysis.
Datasets Used:
- Grocery shopping dataset (~9,800 rows, 32 features) for frequent itemset mining and association analysis.
- Insurance policy dataset (~1,340 rows, 7 features) for unsupervised clustering and premium prediction.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
data-science-portfolio		data-science-portfolio
datasets		datasets
38,44,18,12DMMLreport .pdf		38,44,18,12DMMLreport .pdf
DataMining_MachineLearning.ipynb		DataMining_MachineLearning.ipynb
LICENSE		LICENSE
README.md		README.md
install.sh		install.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Data Science Portfolio - Chinmay S Nadgir

Overview

Module 1: Data Loading

Module 2: Data Preprocessing

Module 3: Statistics & Probability

Module 4: Data Visualization

Module 5: Exploratory Data Analysis (EDA)

Other Data Science Projects

About

Uh oh!

Releases

Packages

Languages

License

chinmaynadgir/DataPreprocessing-and-ML-operations

Folders and files

Latest commit

History

Repository files navigation

Data Science Portfolio - Chinmay S Nadgir

Overview

Module 1: Data Loading

Module 2: Data Preprocessing

Module 3: Statistics & Probability

Module 4: Data Visualization

Module 5: Exploratory Data Analysis (EDA)

Other Data Science Projects

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages