Business Registration OCR

Extract data from business registration documents using OCR.

Setup

Clone this repository
Create virtual environment:

   python3 -m venv venv
   source venv/bin/activate

Install dependencies:

   brew install tesseract
   pip install -r requirements.txt

Usage

Place document images in data/sample_documents/
Run:

   python src/main.py

Check results in output/ folder

Project Structure

business-reg-ocr/
├── src/
│   ├── main.py              # Main application
│   ├── image_processor.py   # Image preprocessing
│   ├── ocr_engine.py        # OCR engine
│   └── parser.py            # Data extraction
├── tests/
├── data/sample_documents/   # Input images
└── output/                  # Results

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
src		src
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Business Registration OCR

Setup

Usage

Project Structure

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Business Registration OCR

Setup

Usage

Project Structure

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages