pdf-parser-api / README.md
blaxx14's picture
Update README.md
4c1198c verified
---
title: Pdf Parser Api
emoji: 🐨
colorFrom: blue
colorTo: pink
sdk: docker
pinned: false
license: apache-2.0
short_description: API for parsing PDF to JSON
---
# Flask Backend - PDF & KTP Scanner to JSON
Proyek ini adalah backend berbasis Flask yang berfungsi untuk:
Mengubah tabel tertentu dari dokumen PDF menjadi format JSON.
Memindai data dari gambar KTP (Kartu Tanda Penduduk Indonesia) menggunakan OCR, lalu menyimpannya dalam bentuk JSON.
## Fitur
πŸ“„ Ekstraksi Tabel PDF: Mengambil tabel dari file PDF dan mengubahnya menjadi struktur data JSON yang terstruktur.
πŸͺͺ Pindai Data KTP: Membaca informasi dari gambar KTP (seperti Nama, NIK, Alamat, Tanggal Lahir, dll) menggunakan OCR dan menyimpannya sebagai JSON.
⚑ API Endpoint: Backend menyediakan endpoint untuk upload file dan menerima data hasil ekstraksi.
## Teknologi yang Digunakan
- Python 3.x
- Flask sebagai web framework
- Tesseract OCR untuk ekstraksi teks dari gambar KTP
- OpenCV untuk praproses gambar KTP (opsional untuk peningkatan akurasi)