Spaces:
Sleeping
Sleeping
title: Pdf Parser Api | |
emoji: π¨ | |
colorFrom: blue | |
colorTo: pink | |
sdk: docker | |
pinned: false | |
license: apache-2.0 | |
short_description: API for parsing PDF to JSON | |
# Flask Backend - PDF & KTP Scanner to JSON | |
Proyek ini adalah backend berbasis Flask yang berfungsi untuk: | |
Mengubah tabel tertentu dari dokumen PDF menjadi format JSON. | |
Memindai data dari gambar KTP (Kartu Tanda Penduduk Indonesia) menggunakan OCR, lalu menyimpannya dalam bentuk JSON. | |
## Fitur | |
π Ekstraksi Tabel PDF: Mengambil tabel dari file PDF dan mengubahnya menjadi struktur data JSON yang terstruktur. | |
πͺͺ Pindai Data KTP: Membaca informasi dari gambar KTP (seperti Nama, NIK, Alamat, Tanggal Lahir, dll) menggunakan OCR dan menyimpannya sebagai JSON. | |
β‘ API Endpoint: Backend menyediakan endpoint untuk upload file dan menerima data hasil ekstraksi. | |
## Teknologi yang Digunakan | |
- Python 3.x | |
- Flask sebagai web framework | |
- Tesseract OCR untuk ekstraksi teks dari gambar KTP | |
- OpenCV untuk praproses gambar KTP (opsional untuk peningkatan akurasi) | |