Spaces:
Sleeping
title: Pdf Parser Api
emoji: 🐨
colorFrom: blue
colorTo: pink
sdk: docker
pinned: false
license: apache-2.0
short_description: API for parsing PDF to JSON
Flask Backend - PDF & KTP Scanner to JSON
Proyek ini adalah backend berbasis Flask yang berfungsi untuk:
Mengubah tabel tertentu dari dokumen PDF menjadi format JSON.
Memindai data dari gambar KTP (Kartu Tanda Penduduk Indonesia) menggunakan OCR, lalu menyimpannya dalam bentuk JSON.
Fitur
📄 Ekstraksi Tabel PDF: Mengambil tabel dari file PDF dan mengubahnya menjadi struktur data JSON yang terstruktur.
🪪 Pindai Data KTP: Membaca informasi dari gambar KTP (seperti Nama, NIK, Alamat, Tanggal Lahir, dll) menggunakan OCR dan menyimpannya sebagai JSON.
⚡ API Endpoint: Backend menyediakan endpoint untuk upload file dan menerima data hasil ekstraksi.
Teknologi yang Digunakan
Python 3.x
Flask sebagai web framework
Tesseract OCR untuk ekstraksi teks dari gambar KTP
OpenCV untuk praproses gambar KTP (opsional untuk peningkatan akurasi)