pdf-parser-api / README.md
blaxx14's picture
Update README.md
4c1198c verified
metadata
title: Pdf Parser Api
emoji: 🐨
colorFrom: blue
colorTo: pink
sdk: docker
pinned: false
license: apache-2.0
short_description: API for parsing PDF to JSON

Flask Backend - PDF & KTP Scanner to JSON

Proyek ini adalah backend berbasis Flask yang berfungsi untuk:

Mengubah tabel tertentu dari dokumen PDF menjadi format JSON.

Memindai data dari gambar KTP (Kartu Tanda Penduduk Indonesia) menggunakan OCR, lalu menyimpannya dalam bentuk JSON.

Fitur

📄 Ekstraksi Tabel PDF: Mengambil tabel dari file PDF dan mengubahnya menjadi struktur data JSON yang terstruktur.

🪪 Pindai Data KTP: Membaca informasi dari gambar KTP (seperti Nama, NIK, Alamat, Tanggal Lahir, dll) menggunakan OCR dan menyimpannya sebagai JSON.

⚡ API Endpoint: Backend menyediakan endpoint untuk upload file dan menerima data hasil ekstraksi.

Teknologi yang Digunakan

  • Python 3.x

  • Flask sebagai web framework

  • Tesseract OCR untuk ekstraksi teks dari gambar KTP

  • OpenCV untuk praproses gambar KTP (opsional untuk peningkatan akurasi)