Diselesaikan: ekstrak tabel dari gambar python

Pembaharuan Terakhir: 09/11/2023

Masalah utama dalam mengekstraksi tabel dari gambar adalah bahwa data tabel dapat tersebar di seluruh gambar, sehingga sulit ditemukan dan diekstraksi.

There is no built-in function in Python to extract tables from images but there are many libraries that you can use. One such library is pytesseract which is a wrapper for Google's Tesseract-OCR Engine.

Here is a simple example of how you can use pytesseract to extract table data from an image:

import pytesseract import cv2 # read the image image = cv2.imread("image.png") # convert the image to grayscale gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # apply thresholding to preprocess the image thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1] # perform OCR on the thresholded image result = pytesseract.image_to_string(thresh) print(result)

Kode ini mengimpor pustaka pytesseract dan cv2.

Selanjutnya, terbaca pada gambar.

Kemudian, itu mengubah gambar menjadi skala abu-abu.

Setelah itu, menerapkan thresholding untuk preprocess gambar.

Akhirnya, ia melakukan OCR pada gambar ambang dan mencetak hasilnya.

Bekerja dengan gambar

Ada beberapa cara untuk bekerja dengan gambar di Python. Cara paling sederhana adalah dengan menggunakan modul Gambar, yang menyediakan berbagai metode untuk memanipulasi gambar. Misalnya, Anda dapat membuat gambar dari awal menggunakan fungsi Image(), atau Anda dapat memuat gambar dari file menggunakan fungsi open().

Cara lain untuk bekerja dengan gambar di Python adalah dengan menggunakan modul PIL (Python Imaging Library). Modul ini menyediakan berbagai metode untuk memanipulasi gambar, termasuk memangkas dan mengubah ukurannya, mengonversinya di antara format yang berbeda, dan banyak lagi.

Kata dengan tabel

Di Python, Anda bisa membuat tabel dengan fungsi table() . Fungsi table() membutuhkan dua argumen: tipe data tabel dan daftar nama kolom. Ini contohnya:

tabel(“nama”, “umur”)

nama umur
John 20
jane 25

Pos terkait: