Ketika Anda kuliah, mungkin Anda pernah suatu saat menemukan sebuah buku yang mendukung tugas kuliah Anda. Nah ketika itu, Anda tidak ingin meminjam buku tersebut karena yang hanya dikutip dari buku tersebut hanya beberapa bagian saja. Jika difoto, Anda mau tidak mau harus mengetik ulang teks dari foto tersebut. Biar ga ribet, Anda bisa melakukan beberapa cara merubah file JPG ke PDF di Android yang sebelumnya kami bahas.
Nah, setelah Anda melakukan cara-cara yang pernah kami bahas tersebut, ternyata Anda mendapati ada beberapa teks di dalam buku yang tidak terbaca oleh aplikasi atau situs converter online, sehingga ketika Anda melihat hasil scannya di PDF, ada beberapa teks dari buku yang tidak tampak. Mulai dari adanya kata yang salah baca, ataupun ada kata yang hilang beberapa huruf. Oleh karena itu, pada artikel kali ini, kami akan memberikan informasi seputar cara mengedit file PDF hasil scan tersebut.
Semua cara yang akan kami bahas di bawah ini menggunakan teknologi OCR. Apaan sih OCR itu? OCR (singkatan dari Optical Character Recognition) adalah teknologi yang berfungsi untuk men-scan teks pada gambar dan mengubahnya menjadi file bentuk teks yang bisa dimodifikasi. Teknologi ini biasanya menjadi fitur pendukung dalam scanner. Dengan teknologi OCR, hasil scan yang memiliki teks bertulisan tangan, tulisan mesin ketik, atau teks ketikan komputer, dapat dimanipulasi. Teks yang di-scan dengan OCR dapat dicari kata per kata atau per kalimat. Setiap teks yang ditemukan dapat dimanipulasi, diganti, atau malah diberikan barcode.
Bisa dibilang, artikel ini adalah lanjutan dari artikel kami sebelumnya. Bukannya mantap tuh jika setelah buku tadi difoto, lalu di-scan, lalu hasil scan yang kurang diperbaiki? Jadi, kami akan berikan informasi seputar cara mengedit file PDF hasil scan kepada Anda di bawah ini:
1. Menggunakan Software
Cara pertama ini adalah menggunakna software khusus editor PDF hasil scan yang sudah banyak dirilis di internet. Berikut ini software-softwarenya:
Software ini bisa dibilang adalah salah satu software OCR terbaik yang kami rekomendasikan, karena tingkat keakuratannya sangat besar, yaitu bisa mencapai 99,8%. Selain itu, software ini mampu mempertahankan format asli dari bagian dokumen. Judul, isi, dan format dari teks akan diubah ke dokumen Word yang dapat di-edit.
Software ini juga mendukung semua format gambar, termasuk file Photoshop (.PSD). Selain itu, software ini hanya tersedia untuk perangkat yang terinstal OS Windows dan Anda bisa mendownloadnya secara gratis.
Software ini membutuhkan Google Tesseract OCR Engine untuk bisa digunakan. Meskipun begitu, software ini memiliki tampilan yang bagus. Reader pada software ini dapat berfungsi sangat baik karena bisa mendeteksi page layout secara otomatis . Atau jika ada tata letak teks yang berantakan, Anda bisa menyesuaikannya sendiri.
Tampilan hasil scan teks ditempatkan di sisi kanan layar gambar atau dokumen hasil scan, sehingga dapat memudahkan Anda untuk mencocokkan hasil scan teks dengan hasil scan sebelumnya. Tetapi cara ini tidak termasuk untuk pengeditan dasar text serta pemeriksa ejaan teks. Eitsss, Anda sebenarnya bisa melakukan hal tersebut jika mendownload kamus yang cocok.
Software OCR ini memiliki dua fungsi utama. Pertama, Anda bisa menggunakannya sebagai tool screenshot yang bisa mengambil gambar dan menyalinnya sebagai teks ke clipboard Windows. Sehingga, Anda bisa menempelkan (paste) teks tersebut kemana saja yang Anda inginkan. Kedua, software ini memiliki teknologi Voice Recognition yang bisa mengubah ucapan kata-kata ke text. Sayangnya, fitur ini masih belum sempurna, jadi Anda jangan berharap lebih pada fitur ini. Apalagi, fitur biasanya hanya bekerja untuk bahasa Inggris saja.
Software OCR ini hanya tersedia untuk OS Windows saja. Selain itu, software ini hanya bisa digunakan untuk versi Windows Vista ke atas. Sedangkan, untuk Windows XP ke bawah, Anda masih bisa menggunakan aplikasi ini dengan cara menginstal beberapa add-ons tambahan.
FreeOCR bisa bekerja untuk TWAIN scanner, file PDF, dan image TIFF, dan keluaran teks yang dihasilkan akan menjadi file Microsoft Word. Untuk bisa menggunakan software ini, Anda juga harus mendownload Google Open Source Tesseract OCR engine (yang juga dibutuhkan oleh software gImageReader).
Nah, berikut ini cara-cara menggunakan Free OCR. Jika Anda menggunakan software OCR lainnya, Anda bisa menyesuaikan cara-cara di bawah ini dengan software yang Anda gunakan.
2. Menggunakan Microsoft Office OneNote
Selain menggunakan beberapa software yang telah kami bahas di atas, ternyata Microsoft Office memiliki fitur untuk mengubah file PDF hasil scan menjadi bentuk teks. Fitur tersebut bisa Anda temukan di Microsoft OneNote. Berikut ini cara penggunannya:
3. Menggunakan Situs Online
Jika Anda malas menginstal software tambahan, Anda juga bisa menggunakan layanan online OCR. Salah satu situs yang menyediakan fitur ini adalah Free Online OCR. Situs ini bisa membantu Anda untuk mengubah dokumen PDF, file gambar JPEG, PNG, GIF, TIFF, dan DjVu ke dalam bentuk teks. Selain itu, aplikasi online ini juga bisa menampilkan OCR sesuai dengan page layout dari dokumen yang Anda miliki. Cara mengedit file PDF hasil scan ini cukup mudah. Anda cukup membuka situs dari aplikasi ini, kemudian upload file yang ingin Anda jadikan teks. Setelah proses konversi selesai, Anda bisa melihat hasil OCR di bawah gambar dokumen yang Anda upload. Anda juga bisa mendownload hasil konversi dengan mengklik tombol download, atau melakukan translasi bahasa mengugnakan Google Translate, Bing Translator, serta melakukan editing secara online.
4. Software Berbayar
Salah satu cara mengubah JPEG ke PDF satu ini mempunyai kemiripan dengan poin nomor satu, yakni sama-sama menggunakan software. Bedanya, software yang akan kita gunakan ini adalah software berbayar, yaitu Nitro PDF Pro. Jadi, bagi Anda yang menggunakan Nitro PDF Pro sebagai software PDF readernya, Anda tidak perlu repot-repot untuk menginstal software OCR lagi. Lalu jika Nitro PDF yang Anda instal tidak ada fitur tersebut gimana? Yah, upgrade dong ke versi Pro. Oke, berikut ini cara-caranya:
Cara-cara di atas juga merupakan beberapa cara memindahkan file PDF ke Word yang pernah kami bahas sebelumnya di situs ini.
Jika gambar, file PDF, atau hasil scan tidak terbaca oleh software OneNote atau software OCR, biasanya hal tersebut karena posisi gambar (huruf atau angka di dalam gambar) tidak tegak atau miring). Oleh karena itu, sebaiknya Anda mengedit gambar atau hasil scan tersebut menggunakan salah satu dari macam-macam software grafis agar posisi menjadi lebih tegak. Karena pada prinsipnya, melakukan scan dan foto langsung itu sama saja. Perbedannya hanya pada kualitas saja.
Sekian artikel kali ini seputar cara mengedit file PDF hasil scan. Semoga artikel kali ini dapat menjadi inspirasi Anda.