google analytics

Guide passo passo pratiche, semplici per GNU/Linux Ubuntu. Consigli su programmi da installare e impostazioni.

mercoledì 22 giugno 2011

RICONOSCIMENTO CARATTERI DA IMMAGINE O PDF IN UBUNTU


Da PDF a testo, o da immagine a testo in Ubuntu è possibile grazie ad un programma per riconoscimento caratteri (OCR), il suo nome è Gimagereader. Grazie a questo programma saremo in grado di trasformare un immagine o un PDF in testo modificabile, con risultati ottimi.

INSTALLARE ULTIMA VERSIONE DI GIMAGEREADER:
Scaricare il pacchetto .deb da sourceforge (scegli sempre la ultima versione).
Installare il pacchetto .deb su Ubuntu.
Ora avete il programma che vi permette di lavorare, ma manca il suo cervello!
INSTALLARE TESSERACT OCR:

Aprire il Gestore Pacchetti.
Scrivere tesseract nella ricerca.
Selezionare tesseract-ocr-ita (verrà automaticamente selezionato anche tesseract-ocr).
Applicate le modifiche.


IMPOSTARE GIMAGEREADER
Il programma è molto semplice da usare, modifichiamo alcune impostazioni al primo avvio

Selezionare il programma dalla casella ricerca di Ubuntu.
Andiamo nel menu in alto alla voce file, e selezionate configurazione.
Alla voce lingua preferita mettete italiano.


USARE GMAGEREADER
Selezionare il programma.
Andare alla voce Aprire per selezionare il file che ci interessa.
Una volta caricato il file, se vi interessa tutto selezionate la voce in alto a destra Riconoscere tutto.
Se vi interessa solo una parte selezionate con il puntatore a croce il riquadro che vi interessa.

Nessun commento:

Posta un commento