Clark's Home page

Tecnicismi vari di un Sysadmin Linux ma anche qualcosa della sua vita

Estrarre immagini da un file .pdf —

Qualche giorno fa un collega del commerciale mi è arrivato in ufficio con una richiesta che mi ha lasciato un momento interdetto, aveva un file .pdf di un vecchio catalogo aziendale e gli serviva estrarre delle immagini (tante) per poter preparare tutta una serie di documenti.
Mi son messo a cercare con google e dopo un breve periodo ho trovato la soluzione che si chiama pdfimages.
Pdfimages fa parte del pacchetto poppler-utils e il comando per ottenere il nostro risultato finale è pdfimages [opzione] file.pdf nome_immagine_estratta
molto semplice quindi, le opzioni possono essere -j che indica di estrarre in formato jpg o -f per indicare da quale pagina cominciare ad estrarre o -l per indicare quale sia l’ultima pagina da tenere in considerazione per l’estrazione.
Quindi se volessimo estrarre tutte le immagini del nostro catalogo in formato .jpg useremo un comando di questo tipo pdfimages -j catalogo_vecchio_come_il_cucco.pdf vintage_pic e il buon pdfimages estrarrà tutte le immagini in formato .jpg numerandole progressivamente da 0 in poi.
Se invece ci basta estrarre le immagini dalla pagina 3 alla pagina 176 il comando sarà
pdfimages -j -f 3 -l 176 catalogo_vecchio_come_il_cucco.pdf vintage_pic.
Con pdfimages non è possibile assegnare altri formati di salvataggio o risoluzioni di immagine.

 


Categorised as: Linux | Work

Comments are disabled on this post


Comments are closed.


Hide picture