Automatisiert Webseiten als PDF speichern…

…brauche ich jetzt zwar gerade nicht, denke mir aber, dass es vielleicht irgendwann mal nützlich sein könnte.

Deshalb beschreibe ich an dieser Stelle kurz die Webseite http://pdfmyurl.com über die man ein PDF einer Webseite erstellen kann. Das finde ich zwar zunächst mal eher langweilig, schließlich haben wir wohl so ziemlich alle einen PDF-Druckertreiber auf unseren Computern installiert. Spannend hingegen finde ich, dass man pdfmyurl.com auch mit Parametern aufrufen kann, und dass dieser Aufruf freundlicherweise auch von wget geduldet wird. Dies entnehme ich der Beschreibung der Advanced Options, in denen es heißt:

How to use on your server
Synopsis (the first -O <filename> is wget's own output file option):
  wget -O opentracker.pdf "pdfmyurl.com?url=www.opentracker.net&-O=Landscape&--header-left=hello"

Es wird also ausdrücklich die Möglichkeit zum Aufruf mittels wget und damit die Basis zu einer eleganten Automatisierung per CRON beschrieben.
Zahlreiche Parameter wie z.B.

-t, --toc                           Insert a table of content in the beginning
                                     of the document
  --print-media-type              Use print media-type instead of screen

ermöglichen das Aussehen der PDF anzupassen.
Leider gibt es mit Umlauten in URLs Probleme.

Nun fehlt mir nur noch eine gute Idee, was man damit sinnvolles anstellen könnte ;-)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert