Den Webclipper bzw. Sorter kannst du im Laufe der basalen Programmeinrichtung von DEVONthink für Safari, Google Chrome und Firefox installieren. Wenn du das zu Anfang nicht gemacht hast, kannst du das jederzeit nachinstallieren - der entsprechende Zugriff erfolgt danach über einen Button in der Symbolleiste des Browsers oder über die Menüleiste. Die Installation erfolgt über das Fenstermenü:

DEVONthink > zusätzliche Module installieren 

Im Grunde genommen ist dieser Webclipper nicht viel anderes als ein recht aufwändiges und variables Note Taking Tool für Webinhalte.


Was soll wie gespeichert werden?

Vorab solltest du dir erst einmal Gedanken darüber machen, was durch die Speicherung eines Webinhaltes, der ja immer in einem HTML-Format mit diversen eingebundenen Ressourcen vorliegt, erreicht werden soll.

Du solltest du auch bewusst sein, dass diese Webseiteninhalte heutzutage nicht mehr statisch sind, sondern sich ständig verändern. Früher war das anders, da konntest du einen Inhalt relativ sicher nach drei Monaten genauso wie du ihn beim ersten Seitenbesuch gefunden hattest, wiederfinden. Heute ist das dank dynamischer Webseiten, die ihre Inhalte serverseitig erst beim Seitenaufruf generieren, anders. Gerade das macht es sinnvoll, Webinhalte so zu speichern, wie du sie vorgefunden hast. Und gleichzeitig kann es sinnvoll sein, Webinhalte von all möglichem "Müll" zu befreien, der gar nichts mit den eigentlichen, von dir für speicherungswürdig erachteten Inhalten zu tun hat

Eine Schwierigkeit beim Speichern der vom "Müll" befreiten Inhalte können Bilder sein Bilder, die beim späteren Aufruf eines solchen Dokuments von DEVONthink ggfs. erst nachgeladen werden müssen und die dann ggfs. gar nicht mehr darstellbar sind weil sie im Internet nicht mehr auffindbar sind. Dieses Problem lässt sich durch das richtige Dateiformat lösen.

Vielleicht willst du Webseiten aber auch genauso speichern, wie du sie gesehen hast - also mit allem "Müll". Hier ist die Schwierigkeit, dass Webseiten völlig anders aussehen können, je nachdem mit welchem Gerät sie aufgerufen werden - gerade Desktop- und Mobil-Versionen können sich in der Art und Weise, wie ein Webinhalt ausgegeben wird, doch deutlich voneinander unterscheiden.

Obige Faktoren gehen in die Entscheidung ein, in welchem Format ein Webseiteninhalt in DEVONthink abgelegt werden soll. Hier eine übergeordnete Vorgabe zu machen, wäre nicht zielführend, denn, was dem einen wichtig ist, kann für den nächsten völlig bedeutungslos sein. Du musst also selbst eine Entscheidung treffen und diese Entscheidung wird dann auch nicht für jeden Inhalt passen, sondern immer wieder neu getroffen werden müssen.


Welche Formate bietet der Webclipper?

Du kannst Webinhalte über den Webclipper in folgenden Formaten speichern:


TXT- bzw. RTF-Format

Dieses Format reduziert die Sicherung des Inhaltes auf die Textinformation bzw. beim RTF-Format werden ergänzend Bilddateien mit eingebunden.

Das Dateiformat ist systemübergreifend nutzbar.


Lesezeichen

Dieses Format sichert die jeweilige URL als Lesezeichen. Mit diesem Format lassen sich in einfachster Weise auch komplexe Bookmark-Verwaltungen erstellen.

Der Vorteil einer Lesezeichenverwaltung mit DT liegt darin, dass du an keinen bestimmten Browser gebunden bist und dass du deine Lesezeichen mit Metainformationen und Notizen versehen kannst.

Das Dateiformat ist systemübergreifend nutzbar.


Markdown-Format

Dieses Format sichert ebenfalls nur den Textinhalt, bereitet diesen aber im Markdown-Format auf, was eine programm- und systemübergreifende Weiterbearbeitung erleichtert. Die erstellten Dokumente sind sehr klein, da sie nur aus Text bestehen - Bilder werden extern nachgeladen (es kann also sein, dass das Dokument nach einiger Zeit keine Bildinhalte mehr ausgibt weil sich die Pfade zu den Bildern geändert haben - siehe oben).

Für das Markdown-Format kannst du eine „aufgeräumte“ Ansicht aktivieren - dadurch wird der gespeicherte Inhalt weitgehend auf den Textinhalt reduziert und von diversem Ballast befreit (im Einzelfall ist Nacharbeit nötig).


Webarchiv

Dieses Format sichert die komplette Seite incl. aller Bilder - die Bilder sind (im Regelfall) eingebettet, daher ist die Größe des Dokuments umfangreicher als bei Markdown; Webarchive können aktualisiert werden:

Für das Webarchive-Format kannst du ebenfalls eine „aufgeräumte“ Ansicht aktivieren - dadurch wird der gespeicherte Inhalt weitgehend auf den Textinhalt reduziert und von diversem Ballast befreit (im Einzelfall ist Nacharbeit nötig).

Das Webarchive-Format ist ein proprietären Apple-Format. Das solltest du beachten, wenn du systemübergreifend arbeitest.


HTML-Seite

Dieses Format sichert die Seite ohne Bilder (diese werden zwar angezeigt, müssen aber nachgeladen werden und sind daher bei Offline-Nutzung nicht anzeigbar - siehe oben).


Formatierte Notiz

Auch dieses Format sichert die komplette Seite incl. aller Bilder im HTML-Format - die Bilder sind hier jedoch eingebettet, daher ist die Größe des Dokuments umfangreicher als bei Markdown; formatierte Notizen können nicht aktualisiert werden, aber editiert werden. Die formatierte Notiz kannst du allerdings so gut wie nicht sinnvoll außerhalb von DEVONthink nutzen, denn der eigentliche Sinn ist die unkomplizierte Bearbeitbarkeit innerhalb von DEVONthink, die aber außerhalb von DEVONthink nicht mehr gegeben ist.

Auch für die formatierte Notiz kannst du eine „aufgeräumte“ Ansicht aktivieren - dadurch wird der gespeicherte Inhalt weitgehend auf den Textinhalt reduziert und von diversem Ballast befreit (theoretisch ist Nacharbeit möglich, aber sehr kompliziert und somit kaum sinnvoll).

Auch hier Bildinhalte werden zu einem Großteil in die gesicherte Datei geschrieben, ganz sicher ist das aber nicht in jedem Fall.

Die formatierte Notiz ist ein DEVONthink-eigenes Format, das du aber auch außerhalb von DEVONthink per Browserdarstellung nutzen kannst.


PDF

Sichert die Seite als PDF-Datei in einer einzelnen Seite oder als paginiertes PDF, d.h. die Seite erscheint als ein auf Einzelseiten aufgeteiltes PDF (ähnlich wie bei einer Sicherung der Seite über den Druckdialog).

Die Seite wird, abhängig von der jeweiligen Druckdarstellung, die von der Webseite vorgegeben wird, gespeichert. Das kann, muss aber nicht dem entsprechen, was du gesehen hast. In jedem Fall werden hier aber die Bildinhalte mitgenommen.

Auch hier kannst du eine „aufgeräumte“ Ansicht aktivieren - dadurch wird der gespeicherte Inhalt (in einer nicht ganz vorhersehbaren Weise) reduziert und von diversem Ballast befreit. Nacharbeit wie z.B. bei Webarchive ist hier nicht mehr möglich.


Möglichkeiten außerhalb des Webclippers

Downloadmanager

Mit dem Downloadmanager (nur ab Pro-Version) lassen sich komplette Webseiten herunterladen und in einer DEVONthink-Datenbank speichern. Das gibt es auch in einigen Browsern, das Tool von DEVONthink geht aber weit über die Möglichkeiten einiger Browser hinaus, die teilweise ebenfalls eine Art Downloadmanager mitbringen Möglichkeiten hinaus. Im Downloadmanager gibt es mehrere Möglichkeiten, die ich vielleicht in einem anderen Artikel beschrieben werde.

Ein dem Downloadmanager vergleichbares Hilfsmittel kenne ich allenfalls aus speziellen Download- Programmen.


Screenshots

Wenn du ganz sicher gehen willst, dass das gespeichert wird, was du gesehen hast, kannst du Screenshots der jeweiligen Seite machen. Das geht zwar nicht über den Webclipper, aber durchaus über eine Sorter-Funktion. Der Inhalt wird dann als Bilddatei gespeichert und um diesen dann maschinenlesbar und damit in sinnvoller Weise in DEVONthink nutzbar zu machen, kannst du die OCR-Funktion (ab DEVONthink Pro) nutzen - ansonsten bleibt es halt eine reine Bilddatei.

Sinn macht diese Speichermethode bei rechtlich relevanten Inhalten, ggfs. als Ergänzung zu den oben beschriebenen Methoden.


Fazit

Welches dieser Formate für dich infrage kommt, hängt von deinen individuellen Zielsetzungen ab. Ich selbst bevorzuge das Markdown- oder ersatzweise Webarchiv-Format, das PDF-Format bleibt Einzelfällen vorbehalten, d.h. für Fälle bei denen ich die Seite weitgehend so gespeichert haben möchte, wie ich sie gesehen habe. Diese Vorgehensweisen sind aber eine individuelle Angelegenheit und nicht allgemein übertragbar.

Etwas problematisch können Seiten sein, bei denen du erst Zugangsdaten eingeben musst oder Seiten, bei denen sich irgendwelche Fenster („abonniere meinen Newsletter“ etc) drüber schiebe

Grundsätzlich gibt es keine durchgehend für alle Bedürfnisse passende Lösung, du wirst experimentieren müssen und schauen, was zu deinem Bedarf und zu deinen Anforderungen passt. Mitunter macht es auch Sinn, gefundene Informationen in mehreren Formaten abzuspeichern

Bildquelle: Pexels