Die blinde Bestie (ARTE) links for 2007-04-27

PDF-Chaos

leerer Metadatensatz

Etwa einmal im Monat findet bei mir der große PDF-Kehraus statt und jedesmal bin ich am Verzweifeln.

Es ist ja eine sehr erfreuliche Entwicklung, dass immer mehr Wissenschaftler dazu übergehen, einen Teil ihrer Publikationen frei online zur Verfügung zu stellen. Im Zuge des Open Access-Gedanken und der CC-Lizenzen sind inzwischen viele qualitativ hochwertige Werke frei erhältlich, die in den Tiefen des Netzes schlummern und von fleißigen Bloggern in einem lecker medialen Potpourri geborgen werden. (Hat sich diesbezüglich schon mal jemand über die Gatekeeper-Funktion von Bloggern Gedanken gemacht?)

Das große Ärgernis ist aber die Unfähigkeit Sorglosigkeit, mit der die Autoren die Metadaten ihrer PDF-Files pflegen.

Ich sitze dann einmal im Monat dran, einen Ordner mit kryptisch benannten PDFs (man kann schon froh sein, wenn der Dateiname Hinweise auf den Inhalt des Dokumentes zulässt) zu sichten und die Metadaten langwierig selbst auszufüllen. Im besten Fall. Im üblichen Fall verschwindet die Datei fhrst754_gh.pdf in den unerforschten Weiten meiner Festplatte.

Selbst Wissenschaftler, die zu Online-Themen forschen, ignorieren meist die Möglichkeit der Metadaten im PDF-Format.

Jan Schmidt zum Beispiel, der Weblog-Forschung betreibt und dem ich enorm dankbar dafür bin, dass er so viele seiner Ergebnisse und Vorträge frei zur Verfügung stellt, benennt zwar die Dateien halbwegs assoziativ und gibt sogar auf den Downloadseiten die akademische Zitationsweise an, in den PDFs selbst aber: nada!

Dabei ist es doch im eigenen Interesse der Autoren, wenn die Datei, die sich nach Publikation ja sonst wie verbreiten kann, wenigstens die Download-URL in den Metadaten enthält.
Worst case scenario: Du willst ein Dir vorliegendes PDF zitieren und findest die Quelle nicht mehr!

Mein Verdacht: Es wird noch immer davon ausgegangen, dass ein geladenes PDF sofort "in den Druck" gegeben wird.

Das eigentlich Überraschende: Es gibt kaum Tools um Meta-Daten in PDFs komfortabel zu bearbeiten.

Einzig der PDF Explorer  scheint sich mir in richtige Richtung zu bewegen: Eine Explorer-ähnliche Oberfläche erlaubt das sofortige Editieren der Metadaten, ist aber bei einer großen Anzahl von PDFs doch recht umständlich zu bedienen.

Adobe bietet mit Adobe Bridge seit kurzem eine ähnliche Lösung; Bridge dient aber eher der Organisation sämtlicher in der Creative Suite erstellten Daten und ist deshalb für die gewünschten Zwecke völlig überzüchtet und für den Privatanwender eh nicht bezahlbar, da das Modul nur mit der kompletten Creative Suite bezogen werden kann.

Obwohl ich das Problem am Beispiel von wissenschaftlichen Publikationen aufgezeigt habe, dürften aber auch die Leser, die nur aus privaten Gründen mit PDFs zu tun haben, die Situation kennen.

Deshalb meine Frage an Euch: Wie organisiert Ihr Euer PDF-Archiv?

Eine Google-Recherche zu dieser Problematik erbrachte (neben erstaunlich wenigen relevanten Treffern) noch die Nutzung einer Desktop-Suchmaschine, wie z.B. Google Desktop. Diese Tools scannen auch die Inhalte von PDFs, erlauben also die Festplatten-übergreifende Suche nach Inhalten in PDFs. Halte ich aber aus zwei Gründen für wenig praktikabel:
Erstens will der Kram auch mal weggebrannt werden (Ja, da gibts auch Lösungen; dann wirds aber wirklich umständlich…) und zweitens bin ich oftmals gar nicht auf der Suche nach konkreten Inhalten, sondern will mich von Texten erstmal inspirieren lassen - von denen ich gar nicht mehr weiß, dass Sie auf meiner Platte liegen…

Um Hilfe und Ideen wird gebeten.
netbib - übernehmen Sie!



27. April 2007 um 11:48 Uhr von symyp

Eingetragen unter: Literatur, Text, Software

3 Kommentare kommentieren

  • 1. Jan Schmidt  |  2. May 2007 um 16:19

    Das sind gute Anmerkungen; ich organisiere meine .pdfs kaum, bzw. ich speichere sie im Moment mit dem Namen des Autoren in einem Verzeichnis…
    Die Hinweise zu den Metadaten werde ich aber beherzigen; mal schauen, ob ich demnächst dazu komme, zumindest die Fonk-Paper entsprechend “nachzurüsten”.

  • 2. DonnaLeona  |  12. August 2007 um 4:50

    Frage: Wie organisiert Ihr Euer PDF-Archiv?
    Antwort: Ganz einfach: Durch numerieren
    Dateien haben eine lfd. Numerierung, die in einer passenden “Datenbank” als Bezug stehen. Diese “Datenbank” kann auch eine einfache ASCII Datei sein - deshalb die Anführungszeichen.

  • 3. MAXimator  |  7. September 2007 um 6:41

    ich kategorisiere mit passenden ordnernamen & unterordnern.

Kommentieren

benötigt

benötigt,
wird nicht angezeigt

erlaubte HTML-Tags:
<a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <div align=""> <em> <font color="" size="" face=""> <i> <li> <ol> <strike> <strong> <sub> <sup> <ul>

Trackback this post  |  Subscribe to the comments via RSS Feed


Kategorien

TV-Tips

Links

Neueste Einträge

letzte Kommentare

Archiv

Meta





Wir sind die Kunden!