Benutzer:Mathias Schindler/dpa

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Ein Verkaufsargument des Brockhaus Multimedial aus dem Hause BIFAB ist der Online-Zugriff auf "2 Millionen" Bilder der deutschen Presseagentur dpa.

Zu jedem Artikel assoziiert ist ein Hyperlink auf die "dpa-Bilddatenbank". Eine freie Suche ist nicht möglich (meines Wissens).

Die Hyperlinks gehen auf die Domain www.brockhaus-multimedial.de

URL[Bearbeiten | Quelltext bearbeiten]

Eine solche klassische URL ist beispielsweise

http://www.brockhaus-multimedial.de/cgi-bin/dpalink/dpacopy.pl?necessary=Wikipedia&optional=Wikipedia-projekt+Dvd-ausgabe+Wikipedia-text+Handelsversion+Wikis+Internetprojekt+Wiki+%DCberarbeiten+Internetnutzer+%DCberarbeitung&theme=0&OS=Windows&t=3298412&product=bmm2005&lock=917230

segmentiert sieht das dann so aus:

http://www.brockhaus-multimedial.de

Host, Domain und Top-Level-Domain

/cgi-bin/dpalink/

Verzeichnis der Inhalte

dpacopy.pl

Dateiname des Perl-Skriptes, das für die Bereitstellung der Treffer veantwortlich ist

?

Ab hier beginnen die Variablen

necessary=Wikipedia

Dies scheint der Haupt-Terminus (identisch zum Artikellemma) zu sein.

&

Trennzeichen für Variablen

optional=Wikipedia-projekt

Optionale Suchbegriffe, die offenbar aus dem Artikeltext stammen. Interessant ist hier, daß auch Begriffe auftauchen, die in alten Versionen standen und zwischenzeitlich entfernt wurden. Diese Liste könnte also beispielsweise separat in den Metadaten des BMM liegen und bei Erstellung (semi-manuell) gepflegt werden. Das ist Spekulation.

+Dvd-ausgabe
+Wikipedia-text
+Handelsversion
+Wikis
+Internetprojekt
+Wiki
+%DCberarbeiten

Sonderzeichen werden encodiert wie üblich.

+Internetnutzer
+%DCberarbeitung
&theme=0
&OS=Windows

Vermutlich das Betriebssystem des Benutzers.

&t=3298412

Das hier könnte ein Timestamp sein, der das Ablaufen der Freigabe dieser URL regelt.

&product=bmm2005

Es könnte ein Produktname sein. In diesem Fall hat jemand die Änderung nicht nachgetragen oder man ist dort ehrlich, was das Erscheinungsdatum angeht.

&lock=917230

Das könnte eine Prüfziffer sein, die die Verwendung handgeschriebener URLs verweigern soll.

Variablen[Bearbeiten | Quelltext bearbeiten]

Wenn keine Artikel im ersten Anlauf gefunden werden, bietet die Website zusätzliche Suchoptionen an.

  1. Reine Stichwortsuche
  2. Stichworte und Powerwebbegriffe
  3. Stichworte und Themengebiet
&method=N&lock=807549
&method=NO&lock=873030
&method=NT&lock=881215

Die einzigen Variablen, die sich ändern, sind die Prüfziffer lock und method. N Stichwort O "Powerwebbegriffe" und T für Themengebiet.

Einzelbildansichten werden wie folgt übergeben:

bigview=237656305&set=1&lock=843564

Das konkrete Bild dazu liegt unter

?picloc=/report/lgt//dpa/j2006/m01/t20/032901_4.jff&lock=205118

lock ändert sich hier übrigens auch mit anderen getesteten Bildern nicht.

picloc=/report/lgt//dpa/j2005/m08/t08/048501_5.jff&lock=205118
picloc=/report/lgt//dpa/j2005/m08/t05/063201_5.jff&lock=205118

Fügt man ein "theme=0" hinzu, wird der Zugang verweigert.

Einen Zusammenhang zwischen Bigview und dem Dateinamen konnte ich noch nicht finden.

j2005 dürfte das Jahr sein, m08 der Monat und t der Tag.

Das Datum bezieht sich offenbar auf den Moment der Archivierung/Zugänglichmachung, nicht auf den Tag der Erstellung wie bei diesem Schwarzweiss-Bild aus dem letzten Jahrtausend:

dpacopy.pl?picloc=/report/lgt//dpa/j2005/m08/t09/084201_4.jff&lock=205118

Bei älteren Bildern ist eine andere Verzeichnisstruktur sichtbar, bei der sich offenbar auch die Prüfsumme wieder ändert:

dpacopy.pl?picloc=/dpaba/src//ba/j2002/m06/t19/009101_4.jff&lock=219851
dpacopy.pl?picloc=/dpaba/src//ba/j2002/m11/t28/001101_4.jff&lock=219851
dpaba = dpa-Bildarchiv
src = üblicherweise source
ba = Bildarchiv

Eine wilde Theorie ist nun, daß für die Berechnung der Prüfsumme Zahlen keine Rolle spielen, sondern vermutlich Buchstaben und ihre Position.