— Netzwerk des Wissens —
Ordnung, Entwicklung und Entdeckung
Rechercheinstrumente sind Schnittstellen um Zugang zur abstrakten Ordnung des Wissens zu erhalten.
Ordnung ist jene Grundlage, nach der Informationen abgelegt werden, um sie überhaupt wieder aufzufinden.
»Bibliotheca Universalis Project« befasst sich mit der Konzeption von Rechercheportalen mittels Suchmaschinen-Technologien auf Basis von Metadaten.
Im Lichte des historischen Kontextes wird deutlich, warum die Funktionalitäten eines Kataloges und die einer Suchmaschine in ihrer abstrakten Betrachtungsweise völlig unterschiedlich gelagert sind. In der Realität ergeben sich allerdings Überschneidungen, weshalb die Differenzierung oft schwerfällt.
Der Katalog dient dem Anspruch nach Zuverlässigkeit und Gesamtheit. Die Einträge werden nach genau festgelegten Regeln vorgenommen und folgen üblicherweise einer sequentiellen Reihenfolge. Online-Kataloge durchbrechen diese, da jeder beliebige Einstiegspunkt möglich ist. Wie die Haupteintragung bzw. die bevorzugte Form gebildet wird, ergibt sich aus den Katalogisierungsvorschriften, die auch laufend angepasst wurden. Auf Basis der einzelnen Katalogeinträge kann ein Verzeichnis (z.B. Bibliographie) ausgegeben werden. Jeder Eintrag besitzt dort seine regelgemäße alphabetische Einordnung (z.B. unter Sachtitel, Person oder Körperschaft). Der gewünschte Eintrag ist dann auch nur dort zu finden, es sei denn, es wurden zusätzliche Nebeneintragungen gebildet. Online-Kataloge beinhalten schließlich diese Katalogeinträge (Metadaten) auf deren Grundlage die Indexeinträge zu einem Datenbestand erfolgen.
Suchmaschinen entfalten ihre Stärken im Zusammenhang mit Volltextinformationen. Die Algorithmen sind besonders dahingehend optimiert, aus unstrukturierten Texten relevante Treffermengen zu generieren. Die Trefferliste ist zwar nach Relevanz (Rankingwert) sortiert, es besteht jedoch keine Gewissheit darüber, dass die gewünschten Treffer auch wirklich in den ersten 10 genannten Ergebnissen enthalten sind. Gegebenenfalls muss die Trefferliste durchgeblättert werden, was bei einer hohen Trefferanzahl recht unerfreulich ist. Die Zuverlässigkeit steigt mit der Leistungsfähigkeit und Genauigkeit des Algorithmus. Dafür sind allerdings komplexe semantische Technologien und künstliche Intelligenz erforderlich. Die Herausforderung dabei ist sicher, sinnvolle Verknüpfungen der Daten nach inhaltlicher Relevanz zu erhalten und nicht Daten-Korrelationen zu verfestigen. In der ausgeklügelten Umsetzung dieser Technologien liegt auch der Erfolg von Google begründet. Seit der Gründung entwickelt Google seinen Algorithmus laufend weiter, wobei qualitative Inhalte deutlich höher gerankt und manipulierte Seiten herabgestuft werden.
Bibliotheca universalis war die erste wirklich umfassende »universelle« Auflistung aller Bücher des ersten Jahrhunderts des Druckens. Es war eine alphabetische Bibliographie, in der alle bekannten Bücher aufgelistet wurden, die in Latein, Griechisch oder Hebräisch gedruckt wurden.
Der historische Kontext zur »Bibliotheca universalis«, weckt bei diesem ambitionierten Projekttitel womöglich die Erwartung, dass die Ausführungen eine grundsätzliche Betrachtung der Thematik des Bibliothekswesens zum Ziel haben mögen. Stattdessen verweist er lediglich auf den Wunsch nach der Erfüllung eines einst lang ersehnten Traumes von einer allumfassenden Ordnung des Wissens. Dieser Traum lebt auch heute noch weiter, wenn auch in modifizierter Form und getragen von neuen Gedanken wie der Demokratisierung des Wissens oder dem Wunsch nach Zugänglichkeit von relevanter Information von jedem Ort der Welt aus.
Aus dem Anliegen nach Ordnung und Vollständigkeit ist mitunter das ganz natürliche Bedürfnis nach leicht zugänglicher und verlässlicher Information geworden. Ganz in diesem Bestreben, den Zugang zu den Medien und digitalen Ressourcen zu erleichtern, sind im Bibliothekswesen viele Digitalisierungsprojekte realisiert worden, um besonders auch historische Bestände schnell überall verfügbar zu machen, wenn möglich auch im Volltext (Volldigitalisate).
Die Frage nach der Vollständigkeit der Quellen tritt immer mehr in den Hintergrund, weil die schnellere Zugänglichkeit digitaler Dokumente bei der Recherche eine gewichtige Rolle in Bezug auf die aufzuwendende Zeit spielt. Die Verfügbarkeit als Volltext wird daher auch als das maßgebliche Projektziel von Digitalisierungsvorhaben angesehen. Die Metadaten zu diesen Beständen sind entweder maschinell ermittelt oder stammen aus intellektueller Quelle unterschiedlicher Qualitätsstufen.
Erst die logische Anordnung der Bücher, und damit die Auffindbarkeit eines Buches, erkannte [Gabriel] Naudé, mache die Bibliothek aus.
Das erklärte Ziel von »Bibliotheca Universalis Project« ist es, die Evolution des Weges vom Katalog zur Suchmaschine zu untersuchen und die Anforderungen für das UI- und UX-Design bibliothekarischer Recherchesysteme anhand von prototypischen Suchmaschinen-Implementierungen zu evaluieren. Bibliotheken nutzen Online-Kataloge sowie Suchmaschinen für die Recherche in den Bestandsgruppen oder haben früher eingesetzte Kataloge durch Suchmaschinen ersetzt. Beide Instrumente bauen auf den hoch qualitativen bibliografischen Metadaten als Datenquelle auf.
Der Weg Richtung Suchmaschine deutet nicht auf einen Verzicht von Struktur und Ordnung hin, sondern kann als Reduktion von Komplexität verstanden werden. Der Katalog wird immer eine Domäne der Bibliotheken bleiben. Die Suchmaschine bringt jedoch viele Vorteile für den Recherchierenden, da sie Volltext und strukturierte Informationen gleichermaßen erschließen kann.
Ein Katalog ohne Struktur wäre völlig nutzlos. Angewandt auf elektronische Informationen, lässt sich schlussfolgern, dass auch diese eine abstrakte übergeordnete Struktur benötigen, selbst wenn Suchmaschinen auch mit Strukturlosigkeit umgehen können. Anders ausgedrückt: Struktur ist Information. Auch Volltext ist streng gesehen nicht strukturlos, sondern besitzt eine Syntax, aus der sich die Semantik ableiten lässt. Metadaten dienen zur noch besseren Einordnung des Textes in seiner Gesamtheit.
Zurzeit hat die/der Recherchierende noch die Wahl zwischen der »Einfachen Suche« und der »Expertensuche/Erweiterten Suche«. Die Begründung für diese Unterscheidung ist: die »Einfache Suche« ermöglicht keine Differenzierung nach Feldern bzw. Kategorien und auch keine Anwendung logischer Operatoren. Die Differenzierungen in den Metadaten werden bei der Eingabe nicht vollends ausgenutzt – zumindest aber bei der Anzeige der Treffermenge in der Filterfunktion. Somit wird in diesem Modus erstmals in allen Feldern gesucht, was naturgemäß zu höheren Trefferzahlen führt – vergleichbar mit einer Volltextsuche.
»Bibliotheca Universalis Project« beschäftigt sich mit Suchmaschinen-Implementierungen sowie UI- und UX- Designkonzepten zur Nutzung in Rechercheplattformen, Site-Suchmaschinen, Bestandspräsentationen digitaler Objekte und Ressourcen, Online-Shops usw. Da alle Services über REST kommunizieren, stellt sich auch die Frage, inwieweit diese Design-Prototypen Anregungen für das Design verteilter Systemarchitekturen geben können (z.B. dislozierte digitale Bestandsgruppen, heterogene Datenbestände).
»Bibliotheca Universalis Project« will sich der Herausforderung stellen, eine Schnittstelle zwischen den zahlreichen bestehenden heterogenen Systemen und Präsentationen im Bibliotheksbereich zu sein. Dies wird in der Realität zwar immer zu einem Kompromiss führen, kann sich im realen Umfeld der Recherche aber als völlig ausreichend und praktikabel herausstellen.
Dieses User Interface ist das Herzstück des Projektes. Keywords werden über Autocomplete vorgeschlagen und können kategorisiert werden. Das sind Attribute zum Suchbegriff, wie Feldzuweisung oder boolsche Operatoren. Gibt es keine Zuweisung zu einem gewissen Feld (Datentyp), wird der Begriff in allen Feldern gesucht.
Dieses UI-Konzept dient der Präsentation grundlegender Funktionalitäten und soll als Fullscreen-Applikation verstanden werden. Eine sinnvolle Anwendung wäre ein öffentlicher Terminal.
(Die Suche wird nicht ausgeführt. Zur Kontrolle der Eingaben werden die Suchparameter ausgegeben.)
Das Wesen einer Bibliothek ist nicht, dass sie gedrucktes Papier versammeln, das Wesen der Bibliothek ist die Ordnung […]
Die Pinakes des Kallimachos gelten bibliotheksgeschichtlich als erster umfassender Bibliothekskatalog der Antike. Dieses bibliographische Werk, war selbst nicht Teil der Schriftensammlung, und wurde von Kallimachos von Kyrene zum Zweck der Verwaltung der umfangreichen Schriftensammlung der antiken Bibliotheca Alexandrina verfasst. Es handelte sich um einfache Bestandsverzeichnisse oder Listen um eine abstrakte Ordnungsstruktur aufzubauen.
Bibliotheken folgen seither, einer ebenso langandauernden wie traditionsreichen Aufgabe der Katalogisierung und Erschließung des ihnen anvertrauten Schriftkulturgutes. Das bibliografische Verzeichnis (sprich: der Katalog) wird zu einem übergeordneten Instrumentarium, um Zugang zur gewünschten Information zu gewährleisten. Das beschriebene Objekt selbst ist nach wie vor an einen Standort gebunden, sofern es in seiner gegenständlichen Form nicht anders verfügbar ist – eben z.B. als Buch oder allgemein in Gestalt eines analogen Datenträgers.
Im Zusammenhang mit der Thematik des Zuganges zu Wissen und Information, muss man sich auch mit deren Quelle befassen. Das Buch (der Kodex) hat Tonscherben, Schriftrollen oder andere Medienformen der Vergangenheit verdrängt und ist zum modernen Träger des säkularen Wissens geworden. Im Informationszeitalter ist die Information eher als Produkt unterschiedlicher medialer Kanäle oder Quellen zu verstehen – jetzt eben auch in dessen digitaler Form als elektronischer Text, als Hypertextinformation im Internet sowie als Ergebnis maschineller Verarbeitung von Daten mittels Algorithmen oder als generierte Information durch den Einsatz von künstlicher Intelligenz. Das digitale Zeitalter bringt neue Herausforderungen und Chancen, wie Information erstellt, charakterisiert, verstanden und wieder aufgefunden wird.
Eine substanzielle Universalbibliothek, die das gesamte publizierte Wissen an einem Ort versammelt, kann schon alleine auf Grund ihrer natürlichen Beschränkungen von Raum und Zeit nicht dauerhaft existieren. Obwohl in der Antike ein bedeutender Versuch unternommen wurde, so eine Bibliothek in Alexandria aufzubauen, scheiterte das Vorhaben letztendlich. Große Anstrengungen waren dazu erforderlich und umfangreiche Mittel mussten bereitgestellt werden, um die physischen Schriften (Großteiles in Form von Papyrusrollen) zu sammeln, zu ordnen und zu verwalten. Zuletzt fiel der Bibliotheksbestand einem großen Brand zum Opfer.
Um die Grundlagen der Prinzipien der Ordnung des Wissens zu beschreiben, müsste man eine Rückblende in die Anfänge der Geschichte der Wissenschaften unternehmen. Das fortschreitende Verständnis über den Aufbau unserer Welt bewirkte auch einen Wandel in der Strukturierung der anfangs noch als getrennt betrachteten Disziplinen. Zu Beginn der großen Bibliotheksgründungen folgte man dem Ideal der Ordnung nach den damals bekannten überschaubaren Wissenschaftsdisziplinen.
Diese Interpretation der geschlossenen Ordnung fand seine Entsprechung auch in der Strukturierung der Bibliothek nach barockem Vorbild. Die Büchersammlungen aus den unterschiedlichsten Disziplinen wurden zum Symbol für Reichtum und Macht. Die Bibliothek war das Tor zu den größten Schätzen der Weisheit und der Wissenschaft und wurde als solche architektonisch in barocker Manier prunkvoll inszeniert. Beim Betreten des Bibliothekssaales eröffnet sich dem staunenden Besucher ein »Sakralraum des Lesens und Denkens« (Zitat: siehe Quellen).
Spätestens mit der wachsenden Anzahl an Disziplinen wurde bewusst, dass eine Spezialisierung auf wenige Fachgebiete und auf das Sammeln der wesentlichen Veröffentlichungen erforderlich ist. Die Geschichte der Bibliotheken und Archive zeichnet ein lebendiges Bild der Entwicklungen auf dem Gebiet der Wissenschaften und der Medienlandschaft im Allgemeinen. Dieses Bild mag betitelt sein mit dem Satz: »Von der Unmöglichkeit der universellen Ordnung«.
In der Renaissance hat die anhaltende Buchproduktion den Bedarf an Dokumentation der zuvor nicht gekannten Flut an Druckwerken erforderlich gemacht. In dieser Absicht entstand die erste vollständige Bibliografie der damals nachweisbaren Publikationen unter dem Titel Bibliotheca universalis von Konrad Gesner. Wie der Titel bereits anklingen lässt, sollte damit ein Verzeichnis des aktuell publizierten Wissens im Sinne einer universellen aber dislozierten Bibliothek erstellt werden. Das buchstäbliche Gebäude der Universalbibliothek, vereint dieses Wissen, in Form von physischen Exemplaren, zu einem Ort der Bildung und Gelehrtheit.
Somit steht sie als materieller Informationsraum erhaben über dem reinen bibliografischen Nachweis, da all die versammelten Schriften auch der Erforschung offenstehen. Was dem Konzept nach durch einen physischen Bibliotheksbau nicht gelingt, nämlich die Gesamtheit des Wissens in einer komplexen Ordnungsstruktur darzustellen bzw. an einem Ort zu beherbergen, lässt sich mittels einer abstrakten, utopischen oder virtuellen Universalbibliothek schon eher realisieren.
Dank der Informationstechnologien von heute sind neue Möglichkeiten geschaffen worden, die verwahrten Druckwerke und Medien einer interessierten Öffentlichkeit, ganz im Sinne der Demokratisierung des Wissens, frei verfügbar zu machen – über das Internet. Dieses wird zuweilen auch als die neue Bibliotheca universalis gepriesen, da sich der Traum von der universellen Bibliothek, die das gesamte Wissen der Menschheit beherbergt, mittels eines virtuell geschaffenen Raumes zu realisieren scheint.
Eine Ansammlung von 30.000 Menschen ist noch keine Armee und eine Sammlung von 50.000 Büchern ist noch keine Bibliothek
Mit dem Internet entsteht ein dynamischer virtueller Informationsraum. Dieser Raum stellt zwar nicht das allumfassende Wissen der Welt im absoluten Sinne dar, aber einen zentralen Teil der neuzeitlichen Informationslandschaft. Warum das Internet streng genommen keine Universalbibliothek darstellen kann, erklärt sich durch die Tatsache einer fehlenden einheitlichen Ordnungsstruktur. Webinhalte sind nach wie vor sehr heterogen strukturiert. Bei fehlender semantischer Strukturierung sind Inhalte einer Website annähernd unstrukturiertem Volltext gleichzusetzen. Die Informationen sind eher willkürlich organisiert und es mangelt außerdem an Zuverlässigkeit und Beständigkeit. Mittels HTML 5 und der Initiative Semantik Web sollen die Webinhalte zukünftig deutlich besser strukturiert werden.
Die Magie bei der Suche nach Inhalten im Internet (Google), steckt daher im Einsatz von intelligenten Algorithmen, semantischen Technologien und Auswertungsmethoden, die in der Lage sind, Texten ohne intellektueller Vorleistung maschinell Bedeutung zuzuweisen um so einen Index zu generieren (index time), aus dem sich relevante Treffermengen ableiten lassen (search time).
Eine der herausragendsten Qualitäten bibliografischer Daten ist ihre Strukturiertheit. Bibliothekarische Katalogisierungsregeln sind insbesondere aus der Motivation entstanden, zu ordnen, zu katalogisieren, zu systematisieren und auch um eine Bestandskontrolle zu erhalten. Allerdings ist der Nachweis von Publikationen nur eine der vornehmlichen Aufgaben von Bibliotheken. Mittels dieses Nachweises gelingt es einem Recherchierenden zur gesuchten Information zu gelangen.
»Seit der Rezeption von Bildung und Wissenschaft der griechischen Antike in der römischen Literatur (ca. 200 v. Chr.) gibt es Versuche, das jeweils vorhandene Wissen der Menschheit in einer geordneten Gesamtdarstellung zu präsentieren. Eine solche universale Systematik wurde erstmals von den Humanisten um 1490 als Enzyklopädie bezeichnet. Die erste bekannte gedruckte Einteilung, die damit betitelt wurde, ist die Encyclopedia von Johannes Aventinus, die 1517 in Ingolstadt erschien.« (Zitat: siehe Quellen)
Neben dem reinen bibliografischen Nachweis, stellen Bibliotheken auch Normdaten zur Verfügung, die mit den bibliografischen Daten verknüpft werden. Mittels Normdaten ist eine bessere Unterscheidung bzw. Interpretation sowie Zuordnung der bibliografischen Beschreibung möglich. Z.B. können gleichlautende Namen aufgelöst werden und ein Trefferergebnis kann bei der Recherche einer spezifischen natürlichen Person zugeordnet werden. Die eindeutige Differenzierung der Daten ist das Ziel bibliothekarischer Arbeit. Diese Ordnungsstruktur führt zu einer tiefen Verknüpfung von Daten und ergibt letztendlich eine vernetzte Datenstruktur. Hochwertige bibliografische Daten setzen sich üblicherweise aus formalen und inhaltlichen Beschreibungen zusammen.
Durch die laufenden Verbesserungen und Verfeinerungen von bibliothekarischen Regelwerken, wird die Datenqualität immer hochwertiger. Die Entwicklung dieser Standards ist eine logische Konsequenz der über Jahrzehnte bestehenden Auseinandersetzung mit der Thematik bibliothekarischer Normierungstätigkeit. Die Ansprüche bibliothekarischer Arbeit finden ihre Entsprechung in dem Wunsch, eine allumfassende Ordnung des Wissens zu kreieren – eine moderne Form der Bibliotheca universalis. Demnach werden jegliche Elemente einer immateriellen Ordnungssystematik unterworfen. Diese Ambitionen haben ihren Ursprung in der Zeit, als die ersten Anstrengungen zur bibliografischen Dokumentation des publizierten Wissens unternommen wurden.
Somit bestätigt sich wieder einmal mehr, dass diese originäre Schöpfung im weitesten Sinne dem Ausdruck eines kollektiven geistigen Eigentums gleichkommt, das bereits Generationen bibliothekarischen Wirkens umfasst. Versucht man den Begriff »geistiges Eigentum« zu erfassen, kann man in diesem Zusammenhang nur darauf Bezug nehmen, dass diese Entwicklung zur allumfassenden Ordnung des Wissens auf den Arbeiten früherer Generationen aufbaut oder zumindest davon inspiriert oder beeinflusst ist.