Information Retrieval Facility

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
IRF logo

Das Information Retrieval Facility (kurz IRF) war eine Forschungsplattform und diente der Zusammenarbeit von Experten im Bereich der Information Retrieval (IR). Es wurde 2006 gegründet und hatte seinen Sitz in Wien. Das IRF war das weltweit erste E-Science-System, das ausschließlich der semantischen Verarbeitung von Text gewidmet war. Zu den Mitarbeitern zählten Experten, Forscher und Studenten in den Bereichen Information Retrieval und Informationsmanagement. Das IRF hat 2012 seine Aktivitäten eingestellt.

Ziele[Bearbeiten]

Dieser Artikel oder Abschnitt besteht hauptsächlich aus Listen, an deren Stelle besser Fließtext stehen sollte. Bitte hilf Wikipedia, das zu verbessern. Mehr zum Thema ist hier zu finden.

Die wissenschaftlichen Ziele von Information Retrieval Facility sind:

  • Modellierung innovativer und fachbezogener Information-Retrieval-Systeme für globale Patentdokumentsammlungen.
  • Die Erforschung und Entwicklung einer adäquaten technischen Infrastruktur, die interaktive Experimente mit formalen und mathematischen Retrieval-Konzepten für sehr große Dokumentsammlungen ermöglicht.
  • Die Untersuchung der Usability von multimodalen User-Interfaces groß angelegter Information-Retrieval-Systeme
  • Integration von Usern und deren Bedürfnissen in den Prozess der Modellierung von Information-Retrieval-Systemen um eine genaue Leistungsbewertung zu ermöglichen.
  • die Möglichkeit unterschiedliche Ansichten von Patentdaten in Abhängigkeit von deren Fokus zu gewährleisten.
  • Definition standardisierter Methoden für die Bewertung der Information-Retrieval-Prozesse in den Patentschriftkollektionen
  • die Fähigkeit Text- und Nicht-Text-Anteile eines Patents in einer kohärenten Weise in den Griff zu bekommen.
  • das Entwerfen, die Erprobung und Bewertung von Suchmaschinen die es ermöglichen strukturierte und semi-strukturierte Dokumente in sehr großen Patent-Sammlungen zu finden.
  • Die Integration der zeitlichen Dimension von Patentdokumenten in Retrieval-Strategien.
  • Die Verbesserung der Effizienz und Präzision von Patent-Retrieval basierend auf Ontologien und verschiedenen Sprach-Techniken.
  • Verbesserte IR-Methoden mit denen die Nutzung unstrukturierter Abfragen innerhalb eines Patentdokuments möglich wird.
  • Formale (mathematische) Identifikation und Spezifikation von Business-relevanten Informationen im Bereich der Intellectual Property
  • Erforschung von effizienten Skalierungsmechanismen im Information-Retrieval Bereich unter Berücksichtigung der Merkmale von Patentdaten
  • Die Ermittlung und das Experimentieren mit Computing-Architekturen für sehr hohes Kapazität-Informations-Management
  • Die Schaffung einer offene E-Science-Plattform die auf eine einheitliche und einfache Weise die Erstellung und Durchführung von IR-Experimenten auf einer gemeinsamen Forschungsinfrastruktur ermöglicht.
  • Die Entdeckung und Erforschung neuartiger Anwendungszwecke und Business-Anwendungen, die sich aus Informationen der Intellectual Property ergeben.
  • Aktivieren der formalen Information Retrieval, Sprachen und semantische Verarbeitungen in den Bereich der angewandten Wissenschaften, in der globalen, industriellen Kontext zu bringen.
  • Entwicklung und Integration von verschiedenen Informations-Zugriffsmethoden Forschung über effektive Methoden für die interaktive Information-Retrieval.

Semantic Supercomputing[Bearbeiten]

Aktuelle Technologien zur Extraktion von Konzepten aus unstrukturierten Dokumenten sind mit intensiver Rechenleistung verbunden. Um das interaktive Experimentieren mit großen Text-Korpora zu ermöglichen, besitzt das IRF eine High-Performance-Computing (HPC)-Umgebung für performantes Text Mining. Diese ist mit den neuesten Technologien ausgestattet:

  • Multi-Node Cluster (gegenwärtig 80 Core, bis zu 1024)
  • Höchstgeschwindigkeits-Interconnect Technologie
  • Single System Image mit großem Compound Memory (gegenwärtig 320 GB, bis zu 4 TB)
  • voll integriertes konfigurierbares Computing (gegenwärtig 4 FPGA Core, bis zu 256)

Welt Patent Corpus[Bearbeiten]

Die Zielsetzung des IRF ist mit modernen Information-Retrieval-Technologien eine Plattform für Patent-Experten zu schaffen. Es wird erwartet, dass die Information Retrieval (IR)-Technologien in den Mittelpunkt der Informationstechnologie treten werden.

Die Gesamtheit aller Patent-Dokumente stellt einen gewaltigen Textkorpus dar. Patente haben sich zu einem entscheidenden Thema insbesondere für globale Unternehmen und Universitäten entwickelt. Die industriellen Anwender von Patentdaten gehören zu den anspruchsvollsten und wichtigsten Informationsprofis überhaupt. Diese Zielgruppen werden am meisten von einer Technologie profitieren, die ihnen bei der Erforschung großer Datenmengen hilft.

Weblinks[Bearbeiten]

Referenzen[Bearbeiten]