Text Mining in Literaturdatenbanken: Entwicklung eines computer-basierten Werkzeugs zur Informations-Extraktion und Hypothesengenerierung für die biomedizinische Forschung
Das geplante Vorhaben soll ein über die übliche Form der Informationsgewinnung aus biomedizinischen Literaturdatenbanken (Recherche - Download - sequentielles Durcharbeiten der Dokumente) hinausgehendes advanced information retrieval ermöglichen, das eine - teils automatisierte, teils interaktive - Informations-Extraktion beinhaltet, auf deren Grundlage neue Forschungshypothesen aufgestellt werden können. Aufbauend auf dem von Don Swanson entwickelten CBD (Complementary But Disjoint) - Literaturkonzept soll in dem geplanten Vorhaben ein Computer-basiertes Werkzeug entwickelt werden, mit dem sich zueinander disparate (keine gemeinsamen Dokumente enthaltende) Literatursets bzw. die sie repräsentierenden thematischen Begriffe sowie intermediäre (sinnvolle Verbindungen zwischen den unverbundenen, aber ggf. komplementären Literaturmengen herstellende) Konzepte auffinden lassen. Die so entdeckten Beziehungen zwischen Literaturen, Konzepten und Begriffen sollen helfen, auf der Grundlage von Recherchen in Literaturdatenbanken "neue" (bisher nicht publizierte) Hypothesen aufzustellen bzw. auf ihre Plausibilität zu überprüfen.

Laufzeit: November 2003 - Oktober 2005      

Projektort: Berlin

Beteiligte Institutionen

Förderinstitution

Förderprogramm