Linguistically Motivated Ontology-Based Information Retrieval

  • When Tim Berners-Lee proposed his vision of the Semantic Web in 2001, he thought of machines that automatically execute specific tasks based on available knowledge. The knowledge should be captured within ontologies which provide an unambiguous and semantically rich way to capture information. The information could further be used to enhance tasks like information retrieval, i.e., the retrieval of documents which match specific criteria. Over a decade later, technologies which are required for the Semantic Web have been established in several areas, e.g., the biological and medical domains. Both share a very constant pool of knowledge, which does not change as rapidly as in other domains, i.e., neither a lot of new knowledge must be added continuously nor the existing knowledge has to be updated very often. These circumstances make both domains suitable for manually creating ontologies. However, in case of a domain with constantly incoming new knowledge, it would be a great advantageWhen Tim Berners-Lee proposed his vision of the Semantic Web in 2001, he thought of machines that automatically execute specific tasks based on available knowledge. The knowledge should be captured within ontologies which provide an unambiguous and semantically rich way to capture information. The information could further be used to enhance tasks like information retrieval, i.e., the retrieval of documents which match specific criteria. Over a decade later, technologies which are required for the Semantic Web have been established in several areas, e.g., the biological and medical domains. Both share a very constant pool of knowledge, which does not change as rapidly as in other domains, i.e., neither a lot of new knowledge must be added continuously nor the existing knowledge has to be updated very often. These circumstances make both domains suitable for manually creating ontologies. However, in case of a domain with constantly incoming new knowledge, it would be a great advantage if this knowledge could automatically be added or matched to an ontology. However, there is nearly no concept available on how ontological knowledge can be mapped to natural language precisely. We therefore developed the SE-DSNL approach. It provides experts with the ability to specify how ontological knowledge can be mapped to linguistic information of any known language. The concept provides a flexible and generic meta model which captures all the relevant information. In order to use this for parsing natural language text a prototypical implementation has been developed which takes the information of a SE-DSNL model and applies it to a given input text. The result is a semantic interpretation of the input text which maps its lexical and syntactic elements to the ontology. The direct integration of semantic and linguistic information further allows using the semantic information at runtime. This yields certain advantages which are demonstrated by treating elaborate linguistic phenomena like pronominal anaphora resolution, word sense disambiguation, vagueness and reference transfer. To show the validity of the approach it has been evaluated using scenarios and two case studies.show moreshow less
  • Als Tim Berners-Lee seine Vision des 'Semantic Web' 2001 vorstellte, dachte er an Maschinen, die, basierend auf vorhandenem Wissen, automatisch verschiedene Aufgaben erledigen können. Das Wissen sollte in Form von Ontologien vorliegen, welche einen eindeutigen und semantisch mächtigen Weg darstellen, Informationen zu erfassen. Weiterhin könnten diese Informationen für Anwendungen wie die Informationsrückgewinnung verwendet werden, d.h. das Auffinden von Dokumenten, die gewissen Kriterien entsprechen. Über ein Jahrzehnt später zeigen die Technologien des Semantic Web insbesondere in biologischen und medizinischen Bereichen ihre Vorteile. Beide Bereiche eint ein etabliertes Kernwissen, welches nur selten angepasst werden muss. Dadurch sind diese Bereiche geeignet, die für sie notwendigen Ontologien manuell zu erstellen. In anderen Bereichen (d.h. Bereiche mit sich häufig veränderndem Wissen) wäre es jedoch von Vorteil, wenn neue oder geänderte Informationen automatisch in die OntologieAls Tim Berners-Lee seine Vision des 'Semantic Web' 2001 vorstellte, dachte er an Maschinen, die, basierend auf vorhandenem Wissen, automatisch verschiedene Aufgaben erledigen können. Das Wissen sollte in Form von Ontologien vorliegen, welche einen eindeutigen und semantisch mächtigen Weg darstellen, Informationen zu erfassen. Weiterhin könnten diese Informationen für Anwendungen wie die Informationsrückgewinnung verwendet werden, d.h. das Auffinden von Dokumenten, die gewissen Kriterien entsprechen. Über ein Jahrzehnt später zeigen die Technologien des Semantic Web insbesondere in biologischen und medizinischen Bereichen ihre Vorteile. Beide Bereiche eint ein etabliertes Kernwissen, welches nur selten angepasst werden muss. Dadurch sind diese Bereiche geeignet, die für sie notwendigen Ontologien manuell zu erstellen. In anderen Bereichen (d.h. Bereiche mit sich häufig veränderndem Wissen) wäre es jedoch von Vorteil, wenn neue oder geänderte Informationen automatisch in die Ontologie übertragen werden könnten. Das Problem jedoch ist, dass es kaum Ansätze dafür gibt, wie ontologisches Wissen mit natürlicher Sprache zusammengebracht werden kann. Zu diesem Zweck wurde der SE-DSNL Ansatz entwickelt. Er ermöglicht es Experten, die Verbindungen zwischen ontologischem und linguistischem Wissen von beliebigen Sprachen zu definieren. Im Zentrum des Ansatzes steht ein flexibles und generisches Metamodell, welches alle notwendigen Informationen erfassen kann. Eine prototypische Implementierung analysiert auf Basis eines SE-DSNL Modells einen natürlich sprachlichen Text. Das Ergebnis ist eine semantische Interpretation, welche die Verbindungen zwischen dem Text und der Ontologie sowohl auf lexikalischer als auch syntaktischer Ebene enthält. Zusätzlich ermöglicht diese direkte Integration der semantischen und linguistischen Informationen die Verwendung des ontologischen Wissens zur Laufzeit. Die dadurch entstehenden Vorteile werden durch die Behandlung von komplizierten linguistischen Phänomenen wie pronominaler Anapher Auflösung, Wort-Sinn Disambiguierung, Unbestimmtheit und Referenz Transfer demonstriert. Der Ansatz wird anhand von Szenarien und zwei Fallstudien evaluiert.show moreshow less

Download full text files

Export metadata

Statistics

Number of document requests

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Wolf Fischer
URN:urn:nbn:de:bvb:384-opus4-23214
Frontdoor URLhttps://opus.bibliothek.uni-augsburg.de/opus4/2321
Advisor:Bernhard Bauer
Type:Doctoral Thesis
Language:English
Publishing Institution:Universität Augsburg
Granting Institution:Universität Augsburg, Fakultät für Angewandte Informatik
Date of final exam:2013/04/22
Release Date:2013/06/03
Tag:natural language; semantic; ontology
GND-Keyword:Natürliche Sprache; Ontologie, Wissensverarbeitung; Semantik
Institutes:Fakultät für Angewandte Informatik
Fakultät für Angewandte Informatik / Institut für Informatik
Dewey Decimal Classification:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik
Licence (German):Deutsches Urheberrecht mit Print on Demand