LRNLP 08: Informationsextraktion aus Wirtschaftsnachrichten über Unternehmenszusammenschlüsse...

Référence: ISBN 9783862888993
92,80


Informationsextraktion aus Wirtschaftsnachrichten über Unternehmenszusammenschlüsse mit lokalen Grammatiken
 
Sophia Charlotte Stotz
 
In der vorliegenden Arbeit wird ein System zur automatischen Erkennung von sieben Phasen eines Unternehmenszusammenschlusses in deutschsprachigen Wirtschaftsnachrichten ausgearbeitet. Ein besonderer Schwerpunkt liegt dabei auf der Frage nach dem faktischen Status des Ereignisses. Ziel ist es, zwischen Aussagen, in denen von einer Tatsache die Rede ist, und Aussagen, in denen ein Sachverhalt als faktisch nicht existierend präsentiert wird, zu unterscheiden. Das Konzept der Unterscheidung zwischen Realis und Irrealis wird Faktizität bezeichnet. Diese kann mittels einer großen Vielfalt an sprachlichen Markern (wie z. B. Modalverben, Adverbien) ausgedrückt werden.
 
Die vorliegende Arbeit entwickelt ein Kategorisierungssystem für Faktizitätsmarker, das die Bandbreite und die Nuancen ihrer Auswirkung auf den faktischen Status eines Ereignisses widerspiegelt. Da sowohl die Extraktion der Ereignisse als auch die Erkennung ihrer Faktizität die Berücksichtigung der Interaktion zwischen syntaktischen und semantischen Eigenschaften erfordert, wurden lokale Grammatiken als Methode zur Extraktion gewählt. Die erkannten Relationen geben Aufschluss über die M&A-Aktivitäten von Unternehmen und erlauben Aussagen zum aktuellen Stadium einer konkreten Fusion oder einer Übernahme. Die Arbeit leistet einen Beitrag zur präzisen Erkennung und Klassifizierung von Ereignissen. Das Informationsextraktionssystem kann beispielsweise für Suchmaschinen, Frage-Antwort-Systeme oder auch für eine Darstellung aktueller Geschehnisse eingesetzt werden.
 
ISBN 9783862888993. Linguistic Resources for Natural Language Processing 08. 240 S. 2018.
 
RESOURCES FOR NATURAL LANGUAGE PROCESSING

Applications of natural language processing in a growing variety of technical, industrial and ecommerce domains have become common place. Yet there is still little agreement among theoretically and practically minded computational linguists about the basic assumptions and working principles. The monographs in this series address the role and the form of linguistic resources in all areas and applications for natural language processing. Even though it is widely admitted that such resources are an important prerequisite for serious progress in the construction, there has been little consensus about the details of these resources. There have also been very few systematic attempts to outline and to pursue large-scale programs in this field. In addition to the enumeration of all the morphological forms of a language, the central resources are still outstanding, in particular the widely underestimated greater need for very large dictionaries of "complex forms". These range from dictionaries of nominal compounds to dictionaries of predicate-argument schemas as expressed by verbs, predicative nouns and adjectives for instance. And in particular , specific attention needs to be directed towards the construction of exhaustive dictionaries of "frozen predicates" which in fact outnumber the other types. On the basis of such dictionaries even more adequate representative structures in the form of local grammars and transducers that can deal with the ubiquitous variations of these predicate-argument structure schemas can be envisaged. Once such extensive linguistic databases are available, we will be able to benefit from the insight that the central goal of linguistic analysis is to identify linguistic units of different degrees of complexity on the basis of pre-exisiting lexico-grammatical structures. Only then will we be able to tackle the challenging tasks concerning language learning by humans and machines in an adequate way.

Franz Guenthner
CIS, Ludwig-Maximilians-Universität
Parcourir cette catégorie : Natural Language Processing (LRNLP)