Back to top

Natural Language Processing - Methods and their Application on Legal Texts

Last modified Dec 14, 2017

Dieses Seminar wird derzeit unter dem Titel "Natural Language Processing & Machine Learning - Methods and their Application on Legal Texts" angeboten.

 

Please find the English description below.

___________

Eine zentrale Kommunikationsform von Menschen in Organisationen, Gesellschaft und Institutionen ist natürliche Sprache. Dokumentiert in Form von Textdokumenten, liegen große Bestände zumeist unstrukturierter Informationen vor. Der schnelle Zugriff auf relevante Inhalte und die Extraktion strukturierter Informationen ist für Maschinen eine große Herausforderung.

Maschinen-gestützte Lösungen zur Textanalyse, Indizierung und Generierung werden unter den Begriffen Natural Language Processing, Text Analytics, Text Mining oder auch Natural Language Generation zusammengefasst. Im Laufe der letzten Jahrzehnte wurde ein großer Kanon an unterschiedlichsten Verfahren und Lösungen entwickelt. Die Vielfältigkeit der Aufgaben und die rasante Entwicklung neuer Technologien, z.B. im Bereich Maschinelles Lernen, lassen auf das große Potential dieser Verfahren schließen.

Die große Bedeutung juristischer Regeln für jede einzelne natürliche oder juristische Person, die zumeist hohe Sprachqualität und die wachsende Menge an frei zugänglichen Dokumenten verdeutlichen die Relevanz die Anwendbarkeit von Text Mining und Natural Language Processing Verfahren auf juristische Texte zu untersuchen. 

Das Ziel dieses Seminars ist es, eine Übersicht über die technologischen Bausteine zu geben und ihre Anwendung am konkreten Beispiel juristischer Texte zu beleuchten. Die Teilnehmer können sich selbstständig anhand von Literatur in ein wissenschaftliches Thema einarbeiten und die Ergebnisse in einem Vortrag präsentieren und diskutieren.

Die einzelnen Themengebiete umfassen (sind jedoch nicht limitiert auf, eigene Themen-Vorschläge können eingebracht werden): siehe Tabelle am Ende der Seite

___________

People in organizations, society and institutions communicate via natural language. Typically, large amounts of unstructured information are stored in text documents. However, it is very challenging for machines to query relevant content fast and extract structured information.

Machine-based solutions for text analysis, indexing and generation are often summarized undert the terms natural language processing, text mining or natural language generation. In the past decades, many different methods and solutions have been developed. The diversity of the different problems and the fast development of new technologies, e.g. machine learning, underline the large potential of these methods.

The immense importance of jurisdictional rules for natural or legal persons, the high quality of the language and the increasing amount of freely available documents illustrate the importance to investigate the applicability of natural language processing methods on legal texts.

___________

 

Consult e.g. https://en.wikipedia.org/wiki/Natural_language_processing#Major_evaluations_and_tasks for a first overview about a certain topic.

 

The individual topics consist of, but are not limited to (topics can be suggested from students, too):

  1. Pre-processing (Term Frequency, Word Embeddings)
  2. Part-of-Speech Tagging & Named Entity Recognition
  3. Text Analytics: Readability Measures
  4. Information Retrieval: Query Expansion
  5. Information Extraction: Apache UIMA & Gate
  6. Citation Networks
  7. Classification Tasks (Docket Entries, Norms, Judgements)
  8. Text Clustering (SOM, t-SNE)
  9. Topic Modeling (LDA, LSI)
  10. Text Summarization
  11. Natural Language Generation
  12. Question Answering & Chatbots
  13. Sentiment Analysis and Opinion Mining
  14. Interactive Machine Learning
  15. E-Discovery: Predictive Coding
  16. Discourse Analysis & Argumentation Mining
  17. Markov Logic Networks

 

Files and Subpages

There are no subpages or files.