Studiengang Information Science (Bachelor of Science) [PO 2019]

Wahlpflichtkatalog

WPs

1 Modulname
Grundlagen der Sprachverarbeitung   Modulbeschreibung als pdf laden
(Introduction to Natural Language Processing)
1.1 Modulkürzel
141090
1.2 Art
Wahlpflicht / WP-Modul
1.3 Lehrveranstaltung(en)
Grundlagen der Sprachverarbeitung
1.4 Semester
4
1.5 Modulverantwortliche(r)
Prof. Dr. Margot Mieskes, Prof. Dr. Melanie Siegel
1.6 Weitere Lehrende
1.7 Studiengangsniveau
Bachelor
1.8 Lehrsprache
Deutsch
2 Inhalt

Moodle-Kurs im Sommersemester 2020: https://lernen.h-da.de/course/view.php?id=10640

Das Seminar befasst sich mit der automatischen Analyse von Textdaten. Wir werden Texte mit linguistischen und statistischen Methoden analysieren. Schon nach kurzer Zeit können sie z.B. die durchschnittliche Satzlänge in einem Text bestimmen oder feststellen, welche Wörter häufig miteinander im selben Satz auftreten. 

Dabei bekommen die Studierenden eine systematische und gründliche Einführung in die Programmierung mit Python und pythonbasierten Modulen zur computerlinguistischen Textanalyse. 

 

3 Ziele

Kenntnisse

  • Die Studierenden kennen computerlinguistische Algorithmen und Methoden und können sie anwenden.
  • Die Studierenden kennen die entsprechenden linguistischen Hintergründe.
  • Die Studierenden kennen die wichtigsten Datensätze zur Entwicklung von Algorithmen.
  • Die Studierenden kennen Metriken, um den Erfolg der implementierten Methoden zu evaluieren.

Fertigkeiten

  • Die Studierenden können Texte mit Python, NLTK und Textblob analysieren, indem sie Programme schreiben.
  • Die Studierenden können komplexere Programme und Funktionen implementieren, die auf Python und NLTK basieren.

Kompetenzen

  • Die Studierenden erwerben die Kompetenz, Wissen aus unstrukturierten, natürlichsprachlichen Daten zu extrahieren.
  • Sie sind in der Lage, Projekte mit Textanalysemethoden durchzuführen.
  • Sie sind in der Lage natürlichsprachliche Daten mit linguistischen Informationen automatisch oder manuell anzureichern.
  • Sie sind in der Lage, diese Anreicherungen zu evaluieren.
4 Lehr- und Lernformen

Seminar und Übung

5 Arbeitsaufwand und Credit Points
5 CP (Modul gesamt);

150 Stunden: 60 Stunden Präsenzzeit, 90 Stunden Selbststudium und Prüfungsvorbereitung

6 Prüfungsform, Prüfungsdauer und Prüfungsvoraussetzung

Prüfungsstudienarbeit nach ABPO §13 Abs. 2

7 Notwendige Kenntnisse
8 Empfohlene Kenntnisse
9 Dauer, zeitliche Gliederung und Häufigkeit des Angebots

1 Semester; jährlich im SS, 4 SWS

10 Verwendbarkeit des Moduls
Bachelorstudiengang Information Science
11 Literatur

Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python Analyzing Text with the Natural Language Toolkit (http://www.nltk.org/book/)

Perkins, J. (2014). Python 3 Text Processing with NLTK 3 Cookbook. Packt Publishing Ltd. (http://stock.ethop.org/pdf/python/Python%203%20Text%20Processing%20with%20NLTK%203%20Cookbook.pdf)

weitere Literatur wird im Moodle-Kurs bekanntgegeben

Stand: 19.03.2020, 20:59:38. Ältere Versionen im Archiv.