|
Vorlesungsverzeichnis >> Technische Fakultät (TF) >>
|
Textmining - Algorithmen und Anwendungen (TM)
- Dozentinnen/Dozenten
- Dipl.-Inf. Richard Schaller, Dipl.-Inf. Martin Hacker, Dr.-Ing. Stefan Mandl
- Angaben
- Vorlesung mit Übung
4 SWS, benoteter Schein, ECTS-Studium, ECTS-Credits: 5
für Anfänger geeignet
Zeit und Ort: Do 12:30 - 14:00, 14:05 - 15:35, Raum n.V.; Bemerkung zu Zeit und Ort: Ort: Haberstr. 2, 3. Stock, Termin vorläufig
- Studienfächer / Studienrichtungen
- WF INF-DH-KI ab 5
- Voraussetzungen / Organisatorisches
- Kenntnisse der Wahrscheinlichkeitsrechnung sind von Vorteil, aber nicht notwendig; ebenso Kenntnisse über (symbolische) natürliche Sprachverarbeitung. Die Veranstaltung (Vorlesung+Übung) kann mit bis zu vier SWS für das Prüfungsfach Künstliche Intelligenz angerechnet werden (z.B. in Kombination mit KI 1 oder Einführung in die Sprachverarbeitung).
- Inhalt
- Die Vorlesung stellt Grundlagen, verschiedene Algorithmen und Anwendungen des
Textminings vor. Textmining entstand aus dem information retrieval (heute würde
man schlicht den Begriff "Suche" verwenden). Im Gegensatz zur allgemeinen maschinellen Sprachverarbeitung stehen beim Textmining spezifische Fragestellungen im
Vordergrund, welche auf Grundlage eines Korpus von (Text-)Dokumenten beantwortet werden sollen. Die wichtigsten Teilgebiete sind hierbei:
Information Extraction: Finde spezifische Informationen (Personennamen, Orte, etc.) innerhalb eines Textes
Information Retrieval (= Dokumentsuche): Finde das Dokument, welches eine gegebene Frage am besten beantwortet
Clustering: Gruppiere Dokumente nach bestimmten Kriterien
Klassifikation: Um was für eine Art Dokument handelt es sich?
Question Answering: Finde Antworten auf spezifische Fragen
Die ersten vier Teilgebiete werden im Rahmen der Vorlesung behandelt und in den Übungen erprobt.
- Empfohlene Literatur
- Ian H. Witten und Eibe Frank, Data Mining (Practical Machine Learning Tools and Techniques with Java Implementations), Morgan Kaufmann Publishers, San Francisco 2000
Christopher D. Manning und Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press, Cambridge 2000
- ECTS-Informationen:
- Credits: 5
- Zusätzliche Informationen
- Schlagwörter: Text Mining, statistische Sprachverarbeitung, Information Extraction, Information Retrieval
Erwartete Teilnehmerzahl: 9
www: http://www8.informatik.uni-erlangen.de/en/vorl_textmining.html
- Verwendung in folgenden UnivIS-Modulen
- Startsemester WS 2010/2011:
- Textmining (TM)
- Institution: Lehrstuhl für Informatik 8 (Theoretische Informatik)
|
|
|
|
UnivIS ist ein Produkt der Config eG, Buckenhof |
|
|