MLU
Vorlesung: Information Retrieval - Details
Sie sind nicht in Stud.IP angemeldet.

Allgemeine Informationen

Veranstaltungsname Vorlesung: Information Retrieval
Untertitel Suchmaschinen, Web, Text-Mining
Veranstaltungsnummer INF.01084.02
Semester SS 2011
Aktuelle Anzahl der Teilnehmenden 0
Heimat-Einrichtung Leitung des Instituts für Informatik
beteiligte Einrichtungen Praktische Informatik (Datenbanken)
Veranstaltungstyp Vorlesung in der Kategorie Offizielle Lehrveranstaltungen
Erster Termin Donnerstag, 07.04.2011 12:15 - 13:45, Ort: (Datenbanklabor 5.06)
Lernorganisation Die Vorlesung wird durch praktische Übungen begleitet. Die
eingereichten Lösungen werden in den Übungszeiten präsentiert und diskutiert. Die Übungen enthalten Theorie- und kleine Programmieraufgaben, die mit industriell genutzter Open-Source-Software (Apache-Lucene, UIMA, ...) umgesetzt werden sollen. Die Übungsaufgaben sowie die Projektarbeit können in Gruppen angefertigt werden.
SWS 2
ECTS-Punkte 5

Räume und Zeiten

(Datenbanklabor 5.06)
Donnerstag: 12:15 - 13:45, wöchentlich (14x)

Studienbereiche

Kommentar/Beschreibung

Viele digital gespeicherte Informationen sind Textdokumente. In der Veranstaltung Information Retrieval (IR) werden im ersten Teil Grundlagen zur Suche in großen Dokumentsammlungen gelegt. Im zweiten Teil werden Methoden zur Suche in Webseiten unter Berücksichtigung der Link-Struktur behandelt. Im dritten Teil werden IR Anwendungen diskutiert. Besonders relevant für Bioinformatiker ist die Auswertung der Medline Sammlung, die Abstracts aller Veröffentlichungen im Bereich Lebenswissenschaften enthält.

1) Grundlagen IR
Dokumentvorverarbeitung
Boolsches Modell
Vektorraum Modell
Evaluierung mittels Precision/Recall
Indexstrukturen: Invertierte Listen + Optimierung
Erweiterung: Latent Semantic Indexing
2) Suche in Webseiten
Nutzung der Links
PageRank (Google)
HITS
Finden von Duplikaten
3.) Anwendungen
Anwenderschnittstellen & Visualisierung
Multimedia-Suche (Bilder, Musik, Video)
Bioinformatik: Medline