MLU
Vorlesung/Übung: Information Retrieval - Details
You are not logged into Stud.IP.

General information

Course name Vorlesung/Übung: Information Retrieval
Subtitle Suchmaschinen, Web, Text-Mining
Course number INF.01084.01
Semester SS 2010
Current number of participants 0
Home institute Leitung des Instituts für Informatik
participating institutes Praktische Informatik (Datenbanken)
Courses type Vorlesung/Übung in category Offizielle Lehrveranstaltungen
First date Wednesday, 07.04.2010 08:15 - 11:45
Learning organisation Die Vorlesung wird durch praktische Übungen begleitet. Die
eingereichten Lösungen werden in den Übungszeiten präsentiert und diskutiert. Die Übungen enthalten Theorie- und kleine Programmieraufgaben, die Sie in einer Programmiersprache Ihrer Wahl implementieren und auswerten sollen.
Ein größere Projektaufgabe soll in der vorlesungsfreien Zeit bearbeitet werden, die aus einem Programmierteil und einer schriftlichen Beschreibung und Auswertung besteht. Die Übungsaufgaben sowie die Projektarbeit können in Gruppen angefertigt werden.
Performance record Zum Überprüfen der Leistungen werden drei kleine Klausuren geschrieben. Um für das Modul 5 Leistungspunkte zu erhalten, müssen Sie regelmäßig an Vorlesung und Übung teilnehmen und mindestens zwei Lösungen in den Übungen selbst vorstellen. Weiterhin müssen Sie zwei der drei Klausuren
bestehen, mind. 50% der Übungspunkte erreichen und am Semesterende ein ausgearbeitetes Projekt vorlegen. In die Modulnote gehen die zwei besten Klausurleistungen sowie die Projektarbeit zu jeweils 50% ein.
SWS 2+2
ECTS points 5

Rooms and times

No room preference
Wednesday: 08:15 - 11:45, weekly(15x)

Fields of study

Comment/Description

Viele digital gespeicherte Informationen sind Textdokumente.
In der Veranstaltung Information Retrieval (IR) werden im
ersten Teil Grundlagen zur Suche in großen Dokumentsammlungen gelegt.
Im zweiten Teil werden Methoden zur Suche in Webseiten unter Berücksichtigung
der Link-Struktur behandelt. Im dritten Teil werden probabilistische Modelle
aus den Bereichen Maschinelles Lernen und Verarbeitung natürlicher Sprache
vorgestellt, die Themen in Dokumentsammlungen lernen können. Im letzten Teil
werden IR Anwendungen diskutiert. Besonders relevant für Bioinformatiker ist
die Auswertung der Medline Sammlung, die Abstracts aller Veröffentlichungen im
Bereich Lebenswissenschaften enthält.

- Grundlagen IR
-- Dokumentvorverarbeitung
-- IR Modelle
--- Boolsches Modell
--- Vektorraum Modell
-- Evaluierung mittels Precision/Recall
-- Indexstrukturen: Invertierte Listen + Optimierung
-- Erweiterung: Latent Semantic Indexing

- Suche in Webseiten
-- Nutzung der Links
--- PageRank (Google)
--- HITS
-- Finden von Duplikaten

- Probabilistische Modellierung von Dokumenten
-- Probabilistische Modelle
-- IR-Anwendungen probabilistischer Modelle für Dokumente
--- Dokumentsuche
--- Recommender Systeme
--- Bioinformatik

- Anwendungen
-- Anwenderschnittstellen & Visualisierung
-- Multimedia-Suche (Bilder, Musik, Video)
-- Bioinformatik: Medline