MLU
Vorlesung/Übung: Information Retrieval - Details
Sie sind nicht in Stud.IP angemeldet.

Allgemeine Informationen

Veranstaltungsname Vorlesung/Übung: Information Retrieval
Untertitel Suchmaschinen, Web, Text-Mining
Veranstaltungsnummer INF.01084.01
Semester SS 2010
Aktuelle Anzahl der Teilnehmenden 0
Heimat-Einrichtung Leitung des Instituts für Informatik
beteiligte Einrichtungen Praktische Informatik (Datenbanken)
Veranstaltungstyp Vorlesung/Übung in der Kategorie Offizielle Lehrveranstaltungen
Erster Termin Mittwoch, 07.04.2010 08:15 - 11:45
Lernorganisation Die Vorlesung wird durch praktische Übungen begleitet. Die
eingereichten Lösungen werden in den Übungszeiten präsentiert und diskutiert. Die Übungen enthalten Theorie- und kleine Programmieraufgaben, die Sie in einer Programmiersprache Ihrer Wahl implementieren und auswerten sollen.
Ein größere Projektaufgabe soll in der vorlesungsfreien Zeit bearbeitet werden, die aus einem Programmierteil und einer schriftlichen Beschreibung und Auswertung besteht. Die Übungsaufgaben sowie die Projektarbeit können in Gruppen angefertigt werden.
Leistungsnachweis Zum Überprüfen der Leistungen werden drei kleine Klausuren geschrieben. Um für das Modul 5 Leistungspunkte zu erhalten, müssen Sie regelmäßig an Vorlesung und Übung teilnehmen und mindestens zwei Lösungen in den Übungen selbst vorstellen. Weiterhin müssen Sie zwei der drei Klausuren
bestehen, mind. 50% der Übungspunkte erreichen und am Semesterende ein ausgearbeitetes Projekt vorlegen. In die Modulnote gehen die zwei besten Klausurleistungen sowie die Projektarbeit zu jeweils 50% ein.
SWS 2+2
ECTS-Punkte 5

Räume und Zeiten

Keine Raumangabe
Mittwoch: 08:15 - 11:45, wöchentlich(15x)

Studienbereiche

Kommentar/Beschreibung

Viele digital gespeicherte Informationen sind Textdokumente.
In der Veranstaltung Information Retrieval (IR) werden im
ersten Teil Grundlagen zur Suche in großen Dokumentsammlungen gelegt.
Im zweiten Teil werden Methoden zur Suche in Webseiten unter Berücksichtigung
der Link-Struktur behandelt. Im dritten Teil werden probabilistische Modelle
aus den Bereichen Maschinelles Lernen und Verarbeitung natürlicher Sprache
vorgestellt, die Themen in Dokumentsammlungen lernen können. Im letzten Teil
werden IR Anwendungen diskutiert. Besonders relevant für Bioinformatiker ist
die Auswertung der Medline Sammlung, die Abstracts aller Veröffentlichungen im
Bereich Lebenswissenschaften enthält.

- Grundlagen IR
-- Dokumentvorverarbeitung
-- IR Modelle
--- Boolsches Modell
--- Vektorraum Modell
-- Evaluierung mittels Precision/Recall
-- Indexstrukturen: Invertierte Listen + Optimierung
-- Erweiterung: Latent Semantic Indexing

- Suche in Webseiten
-- Nutzung der Links
--- PageRank (Google)
--- HITS
-- Finden von Duplikaten

- Probabilistische Modellierung von Dokumenten
-- Probabilistische Modelle
-- IR-Anwendungen probabilistischer Modelle für Dokumente
--- Dokumentsuche
--- Recommender Systeme
--- Bioinformatik

- Anwendungen
-- Anwenderschnittstellen & Visualisierung
-- Multimedia-Suche (Bilder, Musik, Video)
-- Bioinformatik: Medline