MLU
INF.06559.03 - Big Data Analytics (Vollständige Modulbeschreibung)
Originalfassung Englisch
INF.06559.03 5 CP
Modulbezeichnung Big Data Analytics
Modulcode INF.06559.03
Semester der erstmaligen Durchführung
Fachbereich/Institut Institut für Informatik
Verwendet in Studiengängen / Semestern
  • Bioinformatik (180 LP) (Bachelor) > Bioinformatik Bioinformatik180, Akkreditierungsfassung (WS 2018/19 - WS 2022/23) > Informatik
  • Geographie (180 LP) (Bachelor) > Geographie/Erdkunde Geographie180, Akkreditierungsfassung (WS 2021/22 - SoSe 2023) > Ergänzungsbereich 4: Informatik
  • Informatik (180 LP) (Bachelor) > Informatik Informatik180, Akkreditierungsfassung (WS 2018/19 - WS 2022/23) > Bereich Informatik
  • Wirtschaftsinformatik (Business Information Systems) (180 LP) (Bachelor) > Wirtschaftsinformatik Wirtschaftsinformatik180, Akkreditierungsfassung gültig ab WS 2020/21 > 1.3 Informatik
Modulverantwortliche/r
Weitere verantwortliche Personen
Prof. Dr. Matthias Hagen
Teilnahmevoraussetzungen
"Objektorientierte Programmierung" (INF.00677.05); "Einführung in Data Science" (INF.06485.02) oder "Wahrscheinlichkeitstheorie und Statistik" (MAT.00113.02); oder "Statistik II" (WIW.00690.03)
Kompetenzziele
Studierende sollen durch dieses Modul folgende Kompetenzen erwerben:
  • Sie sind in der Lage, für gegebene Datenanalyseproblemstellungen zu erkennen, ob es sich um batch-orientiert zu bearbeitende oder eher datenstromorientierte Fragestellungen handelt. Sie können dabei die allgemeinen Vor- und Nachteile entsprechender Lösungsansätze gegeneinander abwägen.
  • Sie kennen die Komponenten verteilter Dateisysteme und verteilter Problemlösungsstrategien für sehr große Datenmengen und können deren Bedeutung in Beispielproblemstellungen erläutern.
  • Sie sind in der Lage, zu vorformulierten einfachen Datenstromproblemstellungen wie etwa dem Bestimmen häufiger Elemente oder dem Bestimmen der Anzahl verschiedener Elemente Lösungsalgorithmen bezüglich ihrer Effizienz und Approximationseffektivität einzuschätzen und vergleichend zu bewerten.
  • Sie können die grundlegenden Begriffe empirischer Wissenschaft wie etwa experimentelle Evaluierung und Hypothesentesten auf reale Datenanalyseproblemstellungen übertragen und praktisch anwenden.
  • Sie können selbstständig einfachere Datenanalyseproblemstellungen praktisch bearbeiten und valide Erkenntnisse aus den Analysen ableiten.
  • Sie kennen wesentliche Grundbegriffe des maschinellen Lernens wie etwa überwachtes und unüberwachtes Lernen und können für reale Probleme entscheiden, in welche Kategorie sie einzuordnen sind.
Modulinhalte
In der Vorlesung werden Konzepte und Methoden zur Analyse großer Datenmengen vermittelt. Ein Schwerpunkt ist dabei die Gegenüberstellung von Datenstromverfahren und eher Batch-Verarbeitungs-orientierten Ansätzen wie MapReduce.
Lehrveranstaltungsformen Vorlesung (2 SWS)
Übung (2 SWS)
Kursus
Unterrichtsprachen Deutsch, Englisch
Dauer in Semestern 1 Semester Semester
Angebotsrhythmus Modul jedes Sommersemester
Aufnahmekapazität Modul unbegrenzt
Prüfungsebene
Credit-Points 5 CP
Modulabschlussnote LV 1: %; LV 2: %; LV 3: %.
Faktor der Modulnote für die Endnote des Studiengangs 1
Modulveran­staltung Lehrveranstaltungs­form Veranstaltungs­titel SWS Workload Präsenz Workload Vor- / Nach­bereitung Workload selbstge­staltete Arbeit Workload Prüfung incl. Vorbereitung Workload Summe
LV 1 Vorlesung Vorlesung 2 0
LV 2 Übung Übung 2 0
LV 3 Kursus Selbststudium 0
Workload modulbezogen 150 150
Workload Modul insgesamt 150
Prüfung Prüfungsvorleistung Prüfungsform
LV 1
LV 2
LV 3
Gesamtmodul
Erfolgreiches Lösen und Vorstellen von Übungs- und Programmieraufgaben
mdl./schrftl./elektr.
Wiederholungsprüfung
Regularien Teilnahme­voraussetzungen Angebots­rhythmus Anwesenheits­pflicht Gewicht an Modulnote in %
LV 1 Sommersemester Nein %
LV 2 Sommersemester Nein %
LV 3 Sommersemester Nein %