MLU
INF.06559.03 - Big Data Analytics (Complete module description)
Original version English
INF.06559.03 5 CP
Module label Big Data Analytics
Module code INF.06559.03
Semester of first implementation
Faculty/Institute Institut für Informatik
Module used in courses of study / semesters
  • Bioinformatik (180 LP) (Bachelor) > Bioinformatik Bioinformatik180, Version of accreditation (WS 2018/19 - WS 2022/23) > Informatik
  • Geographie (180 LP) (Bachelor) > Geographie/Erdkunde Geographie180, Version of accreditation (WS 2021/22 - SoSe 2023) > Ergänzungsbereich 4: Informatik
  • Informatik (180 LP) (Bachelor) > Informatik Informatik180, Version of accreditation (WS 2018/19 - WS 2022/23) > Bereich Informatik
  • Wirtschaftsinformatik (Business Information Systems) (180 LP) (Bachelor) > Wirtschaftsinformatik Wirtschaftsinformatik180, Version of accreditation valid from WS 2020/21 > 1.3 Informatik
Responsible person for this module
Further responsible persons
Prof. Dr. Matthias Hagen
Prerequisites
"Objektorientierte Programmierung" (INF.00677.05); "Einführung in Data Science" (INF.06485.02) oder "Wahrscheinlichkeitstheorie und Statistik" (MAT.00113.02); oder "Statistik II" (WIW.00690.03)
Skills to be acquired in this module
Studierende sollen durch dieses Modul folgende Kompetenzen erwerben:
  • Sie sind in der Lage, für gegebene Datenanalyseproblemstellungen zu erkennen, ob es sich um batch-orientiert zu bearbeitende oder eher datenstromorientierte Fragestellungen handelt. Sie können dabei die allgemeinen Vor- und Nachteile entsprechender Lösungsansätze gegeneinander abwägen.
  • Sie kennen die Komponenten verteilter Dateisysteme und verteilter Problemlösungsstrategien für sehr große Datenmengen und können deren Bedeutung in Beispielproblemstellungen erläutern.
  • Sie sind in der Lage, zu vorformulierten einfachen Datenstromproblemstellungen wie etwa dem Bestimmen häufiger Elemente oder dem Bestimmen der Anzahl verschiedener Elemente Lösungsalgorithmen bezüglich ihrer Effizienz und Approximationseffektivität einzuschätzen und vergleichend zu bewerten.
  • Sie können die grundlegenden Begriffe empirischer Wissenschaft wie etwa experimentelle Evaluierung und Hypothesentesten auf reale Datenanalyseproblemstellungen übertragen und praktisch anwenden.
  • Sie können selbstständig einfachere Datenanalyseproblemstellungen praktisch bearbeiten und valide Erkenntnisse aus den Analysen ableiten.
  • Sie kennen wesentliche Grundbegriffe des maschinellen Lernens wie etwa überwachtes und unüberwachtes Lernen und können für reale Probleme entscheiden, in welche Kategorie sie einzuordnen sind.
Module contents
In der Vorlesung werden Konzepte und Methoden zur Analyse großer Datenmengen vermittelt. Ein Schwerpunkt ist dabei die Gegenüberstellung von Datenstromverfahren und eher Batch-Verarbeitungs-orientierten Ansätzen wie MapReduce.
Forms of instruction Lecture (2 SWS)
Exercises (2 SWS)
Course
Languages of instruction German, English
Duration (semesters) 1 Semester Semester
Module frequency jedes Sommersemester
Module capacity unlimited
Time of examination
Credit points 5 CP
Share on module final degree Course 1: %; Course 2: %; Course 3: %.
Share of module grade on the course of study's final grade 1
Module course label Course type Course title SWS Workload of compulsory attendance Workload of preparation / homework etc Workload of independent learning Workload (examination and preparation) Sum workload
Course 1 Lecture Vorlesung 2 0
Course 2 Exercises Übung 2 0
Course 3 Course Selbststudium 0
Workload by module 150 150
Total module workload 150
Examination Exam prerequisites Type of examination
Course 1
Course 2
Course 3
Final exam of module
Erfolgreiches Lösen und Vorstellen von Übungs- und Programmieraufgaben
mdl./schrftl./elektr.
Exam repetition information
Prerequisites and conditions Prerequisites Frequency Compulsory attendance Share on module grade in percent
Course 1 Summer semester No %
Course 2 Summer semester No %
Course 3 Summer semester No %