Text in english

Big Data Systeme

Kurs nur in Deutsch

Semesterwochenstunden:

4

Leistungspunkte:

5

Vorkenntnisse:

keine

Veranstaltungstyp:

Praxisorientierter, seminaristischer Unterricht und Seminar-Vorträge

Semesterturnus:

Wintersemester

Arbeitsaufwand:

150 Stunden, davon: 
50 Stunden Präsenzzeit 
100 Stunden Nachbereitung Vorlesung, Vorbereitung eigener Vortrag und Prüfung

Beitrag zu den Zielen des Studiengangs:

  • Anwendung von Machine-Learning-Methoden
  • Entwurf und Einsatz verteilter Software-Systeme
  • Modellierung analytischer Informationssysteme
  • Integration heterogener Datenstrukturen
  • Daten- und Methodenkompetenz

Lernziel:

Nach der erfolgreichen Teilnahme an diesem Modul kennen die Studierenden die fachlichen und technischen Herausforderungen, die im Einsatz von Big Data begründet sind. Die Studierenden können die Potenziale und Grenzen aktueller Technologien, Architekturkonzepte und Analyse-Verfahren im Big-Data-Umfeld beschreiben und sind dadurch in der Lage, Anwendungsfälle zu systematisch zu analysieren und Lösungsansätze zu entwickeln. Sie kennen die Grundlagen maschineller Lernverfahren und sind in der Lage, ausgewählte Verfahren einzusetzen und zu bewerten.

Schlüsselqualifikationen:

  • Fähigkeit zu abstraktem mathematischen Denken und Schließen
  • Analyse und Bewertung komplexer Systeme und Architekturen
  • Präsentationstechniken

Lehrinhalte:

Durch die allgemeine Digitalisierung sowohl im geschäftlichen wie auch im privaten Umfeld entstehen gigantische Datenmengen. Mobile Commerce, Smart Home, Connected Car, Internet of Things sind einige Schlagworte aus diesem Umfeld. Unternehmen möchten diese "Big Data" nutzen, um Geschäftsprozesse zu optimieren, Risiken zu senken, Probleme zu erkennen und nicht zuletzt Informationen über Kunden und deren Vorlieben gewinnbringend zu nutzen.
In der Vorlesung werden fachliche und technische Fragestellungen, Herausforderungen und Lösungen diskutiert. 

Programmiert wird in der Vorlesung und in den eigenen Projekten vornehmlich mit Python. Grundkenntnisse dafür sind wünschenswert, sie können aber auch problemlos im Laufe des Semesters erlernt werden.

Die Lehrveranstaltung beginnt mit einem Vorlesungsteil, um das Thema zu motivieren sowie grundlegende Technologien vorzustellen. Ergänzt wird dieser Teil durch praktische Übungen. Die Themen in diesem Block sind:
  • Einführung zu Big Data
  • Grundlagen von Data Science und maschinellem Lernen
  • Architektur und Aufbau von Big-Data-Systemen
Der zweite Teil wird durch studentische Vorträge und Ausarbeitungen gestaltet. Dabei werden ausgewählte fachliche, technische und methodische Fragestellungen aus dem Bereich Data Engineering, Data Science und Machine Learning im Rahmen von eigenen Projekten vertieft. Themen in diesem Block können beispielsweise sein:
  • Social Media Analytics
  • Text Mining
  • Knowledge Extraction
  • Deep Learning
  • Ethische Aspekte von Big Data
  • Big Data Security
  • Datenstrom-Verarbeitung
  • In-Memory-Systeme
  • u.v.m.

Literatur:

  • B. Chambers, M. Zaharia: Spark - The Definitive Guide. O'Reilly, 2018
  • J. Cleve, U. Lämmel: Data Mining. De Gruyter Studium, 2016
  • A. Géron: Hands-On Machine Learning with Scikit-Learn and TensorFlow, O'Reilly, 2017
  • U. Haneke u.a. (Hrsg.): Data Science: Grundlagen, Architekturen und Anwendungen, dpunkt, 2019
  • M. Kleppmann: Designing Data-Intensive Applications, O'Reilly, 2017
  • J. Leskovec u.a.: Mining Massive Datasets, Cambridge University Press, 2014
  • A. Müller, S. Guido: Introduction to Machine Learning with Python: A Guide for Data Scientists, O'Reilly, 2016
  • J. VanderPlas: Python Data Science Handbook, O'Reilly, 2016
  • T. White: Hadoop – The Definitive Guide. O'Reilly, 2015

Bemerkungen:

 

Leistungsnachweis:

Studienarbeit und Referat (30min)

Zulassungsvoraussetzungen:

 

Hilfsmittel:

 

Modulverantwortliche/r:

Prof. Dr. Albrecht





TH Nürnberg
Fakultät Informatik
Webmaster-IN



Root- Zertifikat

© 2019 Fakultät Informatik