Data Science met Python

Python krijgt een steeds grotere rol in de wereld van data science. Een van de redenen is dat Python een general purpose programming language is. Hierdoor biedt Python mogelijkheden om modellen direct in te zetten in een bredere context. Bovendien is Python gemakkelijk om te leren.

Tijdens de cursus Data Science met Python leert u hoe u de Python-taal en Python libraries kunt gebruiken in Data Science-projecten. Als eerste worden de Python syntax-aspecten behandeld. Deze zijn belangrijk bij Data Science-projecten. Variabelen, datatypes, functies, flow control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda.

Vervolgens komt het NumPy package aan de orde, waarmee grote data sets zeer efficiënt verwerkt kunnen worden. Hierbij wordt NumPy's ndarray object en zijn methodes besproken. Aandacht wordt besteed aan de verschillende array manipulatietechnieken en speciale routines voor het ordenen, zoeken en vergelijken van data in matrices. Hierbij wordt ook de MatPlotlib library besproken, die nauw is geïntegreerd met NumPy en een zeer krachtig instrument vormt voor het creëren en plotten van complexe datarelaties.

Daarna is het de beurt aan het gebruik van pandas voor data-analyse. De pandas library introduceert twee nieuwe data structures in Python, die gebruik maken van Numpy en daarom snel zijn. De data structures zijn DataFrame en Series en er wordt uitgebreid ingegaan op u deze kunt gebruiken voor data-analysis bij het inspecteren, selecteren, filteren, combineren en groeperen van data. Ten slotte wordt aandacht besteed aan de essentials van de SciPy library.

De cursus maakt gebruik van vele voorbeelden uit de praktijk en laat zien hoe één-, twee- en drie dimensionale data sets kunnen worden gevisualiseerd.

De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo's verduidelijken de concepten. De theorie wordt afgewisseld met oefeningen. Als ontwikkelomgeving wordt de Anaconda distributie met Jupyter notebooks gebruikt.

Doelgroep
De cursus Data Science met Python is bedoeld voor data-analisten, die Python en de Python libraries willen gebruiken in Data Science projecten.

Voorkennis
Om aan deze cursus te kunnen deelnemen is kennis van en ervaring met een willekeurige programmeertaal of pakket zoals SPSS, Matlab of VBA wenselijk. De beginselen van Python worden op de eerste dag behandeld. Indien u deze kennis al heeft, kunt u de eerste dag van de cursus tegen een minderprijs overslaan.

Duur
De duur van de cursus is vier dagen.

Groepsgrootte
De maximale groepsgrootte bedraagt acht personen.

Certificaat
De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Data Science met Python.

Inclusief
Cursusmateriaal en lunch.