Data Science met Python (Last Minute)


Python krijgt een steeds grotere rol in de wereld van data science. Een van de redenen is dat Python een general purpose programming language is. Hierdoor biedt Python mogelijkheden om modellen direct in te zetten in een bredere context. Bovendien is Python gemakkelijk om te leren.

Tijdens de cursus Data Science met Python leert u hoe u de Python-taal en Python libraries kunt gebruiken in Data Science-projecten. Als eerste worden de Python syntax-aspecten behandeld. Deze zijn belangrijk bij Data Science-projecten.

Variabelen, datatypes, functies, flow control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda.

Vervolgens komt het NumPy package aan de orde, waarmee grote data sets zeer efficiënt verwerkt kunnen worden. Hierbij wordt NumPy’s ndarray object en zijn methodes besproken.

Aandacht wordt besteed aan de verschillende array manipulatietechnieken en speciale routines voor het ordenen, zoeken en vergelijken van data in matrices. Hierbij wordt ook de MatPlotlib library besproken, die nauw is geïntegreerd met NumPy en een zeer krachtig instrument vormt voor het creëren en plotten van complexe datarelaties.

Daarna is het de beurt aan het gebruik van pandas voor data-analyse. De pandas library introduceert twee nieuwe data structures in Python, die gebruik maken van Numpy en daarom snel zijn.

De data structures zijn DataFrame en Series en er wordt uitgebreid ingegaan op u deze kunt gebruiken voor data-analysis bij het inspecteren, selecteren, filteren, combineren en groeperen van data. Ten slotte wordt aandacht besteed aan de essentials van de SciPy library.

De cursus maakt gebruik van vele voorbeelden uit de praktijk en laat zien hoe één-, twee- en drie dimensionale data sets kunnen worden gevisualiseerd.

De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo’s verduidelijken de concepten. De theorie wordt afgewisseld met oefeningen. Als ontwikkelomgeving wordt de Anaconda distributie met Jupyter notebooks gebruikt.

Cursusmateriaal en lunch zijn bij de prijs inbegrepen.

Komen deze data en/of locaties niet uit? Wij bieden deze training ook aan op andere locaties/data (geen Last Minutes)

Doelgroep

De cursus Data Science met Python is bedoeld voor data-analisten, die Python en de Python libraries willen gebruiken in Data Science projecten.

Voorkennis

Om aan deze cursus te kunnen deelnemen is kennis van en ervaring met een willekeurige programmeertaal of pakket zoals SPSS, Matlab of VBA wenselijk. De beginselen van Python worden op de eerste dag behandeld. Indien u deze kennis al heeft, kunt u de eerste dag van de cursus tegen een minderprijs overslaan.

Duur

De duur van de cursus is vier dagen.

Groepsgrootte

De maximale groepsgrootte bedraagt acht personen.

Certificaat

De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Data Science met Python.

Module 1: Python Language Syntax
Python Features
Running Python
Anaconda Distribution
IPython Shell
Interactive and Script Mode
Python Data Types
Numbers and Strings
Sequences and Lists
Sets and Dictionaries
Python Flow Control
Exception Handling

Module 2: Functions and Modules
Pass by Value and Reference
Scope of Variables
EFAP principle
What are comprehensions?
Lambda Operator
Filter, Reduce and Map
List comprehensions
Set and Dictionary comprehensions
Creating and Using Modules
import Statement
from…import Statement

Module 3: Classes and Objects
Creating Classes
Creating and Using Objects
Accessing Attributes
Property Syntax
Constructors and Destructors
Encapsulation
Inheritance
super Keyword
Checking Relationships
issubclass and isinstance
Overriding Methods

Module 4: Numpy
NumPy Numerical Types
Data Type objects
dtype attributes
Slicing and Indexing
Array comparisons
Manipulating array shapes
Stacking and Splitting arrays
any(),all(), slicing, reshape()
Manipulating array shapes
Methods of ndarray
Views versus copies
ravel(),flatten(),transpose()
full() and full_like() Functions

Module 5: Matrices Calculations
ufuncs
Creating matrices
Universal functions
Arithmetic functions
Bitwise functions
Comparison functions
Fancy indexing
at() method
Inverting matrices
Finding eigenvalues
Singular value decomposition
Pseudo inverse
Determinants

Module 6: MatplotLib
Simple Plots
Plot format String
Subplots
Histograms
Logarithmic Plots
Scatter plots
Fill between
Legend and Annotations
Threedimensional Plots
Contour Plots
Transformations
Animation
Projections

Module 7: Pandas
Pandas DataFrame
Import Data
Inspect Data
Data Visualization
DataFrame Data Types
Indexing and selection
Data operations in pandas
Missing Data
Hierarchical Indexing
Plotting with Pandas
Combining Datasets
Exploratory Data Analysis

Module 8: Time Series
Indexing Pandas Time Series
Reading and Slicing Times
Using a DatetimeIndex
Reindexing the Index
Separating and Resampling
Rolling mean and Frequency
Resample and Roll with it
Manipulating Time Series
Method chaining and Filtering
Missing values and Interpolation
Time Zones and Conversion
Plotting Time Series

Module 9: SciPy Essentials
What is SciPy
Matrix Calculations
Using matrix class
Sparse matrices
Linear operators
Scalar multiplication
Non-linear equations and systems
Unconstrained optimization
Constrained optimization
Stochastic methods
Descriptive Statistics
Inference and Data Analysis

Voor deze cursus zijn momenteel geen data gepland. Neem via onderstaand formulier contact met ons op voor meer informatie over de mogelijkheden.