Data Science

Tijdens deze driedaagse cursus leer je hands-on de meest belangrijke en effectieve data science tools. De data science cursus is een brede cursus op het gebied van geavanceerde data-analyse en verwerking en machine learning. De machine learning technieken die tijdens deze cursus behandeld worden zijn clustering, regressie en classificatie met scikit-learn. Deze cursus is geschikt voor mensen die al ervaring hebben met programmeren in Python en die hun vaardigheden willen aanvullen met data science vaardigheden. De cursus Data Science sluit perfect aan op de cursus Python for Data Analysis. Deze cursus kan gevolgd worden als opstap naar een meer gespecialiseerde cursus, zoals bijvoorbeeld Deep Learning.

Leerdoelen Data Science

Na deze cursus:
  • ken je het verschil tussen supervised, unsupervised en reinforcement learning;
  • ken je de principes van hoe machine learning modellen leren;
  • kun je data clusteren met optimale parameters;
  • kun je regressie algoritmes toepassen op datasets om hiermee voorspellingen te doen;
  • kun je classificatie algoritmes toepassen op datasets om data te classificeren, en
  • kun je een decision tree toepassen op datasets en deze optimaliseren.
  • kun je parameters van machine learning algoritmes aanpassen om overfitting te voorkomen.

Voor wie is de Data Science cursus?

  • Je wilt data science en machine learning concepten leren begrijpen en effectief kunnen toepassen.
  • Je begrijpt de basisconcepten van de programmeertaal Python (zie Python Essentials).
  • Je kan data lezen en te analyseren met pandas.
  • Je kan data visualiseren met Python.
  • Je bent benieuwd naar hoe je het meest effectief de libraries pandas, numpy en scikit-learn kan inzetten.
  • Je wilt leren werken in Jupyter Notebooks aan Data Science technieken.
data science cursus visualisaties
Rick Cursus Data Science

Afbeelding 1 en 2. Enkele voorbeelden van outputs uit de data science cursus en ons klaslokaal op locatie Rotterdam.

Cursusinhoud Data Science

Dag 1: Intro to Data Science and Machine Learning

Tijdens deze dag leer je de fundamenten van machine learning en ga je aan de slag met het bouwen van lineaire regressie en polynomiale regressie modellen.

Fundamenten van machine learning

  • Supervised learning. Supervised Learning is een van de meest gebruikte learning technieken van hedendaagse machine learning modellen. Bij Supervised Learning leren modellen van gelabelde data. Dit kunnen gelabelde afbeeldingen zijn van katten en honden of een dataset met informatie over huizenprijzen.
  • Unsupervised learning. Unsupervised Learning is een algoritme dat leert door patronen te herkennen. We leren hier welke soort Unsupervised Learning algoritmen er zijn. Ook leren we welke toepassingen Unsupervised Learning algoritmen hebben. We zullen hierbij enkele voorbeeld cases bespreken.
  • Test set/train set. Voor het goed opzetten van een machine learning model is het heel belangrijk een scheiding te maken in je test en train set. Op deze manier kun je op een unbiased manier je hyperparameters optimaliseren. In deze module leer je waarom je dat doet en op welke manier je dat het beste kan doen.
  • Bias en variance (overfitting). Het creëren van een optimaal machine learning model betekent een goede balans vinden in de complexiteit van het model. Je leert in deze module alles over het optimaliseren van het model en wat de gevolgen zijn van overfitting en underfitting.

Regressie

  • Cost function en gradient descent. Hier leer je alles over hoe machine learning modellen leren. Je leert het concept van de cost function, leert verschillende soorten cost functions en leert wat Gradient Descent is. Ook leer je hoe je optimaal parameters kiest voor Gradient Descent.
  • Lineaire en polynomial regressie in sci-kit learn. In deze module pas je concepten toe voor het voorspellen van huizenprijzen. Je leert de resultaten analyseren en bekijkt hoe goed jouw model het doet met behulp van verschillende cost functions.

Dag 2: Clustering en Classificatie

Clustering

  • K-means. Leer hier alles over het K-means clustering algoritme. Je leert hoe je data clustert op basis van een K aantal centrumpunten en hoe je een optimaal aantal centrumpunten kiest. Ook leer je het nut van data normaliseren of standaardiseren.
  • Clustering toepassen op de Iris dataset. Je past de theorie van K-means clustering toe op de Iris dataset. Hier cluster je de data van de Iris flower data set en leer je clusters herkennen.
  • DBSCAN. Naast K-means leert je over DBSCAN. DBSCAN is een clustering-algoritme dat punten in clusters groepeert op basis van hun nabijheid en dichtheid.

Dag 3: Classificatiemodellen

Tijdens deze dag leer je verschillende algoritmes voor het classificeren van data.

Classificatie

  • KNN. In deze module leer je data classificeren op basis van het KNN (k-nearest neighbors) algoritme. Een algoritme dat leert door te kijken naar dichtbijgelegen datapunten. Je leert hier voor welk soort data en vraagstukken dit algoritme geschikt is. Ook leer je hoe je op een zorgvuldige manier de juiste parameters kiest. Daarnaast leer je alle voor en nadelen van dit algoritme. We sluiten het theorie gedeelte af met uitbreidingen op het algoritme die het algoritme nauwkeuriger maken.
  • Classificatie met diabetes dataset. We passen dit algoritme toe op een dataset met mensen die wel of niet diabetes hebben. De uitdaging is hier om diabetes te kunnen voorspellen aan de hand van verschillende factoren.
  • Precision, recall en F1-score. Wanneer we classificatie algoritmen gebruiken, hebben we goede graadmeters nodig om het algoritme te kunnen beoordelen op kwaliteit. In deze module leer je hoe je dit systematisch kan doen.
  • SVM. In deze module leer je over het SVM (Support Vector Machine) algoritme. Je leert de voordelen van dit algoritme en hoe je systematisch parameters kiest, zodat er geen overfitting ontstaat.

Decision Trees en Regression Trees

  • Information Gain . Leer met de hand decision trees maken door de information gain per splitsing te berekenen. Je leert hiermee de theorie achter information gain en decision trees. Je begrijpt hierdoor op een fundamentele manier hoe dit soort algoritmes werken.
  • Overfitting. Ook decision trees hebben last van overfitting. We leren waarom decision trees overfitten. Ook hier leren we systematisch belangrijke parameters aan te passen.
  • Regression Trees toepassen op regressie probleem. We breiden het concept van Decision Trees uit naar Regression Trees. Hiermee leren we hoe beslisbomen in staat zijn numerieke data te voorspellen.

Extra informatie over de Data Science cursus

  • Je hebt voor deze cursus een eigen laptop nodig om mee te doen. Je kunt van tevoren gratis de Anaconda software downloaden via deze link.
in samenwerking met

PRAKTISCHE INFORMATIE

MAESTRO PRIJS

€ 1.665-

PARTNER PRIJS

€ 1.575,-

CURSUS

Klasikaal

AANTAL DAGEN

1

Datum optie 1
  • 22-09-2025
  • 23-09-2025
  • 24-09-2025
Locatie: Den Haag Datum optie 2
  • 24-11-2025
  • 25-11-2025
  • 26-11-2025
Locatie: Utrecht

DIRECT AANMELDEN

Aanmelden voor Data Science

VOORWAARDEN

  • Partners van de Maestro Academy: Specialisten aangesloten bij Het Finance Gilde, Change Management Community Nederland, Data2Succes, Maestro Business Campus of HeadFirst(Premium overeenkomst);
  • De genoemde prijzen zijn exclusief BTW;
  • De betaling dient vóór aanvang van de eerste trainingsdag volledig te zijn voldaan;