Whitebox Woordenboek
Alle vaktermen die we gebruiken hebben we hier opgenomen voor zij die geïnteresseerd zijn.
Lijst van diensten
-
Anscombe’s quartet Een viertal datasets met nagenoeg dezelfde beschrijvende statistieken maar met erg verschillende dataAnscombe’s quartet
-
Lineaire regressie Statistische methode om mogelijke samenhang tussen variabelen te analyserenLineaire regressie
-
Natural Language Processing (NLP) / Natuurlijke taalverwerking Het begrijpen en verwerken van menselijke taalNatural Language Processing (NLP) / Natuurlijke taalverwerking
-
Support Vector Regression (SVR) Een uitbreiding van het Support Vector Machine algoritme voor regressieproblemen.Support Vector Regression (SVR)
-
Random Sample Een willekeurige selectie van observaties uit een populatie, waarbij elke observatie evenveel kans heeft om gekozen te worden.Random Sample
-
Naive Bayes Algoritme dat op probabilistische methode classificaties doetNaive Bayes
-
Natural Language Generation (NLG) Een tak van kunstmatige intelligentie die teksten genereert in menselijke taal op basis van gegevens of input van een gebruiker.Natural Language Generation (NLG)
-
K-Nearest Neighbors (KNN) K-Nearest Neighbors (KNN) is een eenvoudige, effectieve machine learning techniek voor classificatie.K-Nearest Neighbors (KNN)
-
Decision Tree Decision Tree is een visuele representatie van beslissingsprocessen, waarbij elke tak een mogelijke uitkomst weergeeft, gebaseerd op inputcriteria.Decision Tree
-
K-Nearest Neighbors (KNN) K-Nearest Neighbors is een eenvoudige, maar krachtige machine learning techniek voor classificatie en regressie.K-Nearest Neighbors (KNN)
-
Decision Boundary Een lijn of vlak die verschillende klassen in een dataset aanduidt op basis van eigenschappen.Decision Boundary
-
Cross-Validation Cross-Validation is een techniek om de prestaties van machine learning-modellen te evalueren.Cross-Validation
-
Clusteranalyse Analyse met grote hoeveelheden data gegroepeerd op basis van overeenkomstenClusteranalyse
-
Hoofdcomponentanalyse (PCA) PCA is een statistische techniek die de dimensionaliteit van een dataset vermindert en belangrijke variabiliteit behoudt.Hoofdcomponentanalyse (PCA)
-
Bagging Bagging is een ensemble-leermethode die meerdere modellen traint op verschillende data-subsets om nauwkeurigheid en stabiliteit te verbeteren.Bagging
-
Hoofdcomponentanalyse (PCA) Hoofdcomponentanalyse (PCA) is een statistische techniek die helpt bij het vereenvoudigen van grote datasets.Hoofdcomponentanalyse (PCA)
-
Tijdsreeksvoorspelling Tijdsreeksvoorspelling is het proces van het gebruiken van historische data om toekomstige waarden van een variabele te schatten.Tijdsreeksvoorspelling
-
Ensemble Learning Ensemble Learning is een machine learning techniek waarbij meerdere modellen worden gecombineerd om de prestaties te verbeteren en robuustere voorspellingen te genereren.Ensemble Learning
-
Vehicle Routing Problem (VRP)Vehicle Routing Problem (VRP)
Vehicle Routing Problem (VRP) of moelijker nog Multi-Depot Vehicle Routing Problem (MDVRP) is een optimalisatieprobleem waarbij er meerdere depots en voertuigen zijn die aan verschillende klanten moeten leveren.
-
Herverdeling van data Het proces waarbij data opnieuw wordt georganiseerd of herschikt in een andere structuur of indeling om de bruikbaarheid en toegankelijkheid te verhogen.Herverdeling van data
-
Feature Selection Feature Selection is het proces van het selecteren van de meest relevante variabelen uit datasets.Feature Selection
-
K-Means Clustering K-Means Clustering is een populaire techniek binnen machine learning voor het groeperen van gegevens in clusters op basis van overeenkomsten.K-Means Clustering
-
Support Vector Machines (SVM) Algoritme dat zowel als supervised en unsupervised word ingezet om data zo goed als mogelijk onder te brengen in een klasse.Support Vector Machines (SVM)
-
Blackbox Een systeem waarvan de werking onbekend isBlackbox
-
Supervised en Unsupervised Learning Methoden om patronen en inzichten te ontdekken.Supervised en Unsupervised Learning
-
Vehicle Routing Optimization Vehicle Routing Optimization is het proces van het verbeteren van de routes die voertuigen nemen om leveringen te optimaliseren, kosten te verlagen en de tevredenheid van klanten te verhogen.Vehicle Routing Optimization
-
Feature Engineering Het proces van het selecteren, aanpassen of creëren van variabelen uit ruwe data om machine learning modellen te verbeteren en nauwkeuriger te maken.Feature Engineering
-
Tijdreeksanalyse Tijdreeksanalyse is een techniek om trends en patronen in gegevens over de tijd te identificeren.Tijdreeksanalyse
-
Data Engineering Data engineering is het proces van het ontwerpen, bouwen en onderhouden van de infrastructuur die nodig is om gegevens te verzamelen, op te slaan en te verwerken.Data Engineering
-
Hyperparameter Een hyperparameter is een instelling die voorafgaand aan het leerproces van machine learning-algoritmes wordt bepaald.Hyperparameter
-
Feature Scaling Feature Scaling is een techniek in machine learning die ervoor zorgt dat verschillende variabelen op een vergelijkbare schaal staan, waardoor modellen beter presteren en sneller convergeren.Feature Scaling
-
Neurale Netwerken Neurale netwerken zijn computationele modellen geïnspireerd door de werking van de menselijke hersenen, gebruikt voor patroonherkenning, classificatie en regressie.Neurale Netwerken
-
Gradient Boosting Gradient Boosting is een ensemble leermethode die sequentieel zwakke voorspellende modellen combineert, meestal beslissingbomen, om een krachtige predictief model te creëren.Gradient Boosting
-
Convolutionele Neurale Netwerken (CNNs) CNN's zijn algoritmes in deep learning, ontworpen voor het analyseren van visuele data.Convolutionele Neurale Netwerken (CNNs)
-
Confusie Matrix Een tabel die de prestaties van een classificatie-algoritme toont door ware positieven, valse positieven, ware negatieven en valse negatieven in kaart te brengen.Confusie Matrix
-
Correlatie Correlatie is een statistische maatstaf die de sterkte en de richting van een lineaire relatie tussen twee variabelen aangeeft.Correlatie
-
Time Series Decompositie Een techniek voor het analyseren van tijdreeksen door de gegevens op te splitsen in componenten zoals trend, seizoensgebonden variaties en willekeurige fluctuaties.Time Series Decompositie
-
Random Forest Machine learning methode die veel gebruikt wordt voor het oplossen van zowel classificatie als regressie problemen.Random Forest
-
Hyperparameter Tuning Hyperparameter tuning is het proces waarbij de instellingen van een machine learning-algoritme worden geoptimaliseerd om de modelprestaties te verbeteren.Hyperparameter Tuning