Smart Data People

BI - ABC

Definities en belangrijke begrippen in de wereld van Business Intelligence (BI) en Data Science.

Azure
Microsoft Azure is een continu uitbreidende serie cloudservices om uw organisatie te helpen het hoofd te bieden aan uitdagingen voor uw bedrijf. U krijgt hiermee de vrijheid om toepassingen te ontwikkelen, beheren en te implementeren op een omvangrijk, wereldwijd netwerk met behulp van uw favoriete hulpmiddelen en frameworks.

Big Data
Men spreekt van big data wanneer men werkt met een of meer datasets die te groot zijn om met reguliere databasemanagementsystemen onderhouden te worden. Big data spelen een steeds grotere rol. De hoeveelheid data die opgeslagen wordt, groeit exponentieel.

Business Intelligence
Business intelligence (BI) is gericht op het verzamelen en analyseren van informatie over klanten, beslissingsprocessen, concurrentie, markttoestand en algemene economische, technologische en culturele trends, teneinde beslissingsondersteunende informatie (intelligence) te verkrijgen.

Datawarehouse
Een datawarehouse (vaak afgekort tot DWH) is een gegevensverzameling die in een dusdanige vorm is gebracht dat terugkerende en ad-hocvragen in relatief korte tijd beantwoord kunnen worden zonder dat de bronsystemen zelf daardoor overmatig belast worden.

Database
Een database, gegevensbank of databank is een digitaal opgeslagen archief, ingericht met het oog op flexibele raadpleging en gebruik. Databases spelen een belangrijke rol voor het archiveren en actueel houden van gegevens bij onder meer de overheid, financiële instellingen en bedrijven, in de wetenschap, en worden op kleinere schaal ook privé gebruikt.

Datamart
Een datamart is een verzameling van gegevens, vergelijkbaar met een datawarehouse, maar meestal met een kleinere hoeveelheid aan gegevens en vaak ingericht voor een specifiek doel.

Datamining
Datamining is het gericht zoeken naar (statistische) verbanden in gegevensverzamelingen met als doel profielen op te stellen voor wetenschappelijk, journalistiek of commercieel gebruik.

Data Science
Data Science (Datawetenschap) is een concept om statistieken, data-analyse en aanverwante methoden te verenigen. Het maakt gebruik van technieken en theorieën ontleend uit vele velden binnen het brede gebied van de wiskunde, statistiek, informatiekunde en computerwetenschappen. In het bijzonder de subdomeinen van machinaal leren, classificatie, cluster-analyse, datamining, databases, en visualisatie zijn belangrijke hulpvakken.

Data Vault
Data Vault is een datamodelleringsmethode die voornamelijk in gebruik is bij datawarehousing. Het is bedacht door Dan Linstedt en is speciaal bedoeld voor het opslaan van gegevens uit verschillende bronnen, met verschillende definities en betrouwbaarheid.

DAX
Data Analysis Expressions (DAX) is de formuletaal voor Microsoft PowerPivot, Power BI Desktop en SQL Server Analysis Services (SSAS) Tabular models. DAX bevat functies die gebruikt worden in Excel. Bovendien zijn er functies die gemaakt zijn om te werken met relationele data en het uitvoeren van dynamische aggregaties.

Dimensies
Dimensies verzorgen de context bij feiten. Zij bevatten kenmerken met betrekking tot de feiten, of met betrekking tot de business entiteiten die gerelateerd zijn aan de feiten, zoals: klanten, producten, locaties, medewerkers.

Dimensioneel modelleren
Ralph Kimball ziet het datawarehouse als een dimensionaal gemodelleerde database voor het ondersteunen van query en analysedoeleinden. Binnen een dimensionaal model wordt in hoofdlijnen onderscheid gemaakt tussen twee soorten data (wat resulteerd in twee soorten tabellen binnen het datawarehouse): dimensies en feiten.

ETL
De term ETL is afkomstig uit de databasewereld en staat voor Extract, Transform and Load (oftewel extraheren, transformeren en laden). Het is een proces dat gaat over het afnemen van data uit een externe bron, het omvormen tot een hanteerbaar formaat en het laden ervan in een datamart of datawarehouse.

Feiten(Facts)
Feiten zijn kengetallen over business processen (aantallen, bedragen, berekende waarden, zoals percentages). In plaats van feiten spreekt met ook wel van meetwaarden. Feiten kunnen geaggregeerd worden: het totaal, of de laagste, hoogste, gemiddelde waarde kunnen bepaald worden van de genoemde getallen over een bepaalde selectie (bijvoorbeeld: per klant per week).

Foreign key
Foreign Keys (oftewel verwijzende sleutels) duiden relaties aan tussen twee tabellen in een database. Een waarde in een tabel zal verbonden worden met een andere tabel door twee waardes altijd overeen te laten komen.

Granulariteit
Granulariteit is een term die bij het ontwerpen van datawarehouses wordt gebruikt, ze geeft aan in welke mate er detail-gegevens van de entiteiten aanwezig zijn. Een lagere granulariteit geeft aan dat er -op een zeker niveau- minder details worden opgeslagen.

MDX
MDX(Multidimensional Experssions) is een query taal voor OLAP kubussen. Je kunt er ook berekeningen mee uitvoeren.

Microsoft PowerPivot
PowerPivot is een Excel-invoegtoepassing die kunt u krachtige gegevensanalyses en uitgebreide gegevensmodellen te maken. Met Power Pivot, kunt u grote hoeveelheden gegevens uit verschillende bronnen, uitvoeren van gegevens te analyseren snel en eenvoudig inzichten te delen.

Microsoft SQL Server
Microsoft SQL Server is een relationeel databasebeheersysteem ontwikkeld door Microsoft. Het wordt algemeen gebruikt door organisaties voor kleine tot middelgrote databases.

Multidimensionaal data model
Een multidimensionaal data model bestaat uit logische kubussen, metingen, dimensies en hiërarchieën. Het belangrijkste kenmerk van een multidimensionaal data model is de eenvoudigheid. De taal waarmee dit data model aangesproken kan worden is MDX.

Mysql
MySQL is een propriëtair opensource-managementsysteem voor relationele databases (RDBMS). SQL is de taal die wordt gebruikt om een database van dit systeem op te bouwen, te bevragen en te onderhouden. MySQL werd allereerst vooral gebruikt voor internettoepassingen zoals fora en gastenboeken, meestal in combinatie met PHP. MySQL vormt de basis van vele internettoepassingen en standalone software.

Normaliseren
Normalisatie is het proces van het ordenen van gegevens in een database. Dat betreft het maken van tabellen en het leggen van relaties tussen die tabellen op basis van regels die als doel hebben de gegevens te beveiligen en de database flexibeler te maken door redundantie en inconsistente afhankelijkheid te voorkomen.

NoSQL
NoSQL is de verzamelnaam voor tegenhangers van de SQL-standaard op gebied van databases, maar wordt door IT-managers vaak niet goed begrepen. De term suggereert namelijk een categorie van anti-SQL of anti-relationele databaseproducten, maar betekent Not Only SQL
OLTP
OLTP (OnLine Transaction Processing) is groep programma's die in realtime (echttijd) invoer, opslag en terug halen van data naar-van een netwerk gebaseerd systeem.

PowerBI
Microsoft Power BI is een interactieve tool voor het visualiseren van data, ontwikkeld en uitgegeven door het Amerikaanse softwarebedrijf Microsoft. Het doel is om business intelligence beschikbaar te maken voor de eindgebruiker. Met Microsoft Power BI kunnen verschillende soorten data gecombineerd worden, om in een visueel dashboard managementinformatie weer te geven. Power BI is beschikbaar als Software as a Service (SaaS) en als onderdeel van de Microsoft Office 365-suite.
www.powerbi-microsoft.com

Primary key
De primary key, ofwel primaire sleutel, identificeert ieder record in een tabel. De primary key zorgt ervoor dat ieder veld dat ingevoerd wordt niet leeg mag zijn en dat het een unieke waarde heeft. Per tabel kan er maximaal één primary key gedefinieerd worden.

Python
Python is een programmeertaal die ontwikkeld is door Guido van Rossum en de Python gemeenschap. Python is gericht op eenvoud en leesbaarheid, en is daardoor snel te leren.
www.python.org

R
R is een programmeertaal en omgeving voor statistische analyse en grafische presentatie van gegevens.
www.r-project.org

Relationele database
De gegevens in een relationele database worden opgeslagen in tabellen waarin de rijen de soortgelijke groepen informatie, de records vormen, en de kolommen de informatie die voor elk record moet worden opgeslagen. Verschillende tabellen kunnen met elkaar worden verbonden door een kolom toe te voegen waarin een verwijzing naar een record in een andere tabel wordt opgenomen.

Qlikview
QlikView is een platform voor Business Discovery dat selfservice-BI biedt voor alle professionele gebruikers in organisaties. Met QlikView kunt u gegevens analyseren en uw gegevensdetecties gebruiken ter ondersteuning van de besluitvorming.

Query
Met een query wordt in de informatica een opdracht bedoeld die aan een database wordt gegeven om een bepaalde actie uit te voeren, die ook potentieel gegevens teruggeeft. Tegenwoordig wordt de term ook gebruikt voor een zoekstring die in een zoekmachine wordt ingevoerd.

Snowflake
Een snowflake schema is een variatie van een sterschema, waarbij de dimensie tabellen volledig worden genormaliseerd. Een snowflake schema wordt gerepresenteerd door centrale feitentabellen, die verbonden zijn met meerdere dimensies. Wanneer de normalisatie van de dimensies compleet is, zal de structuur van je tabellen de vorm van een sneeuwvlok hebben.

SQL
SQL (Structured Query Language) is een ANSI/ISO-standaardtaal voor een relationeel databasemanagementsysteem (DBMS). Het is een gestandaardiseerde taal die gebruikt kan worden voor taken zoals het bevragen en het aanpassen van gegevens in een relationele database. SQL kan met vrijwel alle moderne relationele databaseproducten worden gebruikt.

SQL Server Analyzing Services (SSAS)
Microsoft SQL Server Analysis Services, SSAS, is een online analytical processing (OLAP) en data mining tool in Microsoft SQL Server. SSAS wordt gebruikt bij het organiseren en analyseren van databases.

SQL Server Integration Services (SSIS)
SQL Server Integration Services (SSIS) is een ETL (Extract, Transform, Load) tool waarmee we data kunnen overhalen naar een Datawarehouse en tegelijkertijd de data kunnen aanpassen aan de eisen van het datawarehouse.

SQL Server Management Studio (SSMS)
SQL Server Management Studio (SSMS) is een computerprogramma voor het eerst meegeleverd met Microsoft SQL Server 2005 dat gebruikt wordt voor het configureren en beheren van alle componenten van Microsoft SQL Server. Het programma bevat scriptbewerkers en grafische gereedschappen die met objecten en functies van de server werken.

SQL Server Reporting Services (SSRS)
SQL Server Reporting Services (SSRS) is een geavanceerde rapportageoplossing. SSRS wordt standaard meegeleverd met SQL Server van Microsoft. Met Reporting Services kun je rapporten maken op basis van gegevens uit vrijwel alle soorten databases.

Sterschema
In de informatica is een sterschema (ook wel ster-joinschema, datakubus of multi-dimensionaal schema) de eenvoudigste vorm van een datamart-schema. Het sterschema bestaat uit een of meer feitentabellen die refereren aan een willekeurig aantal dimensietabellen.

Tableau
Tableau is één van de bekendste vertegenwoordigers van de trend die “selfservice BI” wordt genoemd. Het is de trend waarbij eindgebruikers in organisaties zelf aan de slag gaan met Business Intelligence oplossingen en data-analyse.
www.tableau.com

Transact SQL
T-SQL is een dialect van SQL.