Voor het maken van BI rapportages worden veelal interne databronnen gebruikt. Denk hierbij aan data uit CRM (Custom Relationship Management) of ERP (Enterprise Resource Planning) systemen. Het kan soms nuttig zijn om interne met externe data te combineren. Dit kan zorgen voor nieuwe inzichten. Een voorbeeld is een leverancier van ijsjes die zijn voorraadbeheersysteem (interne data) kan koppelen aan de weersverwachting (externe data) om op deze manier tot een optimaal productieniveau te komen. In dit artikel laten we zien hoe we informatie van Wikipedia kunnen gebruiken als input voor data analyse in Power BI.
Wikipedia als externe databron
Wikipedia is een online encyclopedie. Het stelt een enorme hoeveelheid data en informatie gratis ter beschikking. Het inlezen van deze data in een BI-tool is eenvoudig, omdat de meeste informatie in tabellen is opgenomen. In dit artikel laten we zien hoe we de gegevens van de pagina ‘de hoogste gebouwen ter wereld’ kunnen inlezen.
Ga allereerst naar de pagina: //nl.wikipedia.org/wiki/Lijst_van_hoogste_gebouwen_ter_wereld. Op deze pagina worden de 25 hoogste gebouwen ter wereld getoond. Kopieer de URL en start vervolgens Microsoft Power BI op.
Ga vervolgens naar de startpagina en kies ‘Gegevens ophalen’ > ‘Web’. Plak vervolgens de URL in het venster en klik op ‘OK’. In het scherm dat volgt kunt u aangeven dat u anoniem wilt inloggen. Klik op ‘Verbinden’. Er verschijnt een overzicht van alle tabellen die zich op de pagina bevinden, waaronder de tabel ‘Hoogste gebouwen ter wereld’. Klik deze tabel aan en klik op ‘Laden’.

De externe data wordt ingelezen en ziet er vervolgens als volgt uit in Power BI:

Visualiseren met Power BI
Door middel van een kaartweergave kunnen we laten zien waar de 25 hoogste gebouwen zich op de wereld bevinden. Ga hiervoor naar ‘Rapport’ en kies ‘Kaart’ als visualisatie. Klik het veld ‘Locatie’ aan. Op de wereldkaart wordt weergegeven waar de 25 hoogste gebouwen zich bevinden. In één oogopslag is duidelijk dat de meest hoge gebouwen zich bevinden in Azië.
