Kennisportal
Kennisportal is een kennisplatform met een focus op de brede doelgroep Business en IT.

West Perth is meest paradijselijke plek ter wereld

Heb je er ooit van gedroomd om ergens te wonen waar het openbaar vervoer gratis is? Of waar de meeste selfmade miljonairs wonen? Misschien een plek waar er voor iedere inwoner het equivalent van vijf tennisbanen aan groengebied is en 84.274,6 kilometer aan wandelpaden is? Dat heb je allemaal in West Perth! Deze kleine, opkomende gemeente in de West-Australische stad Perth is de beste plaats ter wereld om te wonen, in elk geval vanuit analytisch perspectief.

Dit resultaat is niet vastgesteld door vragenlijsten of bestaande lijsten met criteria, maar uitsluitend door objectieve data. SAS onderzocht bijna 150.000 locaties in 193 landen voor het Paradise Found-project. In totaal analyseerden de data scientists van SAS meer dan 5 miljoen datapunten van 1.124 unieke databronnen. Dit omvatte zowel gestructureerde als ongestructureerde data (bijvoorbeeld in de vorm van teksten van statistiekbureaus). Het bronmateriaal bestond verder uit diverse open databronnen, waaronder stadsonderzoeken, sociale media (onder andere TripAdvisor en Twitter), data van internationale organisaties zoals de Wereldbank, UNESCO, WTOI, Numbeo en de EU, en geodata-services zoals Google Places en OpenStreetMap.

Het bewerken van de data en het gebruik van krachtige data management software van SAS hielpen bij het opschonen, structureren en prepareren van de data. Meer informatie over onze aanpak van de uitdagingen ten aanzien van de verscheidenheid en het volume van de data zal binnenkort verschijnen in een blog van mijn collega Rein Mertens.

Machine learning

Volgende stap: door het gebruik van machine learning, dat het krachtige, flexibele en open SAS Platform mogelijk maakt, werden de ontbrekende waarden voor de individuele locaties vastgesteld. Vervolgens werd een voorspellingsmodel ontwikkeld dat locaties voorspelt, die worden beoordeeld als goede plaatsen om te wonen. Hieruit volgden de 69 belangrijkste criteria en werden 8 categorieën geïdentificeerd: ‘Opleiding en carrière’, ‘Familie’, ‘Cultuur’, ‘Natuur’, ‘Veiligheid en infrastructuur’, ‘Kosten van levensonderhoud’, ‘Restaurants en winkels’ en ‘Gezondheid’. SAS Visual Data Mining en Machine Learning en SAS Visual Analytics werden gebruikt voor de analyse en de datavisualisatie.

Zelflerend in plaats van aangenomen model

Wat is er zo interessant aan Paradise Found? Normaal concentreren we ons op de vragen van onze klanten als we aan een analytisch traject beginnen. Deze keer bedachten we de opdracht zelf: de beste plaats ter wereld ontdekken om te wonen, werken en leven. We hebben alle beschikbare gegevens verwerkt en vervolgens machine learning algoritmen laten bepalen welke criteria echt belangrijk zijn. De data spreken voor zich, het is geen vooropgezet model. Waar het om gaat, is een reeks algoritmen die leren van data in plaats van een aangenomen model te gebruiken,” stelt Edwin Peters pre-sales director bij SAS.

Paradise Configurator
Nu weet je dus wat objectief de beste plaats ter wereld is volgens onze analytische beoordeling. Maar misschien hecht jij niet dezelfde waarde aan carrièrekansen, familie, aantal uren zonneschijn, inkomen of cultureel aanbod. Daarom hebben we de Paradise Configurator gemaakt. Hiermee kan iedereen makkelijk en snel zijn persoonlijke paradijs op aarde bepalen. Door het wegen van persoonlijke voorkeuren of aangepaste zoekcriteria.

Schaalbaarheid

Paradise Found is een voorbeeld van een project dat nu eenmalig is uitgevoerd. Maar de data die als basis is gebruikt, zoals over het klimaat of de economische omstandigheden, is aan verandering onderhevig. Herhaalbaarheid wordt dan belangrijk en je zou het hele proces moeten kunnen automatiseren. Daarnaast komen nieuwe vragen op en zijn er nieuwe praktijkcases die moeten worden opgelost. Hiervoor moet het platform mee kunnen schalen. Het SAS Platform is ontwikkeld met schaalbaarheid en herhaalbaarheid als uitgangspunt om zo analytics, machine learning en artificial intelligence voor organisaties toepasbaar te maken.

Toepassingen in het bedrijfsleven

“Paradise Found is een mooi voorbeeld van wat analyse en machine learning kunnen doen: patronen in data vinden vanuit een volkomen objectief perspectief. Natuurlijk is het leuk om te weten waar de meeste paradijselijke plek ter wereld zich bevindt, maar veel belangrijker zijn de toepassingen van analytics in het bedrijfsleven. Hier is het een essentieel hulpmiddel om nieuwe kansen en bedrijfsmodellen te ontdekken. Dit is slechts één voorbeeld, maar als je dit op een herhaalbare wijze kunt uitvoeren dan heb je een daadwerkelijke toepassing van artificial intelligence,” zegt Edwin Peters.

Wil SAS zich met dit onderzoek op de toeristische industrie richten? Helemaal niet. We willen aan de hand van dit voorbeeld laten zien wat de mogelijkheden zijn van data-analyse in combinatie met machine learning. Of het nu gaat om het vinden van de beste plaats ter wereld, het vinden van de beste klant, opsporen van fraude of optimaliseren van productieprocessen. Elk bedrijf kan zijn voordeel doen met data-analytics en machine learning, ongeacht welke branche.