Kennisportal
Kennisportal is een kennisplatform met een focus op de brede doelgroep Business en IT.

Ruwe data verzamelen met een data lake

De voordelen en uitdagingen van data lakes met Hadoop

Dat er uit data veel waarden valt te halen hoeven we u niet meer te vertellen. Waar u misschien nog niet van op de hoogte was, is dat het de trend is om zo veel mogelijk ruwe data te verzamelen. Hierdoor kunnen BI-experts nog meer conclusies uit de data trekken. Dit is een mogelijkheid door het inzetten van een data lake of data hub. Wat is een data lake, wat zijn de voordelen en welke valkuilen kunt u als gebruiker tegenkomen? Lees snel verder!

Waarom ruwe data verzamelen?

Bij een data lake, worden alle te analyseren datasets geladen in Hadoop. Dit is een open-source systeem waar data kunnen worden opgeslagen, verwerkt en geanalyseerd. De ingeladen gegevens zijn ruwe data voordat ze de Hadoop-infrastructuur in gaan. Een groot voordeel hiervan is dat zo min mogelijk informatie verloren gaat. Het kan natuurlijk zijn dat data die nu nog niet relevant is, later nog wel relevant kan worden.

Welke data gaat naar een data lake?

Soorten data die momenteel naar een data lake gaan zijn:

  • Logs van machines en sensordata (IoT)
  • Klantgedrag
  • Social media acties
  • E-mails
  • Geolocatie-data
  • Afbeeldingen, audio & video
  • Transacties (ERP, CRM, SCM)

Uitdagingen data lake

Een data lake lijkt veel voordelen te hebben, maar waarom gebruikt dan niet elk bedrijf een data lake? De uitdaging is dat Hadoop niet berekend is op data lakes. De mogelijkheden zijn helaas wat te beperkt. Dit heeft als gevolg dat organisaties niet weten hoe ze er voordeel uit kunnen halen en hoe ze analytische applicaties kunnen ontwikkelen. Dit is toch uiteindelijk het voordeel voor de eindgebruikers. Deze whitepaper gaat dieper in op dit probleem en geeft de juiste oplossing voor uw ruwe data.

Is alleen Hadoop genoeg voor u?

Als u meer wilt doen met data, dan moet u uzelf de vraag stellen of uw organisatie genoeg heeft aan Hadoop of dat aanvullende tools toch een rol kunnen spelen. Deze whitepaper geeft u een indruk of u nog up-to-date bent of dat u toe bent aan de volgende stap op het gebied van big data analytics.