Juni 2016

Hoe voorkom je bottlenecks bij het verwerken van big data?

Op het Big Data Seminar van LCL kregen we een overzicht van de nieuwste generaties processoren, DRAM en SSD’s.
Die werden ook uitgebreid getest, en er werd uitgelegd hoe je alles best configureert om de beste resultaten te krijgen bij het verwerken van big data.


Maar met welke uitdagingen worden zij vandaag de dag geconfronteerd?

 

Alfredo Bonafede van HPE maakte meteen duidelijk wat de inzet is: tegen 2020 zullen er 40 zettabytes (of 40 biljoen GB) aan data online beschikbaar zijn. Dat stelt ons voor ongekende mogelijkheden en uitdagingen.
Die gigantische hoeveelheid data moet beter beveiligd worden, maar ze moet ook beter gebruikt worden.
Vandaag wordt slechts een fractie van de beschikbare data gebruikt om betekenisvolle kennis uit te puren. Maar als je bijvoorbeeld medische gegevensbanken kan ontdoen van alle privacygevoelige gegevens, dan vallen uit die rauwe data heel wat interessante conclusies te trekken.
HPE raadt bedrijven die zich willen verdiepen in big data aan om de architectuur van hun servers volledig te herbekijken. De applicaties om de data te verwerken hebben supersnelle servers nodig die bulken van de rekenkracht, terwijl de data zelf gerust terechtkunnen op storage servers die niet noodzakelijk het neusje van de zalm zijn. Het slim opsplitsen van de serverruimte kan hier een gevoelige besparing betekenen.

Raphael Monten van Intel kwam er de nieuwste versie van de Xeon E5-processor voorstellen.
Die vierde versie biedt vooral een betere performance door de snellere encryptie. Wat interessant is voor bedrijven die met cloudapplicaties werken, is dat de nieuwe processor een veel betere orkestratie van de server resources mogelijk maakt: je kan er meten hoeveel CPU en geheugen de verschillende cloudapplicaties verbruiken, en aan de hand van die performance parameters kan je servers een stuk efficiënter uitbalanceren.
Intel stelde ook hun nieuwste reeks opslagmogelijkheden voor, met name de nieuwste generatie supersnelle flashdrives.

Die nieuwe SSD’s werden meteen onder de loep genomen door Wannes De Smet, IT-researcher bij het Sizing Servers Lab. Hij zette de topmodellen van Intel aan het werk met een realistische workload, zoals je die in een Belgisch bedrijf zou kunnen tegenkomen, en vergeleek de prestaties met die van een bescheidener SSD met een meer democratische prijs per GB.
Een eerste test, waarbij een flinke portie big data geserveerd werd, leidde meteen tot een bijzonder resultaat: de prestatieverschillen bleven verrassend klein. De reden daarvoor ligt bij het feit dat het verwerken van big data niet erg disk-intensief is.
Bij de tweede test, waarbij de SSD’s losgelaten werden op een klassieke transactionele database, waren de verschillen wel significant. Hier lonen de extra euros per GB dus duidelijk wel.

Adrien Viaud van Kingston Technology gaf meer uitleg bij de verbeterde data-integriteit, prestatie en bandbreedte (en het lagere energieverbruik) van de DDR4 DRAM. Hij legde er ook uit welke configuraties tot de beste prestaties leiden, en hoe je dus tot een optimale capaciteit en snelheid van je servers komt.

Johan De Gelas, het hoofd van het Sizing Servers Lab, testte daarop een aantal van die configuraties uit met een echte big data workload.
De CPU bleek de belangrijkste bottleneck te zijn, gevolgd door het geheugen. De storage bleek het minst problematisch. Het is voor bedrijven die actief zijn met big data dus aan te raden vooral te investeren in snelle processors, en daarna in DRAM.
Sizing Servers deelde daarop ook een aantal best practices voor de meest efficiënte configuratie van servers.
Die optimale configuratie is ongeveer 35% sneller dan een standaardconfiguratie out of the box.

De laatste spreker van de dag was onze eigen Managing Director Laurens van Reijen.
Hij gaf er zijn visie op het data center van de toekomst. Waar een data center als LCL nu al een hypergeconnecteerd ecosysteem vormt met bedrijven, netwerkproviders en system integrators, zal de connectiviteit in de toekomst nog toenemen: ook grote data centers zullen nauwer met elkaar gaan samenwerken om het gebruik van de cloud tot het uiterste te drijven. De beveiliging van de data van elke klant blijft uiteraard de hoofdbekommernis van een data center die naam waardig.

 

 

LCL, uw partner voor data center outsourcing