Eén van de nieuwste trends op het gebied van internet innovaties is de aandacht voor big data. Deze term staat voor het verzamelen, analyseren en gebruiken van de enorme hoeveelheid data die door de komst van computers en internet voorhanden is. Op deze pagina vindt u een overzicht van de beste gratis big data software.
Apache Spark is een open source cluster raamwerk. Het pretendeert data 100X sneller te verwerken dan Hadoop MapReduce in geheugen en 10X sneller op schijf. De software ondersteunt populaire ontwikkelingstalen waaronder R, Spark SQL, Python, Java en Scala.
Met meer dan 500 programmeurs die over heel 2014 toevoegingen hebben ingestuurd is Spark het meest actieve project van de Apache Software Foundation.
De software van Apache Spark wordt ingezet door internetgiganten als Baidu, Yahoo en Tencent om big data te verzamelen en analyseren.
Apache Spark heeft de volgende kenmerken:
Website van de makers van Apache Spark
website van Apache Spark direct naar Apache Spark download pagina
Hadoop is de basis van bijna alle open source ontwikkelingen op het gebied van big data. Het wordt beheerd door de Apache Software Foundation.
Dit project fungeert als raamwerk voor het verwerken van grote hoeveelheden digitale data. Daarbij is het zo ontwikkeld dat het makkelijk schaalbaar is van één naar wel duizenden servers. Mankementen in hardware onderdelen worden daarbij automatisch opgevangen door de rest van het systeem.
Hadoop wordt gebruikt door nagenoeg alle grote internetbedrijven waaronder LinkedIn en Facebook.
De onderstaande screenshots zijn van Hue, dit is één van de populairste gratis gebruikersomgevingen voor Hadoop.
Hadoop heeft de volgende kenmerken:
Hadoop screenshots
Website van de makers van Hadoop
website van Hadoop direct naar Hadoop download pagina
GridGain is een open source Java tool dat het real-time verwerken van big data mogelijk maakt.
GridGain heeft de volgende kenmerken:
GridGain screenshots
Website van de makers van GridGain
website van GridGain direct naar GridGain download pagina
Apache Storm wordt vaak omschreven als de "Hadoop van real-time". Het werkt met nagenoeg alle programmeertalen. Het programma is voor real-time big data verwerking wat Hadoop is voor batch verwerking.
Het Storm project was ooit in handen van Twitter na de overname van BackType, een social media statistieken organisatie. In 2011 is de software voor iedereen gratis beschikbaar gesteld onder een open source licentie.
Apache Storm heeft de volgende kenmerken:
Apache Storm screenshots
Website van de makers van Apache Storm
website van Apache Storm direct naar Apache Storm download pagina
Op de website van de ontwikkelaars van deze gratis software kunt u meer informatie vinden en kunt u de software downloaden.