ODPi runtime spec streeft naar Hadoop defragmenteren

De Open Data Platform-initiatief (ODPi) heeft haar eerste Runtime specificatie aangekondigd, en de bijbehorende test suite voor Hadoop. Gericht op het creëren van een universele spec voor de kern componenten in een Hadoop distributie, om te standaardiseren, versnippering en het maximaliseren van de compatibiliteit, de ODPi Runtime maakt zijn debuut vandaag na veel fanfare, weer meer dan een jaar te gaan.

Afgeleid van Apache Hadoop 2.7, de runtime-specificatie is voorzien van HDFS, garen en MapReduce componenten en maakt deel uit van de gemeenschappelijke referentie platform ODPi Core.

Initial controverse, toen het begon, de ODPi was enigszins gehinderd door een samenzweringstheorie – dat de organisatie was een vehikel voor Hortonworks (een dominante medeoprichter, samen met Pivotal) te standaardiseren Hadoop rond zijn eigen distro, de Hortonworks Data Platform (HDP ). ODP was in feite gebaseerd op de kern van de HDP (en slechts één brief af van het), en zelfs inclusief Apache Ambari die weliswaar een Apache open source project, was en is toch Hortonworks ‘technologie, en niet gebruikt door Cloudera of MapR.

Misschien voorspelbaar, wat verschil van mening volgde. Mike Olson van Cloudera geblogd over het verzet van de onderneming om de ODPi (toen bekend als ODP) en vond dat het weergegeven minachting voor het bestuur van de Hadoop project van de Apache Software Foundation. MapR was ook unenthused. IBM en SAS, ondertussen, toegetreden tot het consortium, net als Altiscale, en diverse andere bedrijven, waaronder CapGemini.

Evolutie, maar een aantal positieve veranderingen tot stand is gekomen, met inbegrip van branding (ODP is nu bekend als ODPi), bestuur (het project verplaatst onder de paraplu van de Linux Foundation) en leiderschap (Hortonworks nam een ​​achterbank rol, en diverse andere bedrijven – er In totaal zijn nu meer dan 25 – ondertekend).

En nu dat de Runtime spec is vrijgegeven, ontdekken we dat ODPi wijselijk besloten om Ambari definiëren als niet-kernactiviteiten – “. Operations Specification” met inbegrip van het in plaats daarvan in een complementaire Dat is een slimme, consensus zet. Ongetwijfeld, moet het een deel van de eerste inval de ODPi zijn geweest – maar in ieder geval het is er nu.

Waarom het belangrijk is; Hadoop distributies hebben tal van componenten, elk met een lange geschiedenis release, waardoor voor een groot aantal permutaties. Dat schept voor rekening en lange proefcyclussen voor ISV’s op zoek om de compatibiliteit te garanderen. En als het is moeilijk voor de ISV’s die gespecialiseerd zijn in het Hadoop ruimte, voorstellen hoe de arme klanten voelen.

Decennia geleden, UNIX was een populaire besturingssysteem, in stelling met DOS en Windows voor dominantie in wat we zijn gekomen aan de onderneming te bellen. Maar het aantal UNIX varianten was enorm en de resulterende klant verwarring is schadelijk voor het besturingssysteem. Terwijl de Hadoop ecosysteem is anders, moeten de deelnemers waakzaam in het voorkomen van een soortgelijk lot te zijn.

Ik ben niet bereid om geld te wedden dat Cloudera, MapR en Amazon zal overwegen om hun distributies ODPi-compliant. Maar ik ben bereid om te wedden dat als ze dat deden, de big data-industrie zou worden geholpen.

LinkedIn onthult haar nieuwe blogging platform

Is dit de leeftijd van Big OLAP?

DataRobot streeft naar laaghangend fruit van data science automatiseren

MapR oprichter John Schroeder treden naar beneden, COO te vervangen

Social Enterprise; LinkedIn onthult haar nieuwe blogging platform; Big Data Analytics, Is dit de leeftijd van Big OLAP;? Big Data Analytics; DataRobot gericht op low-opknoping fruit van de gegevens wetenschap te automatiseren; Big Data Analytics; MapR oprichter John Schroeder treden naar beneden, COO te vervangen