Hadoop Tutorial for Beginners | Cloudera Quickstart VM | Cloudera Hadoop Tutorial 2020
Cloudera a dezvăluit un nou set de instrumente de management Hadoop, numit Cloudera Enterprise, că societatea va oferi o taxă anuală de abonament, a anunțat marți. De asemenea, a actualizat pachetul de distribuție open-source al companiei Hadoop.
Ambele versiuni noi, precum și câteva noi parteneriate cu furnizorii de furnizori de software pentru managementul datelor, arată că compania se pregătește să ofere tehnologia de baze de date emergente - de către giganți web precum Google și Yahoo - la piața întreprinderilor ca alternativă la bazele de date relaționale.
"Pariul nostru nu este numai companiile mari de pe Web, ci băncile, spitalele și companiile de asigurări vor descoperi că trebuie să analizeze complexe și structurate date împreună, iar Hadoop a fost făcut pentru asta ", a declarat directorul executiv al companiei Cloudera, Mike Olson. "Hadoop rezolvă o nouă problemă într-un mod nou."
Unul dintr-un număr tot mai mare de baze de date non-SQL sau NoSQL, Hadoop se bazează pe Google MapReduce, un cadru pentru prelucrarea datelor paralele pe un număr mare de computere noduri. Hadoop, dezvoltat acum ca un proiect open-source de către Apache Software Foundation, oferă o alternativă la bazele de date tradiționale relaționale, cel puțin pentru acele cazuri de analiză a unor seturi de date mari, care se schimbă rapid.
Se poate lucra atât cu SQL, - datele SQL și sunt mai rezistente la erorile serverului decât bazele de date relaționale, a declarat Olson.
Cloudera este un ambalaj Hadoop pentru organizațiile de nivel mediu, atât cu distribuția Hadoop, cât și cu noul său set de instrumente de management. Ambele pachete ar trebui să permită organizațiilor fără prea multă experiență tehnică în Hadoop să ruleze software-ul, a spus Olson. "Există acest mit că Hadoop este utilizabil dacă aveți date scalate de Google. Există mulți utilizatori care au doar câțiva terabytes de date pe care doresc să le analizeze", a spus Olson
Cloud's Distribution for Hadoop (CDH) este un pachet open source cu programe software pre-integrate, construit în jurul Hadoop Common, denumit anterior Hadoop Core. Pachetul include: stup, care oferă o infrastructură de depozit de date; HBase, baza de date bazată pe Hadoop; Pig, un compilator pentru programe de reducere a hărții; Zookeper, programare pentru rularea aplicațiilor pe mai multe servere și MapReduce.
În versiunea 3 recent lansată, pachetul include trei programe pe care compania le-a lansat ca proiecte open-source, sub licența Open source pentru Apache V2. Una este Flume, care poate ajuta la încărcarea datelor în Hadoop. O altă adăugare nouă este Oozie, care este un software de management al fluxului de lucru. Ultimul este codul Hadoop User Environment (HUE), care oferă o interfață de utilizator pentru gestionarea lui Hadoop.
"HUE permite oricui să construiască aplicații destinate analiștilor și să știe cum să vorbească cu clusterele Hadoop", a spus Olson.
Pachetul Cloud Enterprise cuprinde versiunea CDH 3 cu instrumente suplimentare de gestionare. Acest nou software, care nu este open source, permite administratorilor să controleze gestionarea accesului prin utilizarea protocolului Lightweight Directory Access Protocol. Programele sunt de asemenea furnizate resurselor de aprovizionare, pentru a face monitorizarea configurației și a performanței.
Olson nu va discuta cât de mult a făcut Cloudera din taxele de abonament și de consultanță până în prezent, dar constată că în primul trimestru al anului 2010, ceea ce a câștigat până la jumătatea anului 2009. Între diferite industrii, serviciile financiare, telecomunicațiile, comerțul cu amănuntul, guvernul și companiile de comerț web au manifestat un interes în această tehnologie, a spus Olson
"Lucrurile pe care companiile le fac cu Hadoop variază. în general, acești oameni captează o mulțime de date din multe locuri și trebuie să-l supună unor analize sofisticate ", a spus Olson. "Serviciile financiare sunt interesate să utilizeze Hadoop pentru detectarea fraudei. În domeniul telecomunicațiilor, există o nevoie reală de a optimiza rețelele și de a reduce churnul clienților."
În plus față de oferirea acestor pachete, Cloudera a oferit suport pentru Hadoop de la furnizorii de software de business intelligence (BI) și de management al datelor.
Olson intenționează să anunțe, în timpul conferinței sale de la Hadoop Summit 2010, California, marți, că vânzătorul BI MicroStrategy va sprijini utilizarea Hadoop.
Un alt partener nou este Talend, furnizor de software de integrare a datelor open source. Compania și-a extins Talend Integration Suite pentru interfața cu bazele de date Hadoop. Suita permite administratorilor să gestioneze și să agregeze mai multe surse de date dintr-o singură consolă. Cu programul Hadoop, software-ul "poate să introducă sau să recupereze date și să proceseze datele în cadrul arhitecturii Hadoop", a declarat vicepreședintele marketingului Talend, Yves de Montcheuil.
Microstrategy și Talend se alătură unui număr tot mai mare de companii pregătește open source sau instrumente de management comercial pentru Hadoop. Săptămâna trecută, Cloudera și Quest s-au angajat într-un proiect pentru a construi un software care să lege Hadoop cu bazele de date Oracle. În luna mai, Pentaho a anunțat că suita BI va funcționa cu bazele de date Hadoop.
Într-un interviu separat cu IDG News Service, CTO-ul Yahoo Raymie Stata a subliniat că Hadoop ar putea reduce nevoia de construire a supercomputerelor pentru a analiza seturi mari de date. În mod tradițional, seturile mari de date au fost mutate din spațiul de stocare în supercomputer, care este un set de servere cumulate, care urmează să fie analizate. În schimb, Hadoop mută calculul analitic la locul în care se află datele, eliminând necesitatea unei mașini centrate, numeroase, numeroase. Yahoo a fost un prim factor care a contribuit la Hadoop.
În plus față de oferta oferită de Cloudera, Hadoop este de asemenea comercializat de IBM, care a început recent să ofere un set de servicii analitice care utilizează această tehnologie. știri despre tehnologie
Serviciul de știri IDG. Urmăriți-l pe Joab pe Twitter la @ Joab_Jackson. Adresa de e-mail a lui Joab este [email protected]
SAP, Grupul de utilizatori pentru a lăsa lumină pe suportul de întreprindere
Grupul de utilizatori SAP din SUA derulează o serie de transmisiuni web pe controversatul suport pentru întreprinderi SAP
Cloudera Intros Hadoop Instrumente de Management
Cloudera lansează un set de aplicații care facilitează lucrul cu cadrul de procesare a datelor Hadoop
Hadoop devine mai căutat cu MapR, Cloudera
Utilizatorii platformei de procesare a datelor Hadoop au acum două motoare de căutare pentru a le ajuta să sorte prin intermediul munților lor de informații.