Windows

Hadoop devine mai căutat cu MapR, Cloudera

Lecture 08 - Hadoop - Why Hadoop need vendors like Cloudera, Hortonworks and MAPR ?

Lecture 08 - Hadoop - Why Hadoop need vendors like Cloudera, Hortonworks and MAPR ?
Anonim

Utilizatorii platformei de procesare a datelor Hadoop au acum încă două instrumente care îi ajută să sorteze prin munții lor de informație.

Noua distribuție M7 a MapR elimină straturile Hadoop JVM pentru a spori performanța

Hadoop distribuitorul MapR a integrat LucidWorks Search în propria sa distribuție. Cloudera, între timp, a lansat prima versiune completă a motorului de interogare Impala SQL open source pentru Hadoop.

[Citirea suplimentară: Cele mai bune servicii de streaming TV]

"Folosirea căutării ca interfață pentru datele mari este foarte interesantă. Căutarea este potrivită pentru utilizarea unor numeroase tipuri de informații, în special a informațiilor nestructurate ", a declarat Jack Norris, directorul marketingului pentru MapR. "Vom vedea unele aplicații foarte interesante cu motoarele de căutare în centrul lor, chiar dacă un utilizator tipic nu s-ar gândi la ele ca motor de căutare condus."

LucidWorks Search este versiunea comercială a Open source Apache Lucene / Solr plin -text motor de căutare. Cu noua integrare MapR, LucidWorks Search poate căuta fie prin intermediul datelor din sistemele de fișiere Hadoop (HDFS), fie prin intermediul fișierelor din alte sisteme de fișiere.

LucidWorks Search oferă instantanee și oglinzi pentru disponibilitate ridicată și elimină o mare parte din munca necesară instalați Lucene / Solr de la zero. De asemenea, oferă suport nativ pentru mai multe surse de date, o interfață grafică de utilizator și un cadru de securitate.

Motorul de căutare ar putea fi folosit într-o aplicație Web dinamică pentru a recupera rapid fotografii, publicitate, recomandări de produs și alte informații care pot fi utilizate pentru a popula site-uri Web în zbor. "Acesta nu este un substitut mai ieftin pentru depozitele de date. Este vorba de folosirea unor noi surse de date și de a face unele lucruri care au un impact dramatic asupra afacerii ", a declarat Norris.

MapR și LucidWorks lucrează împreună la împerecherea tehnologiilor începând din 2011, când au format un acord de marketing comun. La inceputul acestui an, au lansat un conector care faciliteaza utilizarea Lucene / Solr cu distributia MapR Hadoop.

LucidWords Search functioneaza cu distributia M7 lansata recent de MapR, in forma beta. În plus, în săptămâna aceasta, Cloudera a lansat versiunea 1.0 a Cloudera Impala, un motor de interogare compatibil SQL cu sursă deschisă, pentru a elimina compactele sau verificările de consistență de fond. Hadoop. SQL este limbajul interfeței bazei de date utilizat în sistemele de gestionare a bazelor de date relaționale (RDMS) și este bine cunoscut de administratorii de baze de date.

Impala a fost proiectat să execute interogări mai repede decât Hiveop's Hive, deoarece nu utilizează cadrul MapReduce rezultatele căutării să fie scrise pe disc. În schimb, utilizatorii pot interoga datele stocate direct în HDFS și HBase. Utilizatorii pot interoga date fie interactiv, fie prin procese batch.

Cloudera a lansat pentru prima dată o versiune a acestui motor în octombrie, ca beta. De atunci, software-ul a fost testat de companii precum 37signals și Expedia.

Impala este componenta de bază a pachetului suplimentar Cloudera Enterprise RTQ (Real-Time Query) pentru platforma Cloudera Hadoop. Impala poate fi descărcat fără costuri

Actualizat în 6 mai pentru corectarea informațiilor despre tehnologia Clouda Impala