Componente

Aster Data Updates "prima linie" Baza de date analitica

ArcGIS 10- № 19. Обрезка растра.

ArcGIS 10- № 19. Обрезка растра.
Anonim

"În mod tradițional, ne gândim la depozitarea datelor ca sarcină back-office", a scris Mayner Bawa într-un blog post marți. "Depozitul de date poate fi încărcat în ferestre separate de încărcare, încărcările pot fi executate cu întârziere (efectul net este că utilizatorii de afaceri își vor întoarce rapoartele); încărcările, copiile de siguranță și extinderea pot lua stocurile de date offline - "

Clientii Aster, care includ aCerno, o retea de distributie publicitara pe Internet," se bazeaza pe analiza datelor pentru venituri ", a spus Bawa

Aster's nCluster 3.0 răspândește sarcini de lucru pe mai multe servere și ușurează adăugarea de mașini suplimentare pentru o putere mai mare. De asemenea, software-ul împarte diferitele componente ale unui volum de lucru de analiză a datelor în fragmente discrete.

Un nivel de "încărcător" se ocupă cu încărcarea și exportul de date către și dinspre surse externe; un strat "lucrător" stochează date pe discuri atașate local pentru interogare; și un strat de noduri "queen" efectuează planificarea și procesarea inteligentă a interogărilor

Între timp, utilizatorii lucrează cu clusterul ca și cum ar fi o singură entitate

Abilitatea de a scala selectiv segmentele clusterului înseamnă că utilizatorii pot adăuga resurse în domeniile în care acestea sunt necesare cel mai mult, spune Aster.

Pentru aceste capacități de bază, versiunea 3.0 adaugă o serie de funcții pentru utilizarea permanentă, inclusiv capacitatea de a adăuga capacități, de a reechilibra datele și de a recupera date Sistemul este live

Aster, de asemenea, a lucrat pentru a adăuga paralelizare pe tot sistemul, conform unui oficial al companiei.

"Vrem să construim sisteme care să poată trata 10x, 100x mai multe date decât orice alt sistem de astăzi. multe date pentru orice server de mărfuri unice ", a declarat CTO Tasso Argyros într-un post de blog. "Așadar, am pus o mulțime de eforturi R & D în paralelizarea fiecărei funcții a sistemului - nu doar interogarea, ci și încărcarea, exportul datelor, copierea de rezervă și actualizările. În plus, permitem utilizatorilor noștri să aleagă cât de mult doresc să paraleze toate aceste funcții, fără a fi nevoie să extindeți întregul sistem. "

De asemenea, lansarea include suport pentru MapReduce, o tehnică de programare dezvoltată inițial de Google, care permite dezvoltatorilor să scrie mai ușor programe pentru analiza seturilor mari de date. Concurentul Aster Greenplum a anunțat, de asemenea, recent sprijinul MapReduce.

Caracteristicile suplimentare includ posibilitatea de a selecta nivelurile de compresie a datelor pentru tabele individuale, un instrument de upgrade cu un singur clic; și caracteristici de securitate mai bune, precum LDAP (Lightweight Directory Access Protocol) pentru autentificare și abilitatea de a gestiona privilegiile utilizatorilor la nivelele de cluster, bază de date și table.

Mulți dintre clienții inițiale ai Aster, care includ și MySpace,, a declarat Curt Monash, presedintele Monash Research.

"O fractiune extraordinara a cresterii si a oportunitatilor de stocare a datelor constau in tratarea unor tipuri relativ noi de date", a spus el. "Există mari depozite de date care se ocupă de OLTP tradiționale, date tranzacționale, dar Aster nu este neapărat un competitor de frunte în analizarea acestui aspect. Datele dulci în analizarea unor cantități mari de date sunt în prezent date Web și evenimente asociate rețelei."

gestionarea paralelă a procesului de administrare și suport pentru MapReduce ca puncte forte ale Aster: "Aster este un startup cu un produs relativ imatur, dar au pus multă gînduri în modul de a face procesarea paralelă ușor de administrat."

NCluster 3.0 rulează pe servere standard x86. Prețul se bazează pe cantitatea de date gestionate. Compania a spus anterior că costurile încep de la 100.000 USD.