Windows

Big Data 3 Vs - Concepte și modele

Big Data's Volume, Velocity, and Variety (3 Vs)

Big Data's Volume, Velocity, and Variety (3 Vs)

Cuprins:

Anonim

Termenul "date" nu este nou pentru noi. Este unul dintre lucrurile principale predate atunci când optați pentru tehnologia informației și calculatoare. Dacă vă puteți aminti, datele sunt considerate o formă brută de informații. Deși există deja un deceniu, termenul Big Data este un buzz în aceste zile. Așa cum se poate observa din termen, sarcini și o mulțime de date, este datele mari și pot fi procesate în diferite moduri, folosind diferite metode și instrumente pentru a obține informațiile necesare. Acest articol se referă la noțiunile de Big Data, utilizând cele 3 V menționate de Doug Laney, un pionier în domeniul antrepozitului de date, care este considerat a fi inițiat domeniul Infonomics (Informații Economice)

Înainte de a continua, este posibil să doriți să citiți articolele despre Bazele datelor mari și utilizarea mare a datelor pentru a înțelege esența. S-ar putea să adauge la acest post pentru o explicație suplimentară a conceptelor Big Data

Datele mari, în forma lor uriașă, acumulate prin diferite mijloace, au fost depuse în mod corespunzător în diferite baze de date mai devreme și au fost eliminate după ceva timp. Atunci când conceptul a arătat că cu cât sunt mai multe date, cu atât este mai ușor să afli - informații diferite și relevante - utilizând instrumentele potrivite, companiile au început să stocheze date pentru perioade mai lungi. Este vorba de adăugarea de noi dispozitive de stocare sau de utilizarea cloud-ului pentru a stoca datele sub orice formă, cum ar fi datele achiziționate: documente, foi de calcul, baze de date și HTML etc. Se aranjează apoi în formate adecvate utilizând instrumente care pot procesa bucăți mari Date

NOTĂ:

Domeniul de aplicare al datelor mari nu se limitează la datele pe care le colectați și le stocați în incinte și cloud. Modelul 3D de date mari se bazează pe următorul volum V:

Volum: se referă la gestionarea stocării datelor

  1. Viteza: se referă la viteza de prelucrare a datelor
  2. Varietatea: se referă la gruparea datelor diferitelor seturi de date care nu se leagă
  3. Următoarele paragrafe explică modelarea Big Data, vorbind despre fiecare dimensiune (fiecare V) A] Volumul de date mari

Vorbind despre datele mari, s-ar putea înțelege volumul ca o imensă colecție de informații brute. Deși este adevărat, este vorba și de costurile de stocare a datelor. Datele importante pot fi stocate atât în ​​clădiri, cât și în cloud, acestea din urmă fiind opțiunea flexibilă. Dar trebuie să stocați fiecare și totul?

Potrivit unui document publicat de Meta Group, când volumul de date crește, anumite părți ale datelor încep să fie inutile. Mai mult, se precizează că numai acel volum de date trebuie păstrat pe care întreprinderile intenționează să îl utilizeze. Alte date pot fi aruncate sau dacă întreprinderile sunt reticente să renunțe la "date despre care se presupune că nu sunt importante", acestea pot fi aruncate la gunoi pe dispozitivele computerului neutilizate și chiar pe casete, astfel încât întreprinderile să nu trebuiască să plătească pentru stocarea acestor date. > Am folosit "date presupuse a fi de neimportanță", pentru că și eu cred că date de orice tip pot fi solicitate de orice afacere în viitor - mai devreme sau mai târziu - și, prin urmare, trebuie să fie păstrate pentru o bună perioadă de timp înainte de a ști că datele sunt într-adevăr, nu este important. Personal, am dat date mai vechi pe hard discuri din anii anteriori și uneori pe DVD-uri. Principalele computere și stocarea în cloud conțin datele pe care le consider importante și știu că voi folosi. Dintre aceste date, există și un fel de date care ar putea ajunge la un HDD vechi după câțiva ani. Exemplul de mai sus este doar pentru înțelegerea dvs. Nu se va potrivi descrierea datelor mari, deoarece suma este destul de mică în comparație cu ceea ce întreprinderile percep ca date mari.

B

] Viteza datelor mari

Viteza procesării datelor este un factor important când vorbim despre concepte de Big Data. Există multe site-uri web, în ​​special e-commerce. Google a recunoscut deja că viteza cu care o încărcare a paginii este esențială pentru o clasare mai bună. În afară de clasamente, viteza oferă, de asemenea, confort utilizatorilor în timp ce fac cumpărături. Același lucru este valabil și pentru datele prelucrate pentru alte informații.

În timp ce vorbim despre viteză, este esențial să știm că aceasta depășește lățimea de bandă mai mare. Combină datele ușor de utilizat cu diferite instrumente de analiză. Datele usor de folosit inseamna unele teme pentru a crea structuri de date care sunt usor de procesat. Următoarea dimensiune - Soiul, se răspândește mai multă lumină în această privință. C

Atunci când există încărcături și o mulțime de date, devine important să le organizăm astfel încât instrumentele de analiză să poată procesa cu ușurință date. Există și instrumente pentru organizarea datelor. Când se stochează, datele pot fi nestructurate și de orice formă. Depinde de tine să-ți dai seama ce legătură are cu alte date cu tine. Odată ce ați dat seama relația, puteți prelua instrumentele potrivite și puteți transforma datele în forma dorită pentru stocarea structurată și sortată.

Rezumat

Cu alte cuvinte, modelul 3D al lui Big Data se bazează pe trei dimensiuni: date USABLE pe care le posedați; etichetarea corectă a datelor; și procesarea mai rapidă. Dacă aceste trei sunt îngrijite, datele dvs. pot fi prelucrate sau analizate cu ușurință pentru a afla ce doriți.

Cele de mai sus explică ambele concepte și modelul 3D al Big Data. Articolele legate în al doilea paragraf vor fi susținute suplimentar dacă sunteți nou în concept.

Dacă doriți să adăugați ceva, vă rugăm să comentați