Car-tech

Google: 129 de milioane de cărți diferite au fost publicate

A fost descoperită planeta „Pi”, asemanatoare cu Pamantul

A fost descoperită planeta „Pi”, asemanatoare cu Pamantul
Anonim

Pentru cei care s-au întrebat vreodată câte cărți există în lume, Google are un răspuns pentru dvs.: 129,864,880, potrivit lui Leonid Taycher, inginer software Google care lucrează la proiectul Google Cărți.

Estimarea numărului a cărților din lume este mai mult decât un exercițiu de curiozitate pentru gigantul de căutare: oferă, de asemenea, o foaie de parcurs a unei părți a muncii rămase pentru a fi îndeplinite în scopul ambitios al companiei de a organiza toate informațiile lumii. sunteți parte dintr-o companie care încearcă să digitizeze toate cărțile din lume, prima întrebare pe care o aveți de multe ori este: "Câte cărți sunt acolo?", a explicat Taycher într-un post de blog care anunța estimarea. > [Citirea ulterioară: Cele mai bune servicii de streaming TV]

Pentru a veni cu o aproximare rezonabilă, compania a început prin a ingera informații despre cărți din mai multe sisteme de catalogare, cum ar fi numerele internaționale de carte standard (ISBN).

Astfel de cataloage, deși utile, nu oferă un număr definitiv, in orice caz. De exemplu, numerele ISBN au fost atribuite cărților încă din anii 1960 și au tendința de a fi utilizate numai în țările occidentale.

De asemenea, mai multe cărți au fost atribuite numerelor ISBN individuale, iar editorul le-a atribuit caractere ISBN altor elemente decât cărțile, cum ar fi tricourile și DVD-urile.

Astfel, inginerii Google au scris programe pentru a combina, deși aproximativ 150 de astfel de cataloage și directoare, și elimină cât mai multe intrări duplicate care ar putea fi găsite. decizii tari despre ceea ce este și nu este o carte, a explicat Taycher.

De exemplu, edițiile de acoperire moale și hard cover a unui text sunt considerate două cărți, la fel ca și versiunile diferite ale unui text popular, cum ar fi Shakespeare's "Hamlet", datorită prelegerilor și comentariilor pe care le pot conține. Seriile se pot număra ca cărți individuale sau ca lucrări colectate.

În iunie, compania a scanat 12 milioane de cărți, potrivit unei prezentări oferite de managerul de inginerie Google Books, Jon Orwant, la Conferința Tehnică anuală USENIX din Boston. Aceste cărți au fost scrise în aproximativ 480 de limbi (inclusiv 3 cărți în limba klingoniană originară Star Trek).

Compania intenționează să finalizeze scanarea cărților existente într-un deceniu. Colecția virtuală rezultată va fi compusă din patru miliarde de pagini și două bilioane de cuvinte, a spus Orwant.

Aproximativ 20% din cărțile din lume sunt în domeniul public, a explicat Orwant. Aproximativ 10-15% din aceste cărți sunt tipărite. Cărțile rămase - marea majoritate a tuturor titlurilor - sunt încă protejate prin drepturi de autor, dar nu sunt tipărite. Google este în curs de a împrumuta copii ale acestor cărți pentru a le digitaliza, de la aproximativ 40 de biblioteci mari din întreaga lume.

Este acest act de scanare în cărți care sunt scoase din uz, dar care sunt încă acoperite de drepturile de autor care au fost îndeplinite cu o anumită rezistență din partea industriei editoriale.

Compania așteaptă acum o judecată din partea Curții Districtuale Americane pentru Districtul de Sud din New York, privind posibilitatea scanării acestor cărți.

În 2005, Asociația Editorilor Americani a depus separat procese de clasă împotriva gigantului de căutare, afirmând că compania încalcă drepturile de autor prin scanarea în cărți.

Google a susținut că vrea să vândă copii digitale ale acestora, tipăriți cărți și acordați drepturi de autor pentru a revendica autorii. Compania dorește, de asemenea, să dezvăluie fragmente din aceste cărți în căutări pe Web și susține că această utilizare intră sub incidența Doctrinei de utilizare echitabilă din S.U.A.

Scanarea în toate cărțile din lume va duce la alte beneficii pe lângă îmbunătățirea căutărilor, a explicat Orwant. Odată ce toate aceste volume sunt digitalizate, conținutul lor poate fi supus analizei, ceea ce poate conduce la noi perspective. Lingviștii pot descoperi când anumite cuvinte au intrat în uz general sau care încep să folosească aceste cuvinte.

Căutarea Google Căutare de cărți ar putea, de asemenea, să răspundă la câteva întrebări istorice remarcabile: De exemplu, ar putea informa dezbaterea asupra faptului dacă Isaac Newton și Gottfried Leibniz - sau altcineva în întregime - au inventat calcul.

dar pentru un concept ", a explicat Orwant. "Putem să luăm toate căile diferite [ca ideea de] infinit poate fi influențată, să traducă în limbi diferite și să facă o căutare în paralel."

"Speranța mea este că, pe măsură ce începem să expunem mult mai mult această colecție va permite oamenilor să pună astfel de întrebări pe care nu au putut să le ceară ", a spus el.

Editorul de servicii IDG News Juan Carlos Perez a contribuit la acest raport. și știri generale de ultimă oră pentru

Serviciul de știri IDG

. Urmăriți-l pe Joab pe Twitter la @ Joab_Jackson. Adresa de e-mail a lui Joab este [email protected]