Google comparé à des grains de riz...

Google borne Cet article résulte de la traduction d'un billet posté sur le blog de la compagnie britannique "Managed Networks". En partant d'une simple comparaison, il permet de réaliser à quel point les données manipulées par le géant de la recherche sont immense...

La blogosphère était ébahie au début de l'année quand elle a réalisé quelle était la véritable taille de Google. Vous pensiez que Google était le King Kong de la recherche ? Imaginez un million de King Kong et vous vous approcherez de la vérité. Vérifiez par vous-mêmes.

La taille d'un fichier MP3 est d'environ 3 mégaoctets. Les Beatles ont enregistré 214 singles, ce qui s'approche à peine d'un gigaoctet. 1024 gigaoctets font un téraoctet et 1024 téraoctets font un pétaoctet. Vous êtes perdus ? Nous l'étions aussi.

Nos pauvres esprits n'avaient pas été aussi époustouflés par de tels nombres depuis qu'un farceur légendaire avait berné ses ainés en utilisant un échiquier il y a quelques centaines d'années. Nous avons utilisé la même unité de mesure - des grains de riz - pour essayer de mettre en perspective la puissance du cerveau électronique de Google.

Disons qu'un grain de riz est octet. Un octet est composé de 8 chiffres binaires, comme "10011000" par exemple. Il peut aussi être décrit par 2 caractères hexadécimaux. En termes de données, un octet est généralement utilisé pour enregistrer une simple lettre. Un octet = une lettre = un grain de riz.

1 grain de riz


En gardant cette nouvelle représentation en tête, nous pouvons maintenant voir un kilo-octet (1024 octets) comme un petit bol de riz. C'est environ une demi-portion, pas assez pour vous nourrir. En termes de données, 1 Ko pourrait contenir à peine une poignée de paragraphes d'un texte. Ce n'est pas non plus assez pour vous stimuler mentalement.

1 bol de riz


L'étape suivante est le mégaoctet, qui est de l'ordre de la taille complète moyenne d'un texte sur un site internet, ou de celle d'un petit roman. A l'échelle du riz, un mégaoctet représenterait un sac de 25 kg de riz. Suffisant pour nourrir 420 personnes à table, en supposant que vous ayez assez de chaises.

1 sac de riz


1024 fois plus grand vient le gigaoctet. En 1995, quand on achetait un PC avec un disque dur d'1 Go, on pouvait enregistrer tout ce que l'on souhaitait dessus pour au moins quelques années.

Pour stocker 1 Go de riz, on a besoin d'un jardin bien plus grand... de la taille de deux containers pour être plus précis. De quoi alimenter convenablement beaucoup de monde... Trouver un simple mot dans un gigaoctet de texte revient à trouver quelques grains de riz en particulier cachés dans deux de ces containers. Ça tient de l'impossible pour un humain, et pourtant vous n'avez encore rien vu. Lisez donc la suite.

1 container de riz


Changeons encore d'échelle et atteignons le téraoctet, l'équivalent de 1024 gigaoctets. Certains d'entre-vous ont peut-être un disque dur d'1 To dans leur machine. Cela reste petit, mais rechercher quelque-chose parmi tout le contenu du disque dur, même sur un puissant ordinateur, prend beaucoup plus de temps que votre patience ne pourrait en supporter.

Pour transporter un téraoctet de riz, vous devriez louer un énorme porte-containers. On pourrait utiliser son chargement pour nourir tout le monde dans l'Union Européenne.

1 porte-container de riz


Enfin, nous arrivons au fameux pétaoctet. À cette étape, nous sommes au-delà de la taille de données que la plupart des individus ou des petites entreprises peuvent gérer, et nous entrons dans la catégorie nettement supérieure. C'est comme gérer le contenu des 210 des plus gros porte-containers aux monde. QUATRE-VINGT bols de riz pour chaque personne sur cette planète, ou, d'un autre point de vue...

Londres sous un metre de riz

... suffisamment de riz pour couvrir le centre de Londres sous un mètre de riz !

Sachez maintenant que Google traite 20 pétaoctets de données tous les jours; ou si vous préférez, 4000 de ces super-porte-containers bondés de riz, 1600 bols pour chaque terrien, ou recouvrir Londres sous 20 mètres de riz. Cette action est effectuée par 72000 processus qui se déroulent chacun en moyenne 7 minutes. Leur capacité de traitement des données est ce qui fait que Google est un top des entreprises du monde virtuel (et du monde réel), et on ne doute plus que Google doive payer une facture d'électricité de deux millions de dollars chaque mois, selon des estimations.

Au final, une recherche sur Google (autrement dit, trouver quelques grains de riz dans des milliers de porte-containers) prend en moyenne moins d'une seconde...

D'après "I never knew Google was THIS massive!", un billet posté sur le blog de Managed Networks. Les images appartiennent également à Managed Networks.

# THOMHtml,

Puree c'est énorme la quantité de données géré par Google.
Et ton article est magnifique, c'est excellent de voir les données comme du riz (du mesurable).
Cela nous montre bien la performance Google.

@++

Ecrit par Blogger Sathmo le 21 juillet 2008 13:34  
# Et une petite estimation de la situation dans 10/20 ans? :)

Ecrit par Blogger Colinette le 21 juillet 2008 14:16  
# Jolie comparaison, impressionnante quand même...
Sait on comment sont stockées les données chez google? base de données conventionelles? oracle?

Ecrit par Blogger Amau96 le 21 juillet 2008 14:43  
# Access.

Ecrit par Anonymous Anonyme le 21 juillet 2008 15:58  
# >amau96 nan c'est un simple MySQL ...

A ce niveau de volume ce n'est pas un SGBD qui convient. Google a développé son propre filesystem réparti, sur un Linux à eux bien sûr.

Ecrit par Blogger fredix le 21 juillet 2008 16:03  
# si on pouvais reconvertir l'information en grain de riz on pourrais nourrir beaucoup de gens alors ;)

Super la comparaison ...en tout cas

Ecrit par Blogger Business Commando le 21 juillet 2008 16:53  
# Le système de base de données de Google est plus qu'un simple mySQL, c'est une base qui peut contenir des objets python par exemple qui est utilisable sur Google Apps Engine.

Ecrit par Blogger Luka le 21 juillet 2008 18:35  
# me vient une question : Dans sa grande splendeur, google saurait-il géré autant de vrai grain de riz ?

Plus sérieusement es ce qu'on connait la puissance de calcul des serveurs google ? Le nombre de data center ?

Si la facture est réel on comprend mieux les investissements dans les énergies renouvelable. Moins sure qu'ils aient une vrai conscience écologique, plutôt économique encore une fois.

Ecrit par Blogger thibault le 21 juillet 2008 21:53  
# Et dire qu'on peut - théoriquement - se servir de Google Docs (tableur) comme une base de données... ça se trouve c'est ça qu'il utilisent en vrai, :-P

Ecrit par Blogger TOMHTML le 21 juillet 2008 23:20  
# très bon article, bravo.

Pas de lien Digg ?!

Ecrit par Anonymous nico le 22 juillet 2008 09:09  
# Excellent, bravo pour cet article... on reste scotché !!

Ecrit par Blogger campingdispo.fr le 22 juillet 2008 12:55  
# Le calcul est amusant en effet, mais je ne vois pas comment on peut comparer un octet avec un grain de riz. Personnellement ça ne me parle pas.

Ecrit par Anonymous guyomep le 22 juillet 2008 19:10  
# Ça ne me parle pas trop non plus, et si je ne conteste pas la valeur démonstrative de l'article pour certains, j'aurais plutôt garder en ce qui me concerne la correspondance octet/caractère, par exemple (c'est fictif !), un octet = 1 caractère, 1 ko = 1 ou qq paragraphes, 1 Mo = une revue (citer un ex. de revue), 1 Go = un livre (donner un autre exemple), puis au delà raisonner en nombre de livres, et même en container ;))...

Même si l'exemple ne me convenait pas, l'article n'en demeure pas moins bien construit, bien illustré et agréable à lire :)

Ecrit par Blogger Maelikk le 23 juillet 2008 11:20  
# Et ben Colinette, on peut imaginer que dans 10/20 ans, c'est la planete entière qui sera composé de grains de riz...

Ecrit par Anonymous fredh04 le 26 juillet 2008 08:21  
# Donc plus il y a d'octets, moins il y a de riz.

Ecrit par Anonymous Anonyme le 29 juillet 2008 13:06  
# pour suivre les métaphores:
"Google nous donne les moyens de trouver une aiguille dans une meule de foin...ou plutôt dans une grange de foin"
...pendant que d'autres en riz... :-D

Ecrit par Anonymous OsmOnOs le 29 juillet 2008 18:41  
Cherchez sur Zorgloob :
Ils nous font confiance :
Florajet
Spécialiste de la monétisation d'audience


Votre
publicité
ici...

+ de 2 200 articles sur Google :
Au programme ce jour :

Tous les articles Zorgloob 2008
(2007 - 2006 - 2005 - 2004)
Le Grand Jeu Zorgloob
Les Blogs Google
Les Logos Google 2007
Vos logos Google
Zorgloob Maps
Soumettre un article

Le Casting Zorgloob :

Clicquez pour agrandir Kendos Eric Lebeau (Kendos)
Clicquez pour agrandir TomHtml TomHtml (TOMHTML)
Clicquez pour agrandir Luka Jérémy Milhau (Luka)
Clicquez pour agrandir FJ Frère Jacques (FJ)

Ils ont contribué :

David Herrgott, Sylvain Briant, Lifetec, Romain Boyer, Cédric Magnin, Cyril Slucki, Mael Le Hir, Alexis Berger, Stéphane Rangaya, Patrick Tacchini, Etienne Deparis, Bertrand Pautrot

Si vous avez des actions Google :

Clicquez pour agrandir

Nos records de fréquentation :

40 665 visites/jour
94 511 pages vues/jour
Clicquez pour agrandir les Stats
566 512 visites (Mars 2008)
1 391 395 pages vues (Janvier 2008)

Allez y de notre part :

Zuneo
Webrankinfo
Google Blogoscoped
Google Operating System
Google Watch Blog
Googlified