Aller au contenu

336 milliards de données personnelles récupérées en un mois par cinq sites


Serge

Messages recommandés

En un mois, cinq portails internet majeurs ont récupéré un total de 336 milliards de données personnelles sur les internautes, selon l'étude réalisée par Comscore. Yahoo arrive en tête avec 811 informations par utilisateur. Les internautes paraissent peu inquiets de cette collecte.

On savait déjà que les sites Internet se servent des données collectées lors des clics des internautes pour affûter leurs campagnes de publicité en ligne. Aujourd'hui, on connaît l'ampleur du phénomène. D'après une étude réalisée par ComScore pour le New York Times, en l'espace d'un mois, 336 milliards d'informations ont ainsi été récupérées par les serveurs de Google, AOL, Microsoft, MySpace et Yahoo. Ce dernier détient d'ailleurs la palme du nombre d'informations collectées (110 milliards), soit 811 informations par internaute qui s'est connecté au site de recherche en ligne. Jusqu'à présent, ComScore se contentait de classer les sites Internet selon leur popularité, en se basant essentiellement sur le nombre de visiteurs par mois. Désormais, il va plus loin, en comptabilisant le nombre de données, apparemment anodines, mais jugées « personnelles » (telles que l'achat d'un livre, le choix d'un voyage ou d'un vêtement) transmises aux serveurs de quinze célèbres sites Internet.

Les internautes peu inquiets par le ciblage comportemental

De nombreuses associations de protection de la vie privée ont déjà tiré la sonnette d'alarme, mais ComScore estime que du côté des internautes l'inquiétude est loin d'être au rendez-vous. Et pour cause : contrairement à Facebook, qui a, selon le cabinet, clairement communiqué sur le rôle de Beacon, son outil de ciblage publicitaire comportemental (après, rappelons-le, avoir fait l'objet d'une vaste polémique), la collecte de données sur les autres sites reste relativement peu visible pour l'utilisateur. Les sites Internet se dotent de plus en plus d'outils pour analyser le comportement des internautes, afin de mieux cibler l'envoi de publicités. En avril 2007, Google a racheté DoubleClick (une agence de publicité en ligne) pour 3,1 milliards de dollars avant de se rapprocher de Publicis, puis en mai Microsoft s'est payé aQuantive pour 6 milliards de dollars, Yahoo s'est offert BlueLithium pour 300 millions de dollars et AOL a racheté Quigo pour la même somme.

Edition du 11/03/2008 - par Miléna Nemec-Poncik - reseaux-telecoms.net

:icon_up:

Lien vers le commentaire

C'est très majoritairement ça. Les sites qui récupèrent des informations plus lourdes, plus pertinentes (nom réel, adresse réelle, n°téléphone IRL, âge, sexe, etc…) ne peuvent que très difficilement le faire par la bande (ils sont obligés de demander à un moment ou à un autre, directement).

Lien vers le commentaire

Ok, mais ces informations sont-elles limitées au site du créateur du cookie (ou autre), donc aux pages que tu visites sur son site, aux recherches que tu effectues avec son moteur, etc., ou bien ce type peut-il suivre tous tes déplacements, mots clés, etc., même sur d'autres sites ?

Lien vers le commentaire

Ca dépend. On peut envisager qu'un site X recoit un visiteur lambda en provenance d'un site Y qui se fait un plaisir de transmettre (de Y vers X donc) les infos qu'il aura lui-même pu collecter. On peut aussi envisager qu'un accord fasse que le site X puisse, une fois ton passage enregistré chez lui, démarcher les sites Y, Z, et W pour voir si par hasard, ils n'ont pas des infos sur toi.

Maintenant, si tu ne fournis pas d'informations sensibles (p. ex : ton n° de compte en banque) initialement, il est très improbable que les sites X, Y, Z ou W en disposent. De même, pour qu'une information concernant Gadrel soit collectée, il faut une "clé" unique permettant de t'identifier. Une clef possible pourrait être ton IP, mais ce n'est pas fiable (tu n'es pas toujours chez toi, tout le monde n'a pas une IP fixe). Le seul nom ou un nom d'avatar ne suffit pas, il peut y avoir des doublons… Etc. Il y a aussi un effet de bord indésirable pour les commerces concernés : les informations qu'ils collectent sont parfois plus intéressantes chez eux, au secret, que chez les autres. Ainsi, la dispersion partielle ou totale de leurs infos n'est pas toujours à leur avantage, ce qui limite aussi le type d'information qui voyage sur internet. Un profil complet de consommateur dans un domaine particulier, par exemple les confitures, peut coûter très cher à constituer et ne pas valoir grand'chose pour un vendeur de HiFi. Il n'y a a priori pas d'intérêt pour X (vendeur de confiture) à filer des informations hyper pointues sur ton profil de consommations de confitures à Y (vendeurs de hifi).

Accessoirement, j'imagine même pas la taille des bases à manipuler et à créer pour faire des stats sur des choses aussi disjointes. Ceci dit, improbable ne veut évidemment pas dire impossible ni irréalisable, hein…

Lien vers le commentaire
Invité jabial

336 milliards de données, ça veut dire quoi? 336 milliards de bits? 336 milliards de caractéristiques différentes? En tout cas c'est certainement pas 336 milliards de personnes :icon_up:

Lien vers le commentaire

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...