Cher Pénombre et tout particulièrement André Kuhn,
La brève du numéro 36 de la Lettre blanche relatant les mérites chiffrés du paquebot “ penombre.org ” appelle – comme l’auteur lui-même le pressent – un commentaire. L’article souligne en effet que le “ visiteur-type de l’année 2003 est Français ”. N’ayant pas vu, lors de la consultation du site qu’on me demandait de préciser ma nationalité, je suis forcé d’en conclure que celle-ci est déduite des données de connexion. Il existe deux méthodes de “ géolocalisation ” des utilisateurs. La plus simple est celle qui consiste à regarder le nom de domaine de la machine connectée, un “ xxx.fr ” indiquant un prestataire de service “ français ” - méthode très contestable, l’utilisateur du service “ yyy.com ” résidant en France étant comptabilisé comme Américain (ou pas du tout selon) ; la seconde consiste, plus finement, à localiser l’ordinateur à partir de son numéro IP et d’une base de données nous disant “ Pontoise ”, “ Miami ”, etc. Aucune de ces deux méthodes ne saurait nous renseigner sur le sexe, l’âge, la nationalité ou… le nombre de visiteur(s). Pour paraphraser la phrase célèbre du New Yorker : “ On the Internet, nobody knows you’re a Frog. ”
Philippe Rivière, Paris
Réponse :
Monsieur Rivière a tout à fait raison ! Pour des raisons de déviation, il nous est impossible de traiter les numéros IP. J’ai donc travaillé avec les noms de domaines. La grande majorité de ces noms de domaines sont français. Cela ne laisse que peu de place au problème du Français qui utiliserait un service “.com”. Par contre, il va de soi que seront également comptabilisés comme “Français” les “étrangers” utilisant des services “.fr” (ce qui ne serait pas souvent le cas à en croire les spécialistes d’internet), ainsi que les “étrangers” résidant en France et utilisant des services “.fr”. C’est donc là que se trouve la plus grande faille de mon texte. La notion de “Français” est en effet à interpréter comme “usager d’un service “.fr””. Il est évident que nous ne connaissons pas la couleur du passeport des visiteurs du site Pénombre. Pour ma défense, je pourrais signaler que même si je retire la proportion d’ “étrangers” résidant en France du nombre d’usager d’un service “.fr”, il resterait encore une large majorité de visiteurs “Français”. Le plus correct me semble toutefois d’admettre humblement que je n’ai pas utilisé le terme adéquat dans mon texte... Avec toutes mes excuses et mes meilleures salutations.
André Kuhn
René Padieu dans “ Parallaxe ” [n° ;36] appelle judicieusement l’attention des lecteurs sur les paradoxes apparents des chiffres dans ce qui s’appelle “ l’effet de structure ”. Je ne suis pas statisticien, pas même mathématicien, mais je m’interroge. Comment la combinaison de taux tous supérieurs peut-elle aboutir à un taux moyen lui-même inférieur ? Ce n’est plus l’effet de structure, c’est l’effet Glapion !
Hervé Garrault
Réponse
J’ignore, honteux, qui était Glapion ; mais l’effet de structure est bien tel que je le décris. Les quatre opérations de l’arithmétique primaire et un exemple rudimentaire peuvent nous en convaincre :
Comparons deux pays imaginaires A et B ayant même le même nombre d’habitants (ce n’est pas nécessaire, mais ça simplifie encore le calcul), en ne considérant que deux classes d’âges : les jeunes et les vieux. Imaginons que la population de A soit relativement âgée et que B au contraire ait une forte proportion de jeunes (ce qui est en gros le cas quand on compare un pays européen à un pays en voie de développement). Et, supposons encore que les taux de mortalité soient, à tous âges, nettement plus élevés en B qu’en A : 2 % contre 1 % et 7 % contre 5 %, la mortalité des jeunes étant cependant moindre que celle des vieux dans les deux pays.
Population (milliers) | Taux de mortalité | |||
Pays A | Pays B | Pays A | Pays B | |
jeunes | 3 000 | 7 000 | 1 % | 2 % |
vieux | 7 000 | 3 000 | 5 % | 7 % |
total | 10 000 | 10 000 | 3,8 % | 3,5 % |
Si, en A, le taux était de 1 % pour les jeunes, cela veut dire que, pour une population de 3 millions, il y a eu 30 000 morts. De même, pour 7 millions de vieux, on a eu 350 000 morts. Soit 380 000 au total. Cela donne un taux de 3,8 % pour l’ensemble du pays. Le même calcul, pour le pays B, donne 2 % de 7 millions + 7 % de 3 millions, soit 140 000 + 210 000 = 350 000 au total. Cela fait un taux de 3,5 % seulement. On voit sur cet exemple, évidemment schématique mais pas irréaliste, que la grande différence de poids entre les jeunes et les vieux peut tout à fait faire passer le taux d’ensemble de B au dessous de celui de A, bien que les taux de B soient supérieurs aussi bien pour les jeunes que pour les vieux.
René Padieu
Pénombre, Août 2004