Jusqu’au début des années 2000, Internet était un outil « branché », utilisé par les jeunes, de préférence CSP+, accessible principalement dans les grandes villes, faute de réseau en zone rurale, et les connexions ADSL étaient encore rares.
Les études online avaient très mauvaise presse. Le principal reproche les concernant était la « non-représentativité » des répondants.
Le profil de la population des internautes se rapproche maintenant du profil de la population française (données 2009) : la population générale comprend 42 % d’hommes contre 53 % chez les internautes, 20 % de CSP+ contre 34,4 % chez les internautes.
Malgré l’augmentation du taux de pénétration d’Internet, il demeure des disparités selon l’âge : 72 % chez les 12-17 ans et seulement 40 % chez les 60-69 ans. Cette disparité se réduit cependant d’année en année puisque le taux était de 21 % chez les 60-69 ans un an auparavant !
Les études online prennent une part de plus en plus importante sur le marché des études, soit en pourcentage du chiffre d’affaires des études quantitatives, selon le syndicat Syntec regroupant les principaux instituts de sondage : 13 % en 2005, 20 % en 2006, 25 % en 2008 et 31 % en 2009.
Pour ou contre ?
Certains avantages sont fréquemment mis en avant par les instituts :
- l’accessibilité à des cibles nombreuses et variées ;
- le recrutement possible de profils rares à faible taux d’incidence ;
- la rapidité de la collecte ;
- les informations préalables et la pré-qualification des répondants ;
- un coût plus intéressant.
Les principaux reproches sont également devenus récurrents et seront évoquées ici successivement les questions de la non-représentativité avec un échantillonnage non probabiliste et le risque de « professionnalisation » des répondants ; celle du mode de collecte des réponses et la possibilité pour un internaute de représenter un non-internaute ; enfin celle de la sincérité et richesse des réponses.
Origine des échantillons
Les sondages online font le plus souvent appel à des access panels online c’est-à-dire des réservoirs de répondants potentiels qui se sont inscrits pour répondre de manière répétée à des enquêtes en ligne. D’autres dispositifs existent à partir de fichiers de clients, de prospects, ou d’abonnés, mais on sort alors du champ des sondages d’opinion classiques.
Ce recours aux access panel online est mis en cause dans les discussions sur l’échantillonnage en ligne, avec pour principales préoccupations :
- l’origine du recrutement, online ou aussi offline (diversité du sourcing) ;
- le fait de dédommager les répondants pour les motiver à répondre ;
- la duplication ou le fait d’appartenir à plusieurs panels.
Il est couramment admis parmi les instituts qu’un recrutement diversifié est un gage de qualité du panel, et qu’il est préférable de recruter par différents modes (online et offline).
Les instituts se livrent à de nombreuses analyses pour comparer, selon l’origine des panélistes, les paramètres de base tels que le taux de participation aux études proposées, le temps de remplissage du questionnaire, la cohérence des réponses, etc. Il semble qu’il y ait peu de différences dans les comportements de consommation, comme dans la qualité des réponses, en fonction des différentes origines des panélistes.
Le risque de « professionnalisation » des répondants semble nettement plus important. Le recours à un système d’incentive (tirage au sort, loterie, points monnayables, cadeaux…) pourrait influer sur le profil de ces répondants, que certains n’hésitent pas à qualifier de « chasseurs de primes ».
Les études réalisées par les instituts se veulent rassurantes en montrant que l’attrait du gain ne constitue pas la motivation première. Mais la variation des résultats selon le système de rémunération et du mode de recrutement ne laisse pas planer beaucoup de doutes… Avec l’essor des études online ces rémunérations deviennent de plus en plus importantes et l’impact sur le recrutement ne peut que s’aggraver compte tenu des difficultés économiques croissantes de bon nombre de ménages !
On sait qu’il existe une proportion non négligeable de panélistes qui sont inscrits dans plusieurs panels. Derrière la question de la « professionnalisation » des répondants se pose celle de l’impact sur la qualité des réponses de ces participations multiples à des enquêtes. De nombreuses études ont été menées sans que l’on puisse montrer définitivement que les échantillons qui contiennent plus d’hyperactifs donnent des résultats moins valides ou moins fiables.
Le mode de collecte une fois
Une étude comparative1 a été menée en Belgique auprès de 1 015 personnes avec le même questionnaire passé auprès de quatre sous-échantillons correspondant aux quatre principaux modes de collecte :
- envoi postal à un échantillon aléatoire ;
- en face à face par la méthode de la route au hasard ;
- par téléphone avec échantillon probabiliste par numérotation automatique ;
- par access panel avec la méthode des quotas.
Ces quatre échantillons ont été appariés sur le plan de l’âge et du sexe, afin que les différences ne soient dues qu’au mode de collecte. Les résultats ont montré certaines différences :
- peu de différence entre trois des quatre modes au niveau socio-démographique, seul le postal se singularise en étant davantage rural ;
- pour les comportements de consommation (produits courants, proportion d’early adopters, sensibilité aux marques), le téléphone se distingue par une plus faible consommation de produits courants, mais davantage de voyages et de produits financiers ;
- le online est plus consommateur d’appareils photo numériques, et plus early adopter.
Les études online donnent en général des résultats plus « durs » que les études par téléphone, qui présentent le plus d’écart par rapport aux autres modes de collecte.
Richesse et sincérité
Le contexte des réponses dans les études online présente des caractéristiques d’un intérêt certain :
- L’asynchronisme : le répondant a le choix du moment où il souhaite répondre (il n’y pas de timing imposé) et la possibilité de reprendre là où il s’est arrêté. On peut donc imaginer des répondants plus disponibles, plus concentrés, plus impliqués.
- Il est possible de montrer des photos et des schémas : à condition de ne pas surcharger le questionnement avec de trop nombreuses illustrations, c’est un des points forts de ce mode de recueil, permettant au répondant de prendre son temps.
- L’écran et le mode d’expression lui permettent de se sentir protégé et de dire sans retenue tout ce qu’il veut dire. L’écrit est nettement plus riche et argumenté que par téléphone pour les questions ouvertes. C’est un discours sans doute plus direct, plus franc, non médiatisé ou réduit par l’enquêteur qui rechigne parfois à taper le verbatim dans son intégralité.
Avec ce mode de recueil auto-administré sans interaction avec un enquêteur, il y a donc moins d’auto valorisation et d’alignement sur le politiquement correct, pas de biais enquêteur.
Online pas moins plus pire ?
Au bilan… et sous réserve de proposer des questionnaires d’une durée raisonnable, clairs, non ambigus et comprenant des explications, soit en observant les règles de bases valables pour toutes les études, la pratique montre que les niveaux de scores sont fréquemment différents entre une étude réalisée online et une étude plus classique, mais avec des hiérarchies qui s’avèrent très souvent identiques. L’ensemble des résultats conduit généralement à des conclusions similaires, mais les internautes membres d’un panel online révèlent par exemple des comportements plus ouverts à l’innovation technologique.
Si les access panels online sont souvent plus urbains, plus jeunes, mieux éduqués, et plus riches que la population globale, le postal est souvent plus vieux, plus ouvrier, moins éduqué. Le téléphone, est plus « inactif » et excluant, si l’on ne prend pas de dispositions spécifiques en réalisant des appels de numéros de mobiles générés automatiquement, les abonnés exclusifs de mobiles étant plus jeunes et ayant des revenus moins élevés.
Discuter la validité des études online suggère implicitement qu’il existe des terrains parfaits, à la représentativité absolue. Or, aucune méthode de recueil n’est parfaite, chacune ayant ses avantages et ses biais. L’échantillonnage parfait n’existe pas, et les frontières entre aléatoire et non aléatoire sont souvent minces. Il existe un continuum de méthodes plus ou moins aléatoires, et des échantillons plus ou moins représentatifs.
L’utilisation d’Internet comme mode de recueil est devenu courante dans les instituts d’études. Comme pour les autres méthodes (en salle, au domicile, par téléphone…), certaines précautions sont indispensables. Elles concernent :
- le choix des répondants à qui les invitations sont envoyées ;
- la vérification des répondants sur le nombre de leurs participations au cours des trois ou six derniers mois (ce qui est demandé pour les autres modes de recueil) et en termes d’ancienneté dans le panel ;
- le contrôle de la « réalité » des répondants ;
- l’élimination des « défauts » de l’échantillon.
Une réflexion s’impose pour décider en connaissance de cause d’un éventuel changement de méthode. Actuellement de nombreuses questions se posent sur le passage du recueil téléphonique à l’Internet pour les enquêtes barométriques. Il reste qu’à la lumière des recherches connues à ce jour, on ne peut remettre en cause systématiquement la validité des résultats des échantillons online, même si il s’agit de constats plus empiriques que théoriques.
Alain Tripier
1. Niels Schillewaert, Annelies Verhaeghe, Kristof de Wulf, Bert Weijters, 2007, “Social Class, Consumption and Life Style Differences between Modes of Data Collection”, http://www.insites.eu/02/documents/whitepapers/02%20Method%20Comparison.pdf
Pénombre, Janvier 2011