--

Statistique, recherche et protection de la vie privée

Sous le titre « Des chercheurs critiquent la CNIL », un article assez polémique1 a rendu compte du colloque international « Démographie, statistique et vie privée » organisé par l’INED lors de son cinquantenaire. Ce colloque a traité d’une dimension technique compliquée de l’élaboration des statistiques2. Ce bilan comparatif utile, normalement serein, mais inhabituel touche à une nouvelle dimension sacrée de notre société. Une loi Informatique et Libertés, très protectrice et de champ universel, crée par nature des contraintes très fortes et nécessite des arbitrages éthiques ou politiques délicats.

La tonalité excessive de cet article témoigne de la difficulté d’en parler en France. Les arguments techniques ou se réclamant de l’efficacité sont, en effet, difficilement opposables aux principes fondamentalistes des libertés. Ce déséquilibre de légitimités s’établit aussi entre institutions. La statistique - à travers le Conseil National de l’Information Statistique (CNIS) - et la recherche publique en souffrent-elles ? Les valeurs de transparence de la société, d’investissement dans l’avenir par la recherche, insuffisamment portées par leurs institutions, auraient-elles été les victimes d’arbitrages éthiques ou politiques propres à notre pays ?

Ce colloque a traité de données démographiques ou d’enquêtes. L’échange ainsi engagé devrait être étendu à la statistique administrative, fortement contrainte en France. Ses limites justifient une analyse sous les deux registres de la transparence démocratique de la société et de l’efficacité de la gestion de l’État : la méfiance à l’égard des abus potentiels de l’État entrave-t-elle son action légitime ? Par exemple, l’efficacité et la justice fiscales pâtissent-elles de l’interdiction faite au ministère des Finances d’utiliser le numéro national d’identité ? Le débat de société l’emporte ici sur l’expertise statistique.

 
Une exception statistique ?

La Convention 108 du Conseil de l’Europe en 1981 et la Directive européenne de juillet 1995 relatives à la protection de la vie privée ont reconnu à la statistique et à la recherche des dérogations assorties de garanties appropriées. Leur transcription dans le droit français au cours des trois prochaines années apporterait une importante novation par rapport à la loi Informatique et Libertés de 1978. Nos métiers y puiseraient, en effet, une double légitimité favorisant l’échange institutionnel : la réaffirmation de « l’intérêt public important » de leur mission et la reconnaissance de l’efficacité protectrice de leur déontologie. Dans la pratique, l’autorisation de traiter scientifiquement des données sensibles m’en semble l’enjeu le plus important. Nous y reviendrons.

La recherche en sciences humaines, en particulier la géographie locale et les études longitudinales, seraient les principales bénéficiaires de cette harmonisation européenne car aucun texte législatif n’a adapté la loi Informatique et Libertés à leurs champs respectifs. Au contraire, la recherche historique en 1979, la statistique publique en 1986 et la recherche médicale en 1994 ont fait l’objet de lois sectorielles qui ont réglé des difficultés majeures.

 
La diversité des traditions nationales

En dépit de ces réglementations communes, des approches bien diverses coexistent à l’intérieur même dans l’Union Européenne, malgré sa forte homogénéité culturelle et historique. Quel contraste avec la situation française nous renvoie l’Europe du Nord très confiante en son système cohérent de registres, efficace, économe des deniers de l’État et du temps des concitoyens ! La même année 1978, le Parlement français a voté une loi Informatique et Libertés très défiante à l’égard du numéro national d’identité, et le Danemark a mis en place un registre national de population et imposé aux administrations l’usage d’un identifiant unique. Cette réforme a permis la saisie de l’impôt à la source, réforme toujours reportée par l’administration française. Or l’exigence démocratique de ces pays interdit d’analyser cette stratégie statistique et administrative comme une simple irresponsabilité dangereuse. Les historiens et sociologues des institutions aideraient à comprendre ce fait.

Soulignons le cadre institutionnel de la statistique plus propice à cette orientation au Danemark ou au Canada qu’en France : une statistique publique très centralisée dans un établissement public indépendant des ministères défend plus facilement qu’en France la crédibilité en son indépendance. L’autorité du ministre des Finances et de ses collègues sur les services statistiques et le CNIS s’avère aujourd’hui un message malheureux malgré la garantie effective de la déontologie des statisticiens et l’efficacité de ces services datant de la reconstruction du pays. Au niveau local, le voisinage de nos directions régionales de la statistique et de l’Hôtel des impôts à l’intérieur d’une cité administrative d’État fait mauvais effet.

Sur le même thème, la décentralisation aberrante de notre système de sécurité sociale entrave une connaissance statistique indispensable. L’absence d’un échantillon permanent inter-régimes d’assurés sociaux et d’ayant droits constitue un vrai déni de gestion de l’assurance maladie ou des cotisations de retraite, mais les statisticiens n’ont pas su faire reconnaître le bien-fondé de telles statistiques reposant sur le numéro national d’identité et l’interconnexion de fichiers, tant ces outils sont assimilés à une image policière. Quel paradoxe de voir la France avoir manqué les avantages de la centralisation pour la production et la confidentialité statistiques !

Selon Lars Thygesen3, l’institut de statistique danois s’est fixé des règles internes de confidentialité draconiennes pour éviter qu’on ne les lui impose de l’extérieur. Dans les années 1970, les statisticiens français, très confiants dans leur secret statistique, ont certainement manqué cet objectif de communication.

Que dire de l’exemple allemand3, très réticent à l’égard des statistiques administratives exhaustives ? Son principe constitutionnel d’autodétermination informationnelle de l’individu nie l’idéal de transparence statistique de la société puisque l’individu est jugé libre de participer ou non à la statistique nationale. Ainsi, le point de vue des voisins allemands et danois s’oppose complètement sur les enquêtes par sondage : les danois se réjouissent de l’importance de leur statistique administrative exhaustive (90% des informations selon eux), tandis que la loi allemande exige que, selon un principe de parcimonie, aucune statistique exhaustive n’intervienne là où un simple sondage suffirait.

A son tour, la statistique fait parfois supporter à la recherche une surenchère de précautions lors de la transmission de fichiers dits « indirectement nominatifs. » J’entendais un démographe québéquois se plaindre des mutilations des fichiers reçus de Statistique Canada et du statut de « malfaiteur présumé » qu’il se voyait ainsi décerner.

 
Les donnés sensibles

L’article 31 de la loi Informatique et Libertés interdit la collecte d’informations sensibles, sauf « accord exprès » de l’intéressé. Or, l’accord exprès - et donc écrit selon le Conseil d’État - est tellement antinomique avec l’échantillonnage aléatoire et le contrat de confiance présenté par l’enquêteur que, de longue date, aucune enquête scientifique n’avait traité des idées religieuses ou politiques, et de l’immigration. L’autorité du Haut Conseil à l’Intégration a permis une évolution sensible de la situation, en particulier lors de la récente enquête de l’INED sur l’intégration des immigrés : en accord avec la CNIL, l’INED et l’INSEE ont recueilli « l’accord explicite » de l’enquêté selon des modalités très satisfaisantes, en pleine harmonie avec la nouvelle directive. Leur transcription dans notre droit écrit est vivement espérée. Par ailleurs, le recueil de la nationalité en clair ou de la double situation matrimoniale (légale et de fait) ne font plus obstacle à la déclaration simplifiée des enquêtes publiques (norme 19). Cette décision est très heureuse car la lourdeur des procédures d’avis, soulignée par le Parlement européen, est généralement disproportionnée avec la dangerosité des enquêtes. Les données ne sont, en effet, que très temporairement nominatives et la faiblesse des taux de sondage prémunit contre la communication d’informations sur des individus définis extérieurement à l’enquête.

Cette procédure a parfois dans le passé conduit à des prescriptions techniques nettement dommageables à la qualité technique de l’enquête. Le Centre d’Études des Revenus et des Coûts (le CERC) l’avait exprimé à propos de son panel d’allocataires du RMI4. Sur certains points, ce fut aussi le cas de l’enquête ACSF sur les comportements sexuels en France5. Mais ces difficultés devraient être évitées grâce au nouveau Comité du label, instance rapprochant la CNIL et le CNIS, chargée de juger de l’intérêt général des enquêtes. Pour les opérations sensibles, cet échange exigeant avec la CNIL conduit à des prises de conscience utiles au statisticien. Enfin l’avis favorable de la CNIL apporte une légitimation forte, très appréciable sur le terrain lors de la collecte puis lors de la diffusion des résultats. C’est en connaissance de cause que Michel Jacod a témoigné de cette expérience de l’INSEE2 : grâce à la CNIL, la collecte du prochain recensement bénéficiera d’une confidentialité accrue au niveau communal, maillon échappant à l’autorité administrative de l’INSEE.

Toutefois, le problème des enquêtes sensibles ne relève pas d’une seule dimension réglementaire, même facilitée par la Directive européenne. Les conflits éthiques ne trouvent pas de solution juridique. Une information de l’enquêté loyale, certes, mais trop empreinte de formalisme risque d’induire des biais sélectifs désastreux. L’arbitrage juste entre ces deux exigences est délicat. De même, l’appréciation du caractère « adéquat, pertinent et non excessif » des données s’avère particulièrement difficile dans le domaine de la recherche car cette pertinence ne peut être qu’hypothétique avant l’aboutissement d’une recherche novatrice. Conscients de cette difficulté, les responsables de la CNIL ont favorisé l’émergence de comités d’éthique de la recherche. Au demeurant la responsabilité du chercheur est entière à l’égard de l’enquêté.

Benoît Riandey

 

Références

1. M. Aulagnon, Le Monde, 2 novembre 1995.
2. Actes du colloque « Démographie statistique et vie privée » : I législation et collecte démographique. II Les enquêtes sur les sujets sensibles. INED. A paraître en 1996, sous la responsabilité du présent auteur (fax de B. Riandey à l’INED : 42 18 21 92).
3. Protection de la vie privée, Informatique et progrès de la documentation statistique, Eurostat 9C, Numéro spécial 1986.
4. Document du CERC n° 98, 1990. La Documentation française.
5. « Sexualité et sciences sociales », Population n° 5 1993 pp. 1267, 1275.

 
Pénombre, Avril 1996