Le texte suivant prolonge la réflexion sur la notion de risque (v. nos 19 et 21) et son mode de calcul.
Si on connaît le risque du fumeur ainsi que celui d’un alcoolique d’être atteint d’un cancer, que peut-on dire du risque du fumeur alcoolique ? Si on suppose les effets de l’alcool et du tabac indépendants, est-ce que les risques se multiplient ou s’additionnent ?
Pour tenter de résoudre cette controverse, nous devrons préciser suffisamment les mots que nous emploierons pour éviter toute ambiguïté. Mais pour cela nous allons devoir faire un peu de mathématiques, "2000, année mondiale des mathématiques" oblige !
Avant de poursuivre, permettons-nous une courte digression. Les résultats d’UTOPIA, l’entreprise du rêve, ont été très bons cette année. Aussi UTOPIA a décidé de récompenser de manière uniforme l’excellence du travail de tous ses salariés. Comment interprétez-vous la dernière phrase ?
a) Chaque salarié va recevoir une prime d’un égal montant.
b) Chaque salarié va voir son salaire augmenté d’un pourcentage identique.
Uniformité du montant ou uniformité du pourcentage ? Dans les deux cas, vous pourrez dire que les bénéfices ont été répartis indépendamment de la catégorie (service commercial, technique ou administratif) du salarié. La première phrase fait référence à un modèle additif, la seconde à un modèle multiplicatif. Quand l’État augmente d’un point l’indice de chaque fonctionnaire, il choisit la première interprétation ; quand il augmente la valeur du point, il privilégie la seconde.
Revenons à nos risques
Nous supposons dans toute la suite avoir parfaitement défini ce qu’est un fumeur, un alcoolique et un cancer. On suppose que, hormis la consommation du tabac et de l’alcool, tous les individus ont des comportements identiques (du point de vue risque de cancer). Pour quantifier la notion de risque, nous devons définir un modèle mathématique, nous le ferons sous forme de jeu. Nous disposons d’un paquet de cartes qui sont de deux types, les unes sont totalement blanches, sur les autres est indiqué : CANCER ! La proportion de cartes perdantes (cancer) est p. Notre paquet contient suffisamment de cartes pour qu’au fil des tirages la probabilité qu’une carte soit perdante reste égale à p.
Jeu A
Le joueur doit tirer une carte du paquet. S’il fume, il doit tirer également n-1 cartes du paquet. S’il est alcoolique, il devra tirer m-1 cartes supplémentaires. Un fumeur alcoolique sera donc en possession de n+m-1 cartes, un non-fumeur sobre d’une seule.
Le joueur a perdu si au moins l’une de ses cartes est perdante. La probabilité qu’un joueur perde vaut :
p s’il est non-fumeur et sobre,
1-(1-p) n s’il est fumeur et sobre,
1-(1-p) m s’il est non-fumeur et alcoolique,
1-(1-p) m+n-1 s’il est fumeur et alcoolique.
Remarques :
1. Tout joueur est obligé de tirer au moins une carte. Le risque zéro n’existe pas… sauf si p est nul. Le paramètre p est la probabilité d’être atteint par le cancer naturellement, par opposition à "à cause du tabac" ou "à cause de l’alcool".
2. Quand un joueur a perdu, il peut savoir quelle(s) carte(s) en est la cause. Ce n’est pas comme dans la vie où la ou les causes du cancer ne sont pas toujours déterminées avec certitude.
3. Les effets tabac et alcool sont indépendants, au sens où les événements "avoir un cancer à cause du tabac" et "avoir un cancer à cause de l’alcool" sont deux événements indépendants. La probabilité que les deux se réalisent est égale au produit des probabilités de chacun d’eux.
Quelques définitions :
1. Le risque absolu du fumeur est la probabilité que sa consommation de tabac lui donne un cancer.
2. Le risque relatif du fumeur est le rapport de la probabilité pour un fumeur d’être atteint d’un cancer sur la probabilité pour un non-fumeur non alcoolique d’être atteint d’un cancer. Le paramètre p peut être vu comme l’unité de mesure du risque relatif.
On définit de la même manière le risque absolu de l’alcoolique, celui du fumeur alcoolique et le risque relatif de l’alcoolique et celui du fumeur alcoolique.
La notion de risque relatif dépend du choix du témoin, ici un non-fumeur, non alcoolique. Elle serait différente si, par exemple, notre témoin devait être un non-fumeur, non alcoolique n’ayant eu aucun contact avec l’amiante etc.
Remarque :
Si p est petit et k pas trop grand, alors
(1-p) k-1 ≈ 1-kp
On montre qu’alors les risques absolus sont approximativement additifs, En effet, la probabilité qu’un joueur perde vaut approximativement :
np s’il est fumeur et sobre,
mp s’il est non-fumeur et alcoolique,
(m+n-1)p s’il est fumeur et alcoolique.
Le risque absolu du fumeur alcoolique qui vaut approximativement (m+n-1)p est bien l’addition de
1. p, le risque naturel,
2. (n-1)p, une approximation du risque absolu du fumeur,
3. (m-1)p, une approximation du risque de l’alcoolique.
Nous avons la même propriété pour les risques relatifs.
Il est naturel que les paramètres n et m soient fonctions croissantes de la consommation de tabac et d’alcool. Pour faire simple, considérons-les proportionnels à la consommation quotidienne du poison (tabac ou alcool) mais cela n’est absolument pas essentiel dans la suite de notre propos. Tout ce que nous avons écrit sur l’analyse du jeu A reste vrai. À savoir les risques s’additionnent, autrement dit le risque de cancer se décompose (par une addition) en risque dû au tabac et en risque dû a l’alcool, mais il n’y a pas d’effet combiné. Le statisticien dit qu’il n’y a pas d’interaction.
Jeu B
On dispose du même paquet que pour le jeu précédent.
a) Le joueur doit tirer une carte du paquet.
b) S’il fume, il doit tirer également autant de fois n-1 cartes qu’il a de cartes déjà en main.
c) S’il est alcoolique, il doit tirer également autant de fois m-1 cartes qu’il a de cartes déjà en main.
Un fumeur alcoolique aura donc nm cartes. Un non-fumeur sobre une seule.
Le joueur a perdu si au moins l’une de ses cartes est perdante.
Dans ce jeu, les étapes b) et c) peuvent être permutées, cela ne change rien, nous ne distinguons pas le fumeur alcoolique de l’alcoolique fumeur.
Si la proportion de cartes perdantes est p dans le paquet, la probabilité qu’un joueur perde vaut :
p s’il est non-fumeur et sobre,
1-(1-p) n s’il est fumeur et sobre,
1-(1-p) m s’il est non-fumeur et alcoolique,
1-(1-p) mn s’il est fumeur et alcoolique.
Remarques :
Les risques relatifs alcool et tabac se multiplient. En effet, la probabilité qu’un joueur perde vaut approximativement :
np s’il est fumeur et sobre,
mp s’il est non-fumeur et alcoolique,
mnp s’il est fumeur et alcoolique.
Le risque relatif tabac vaut approximativement donc n, le risque relatif alcool vaut approximativement m et le risque relatif " tabac & alcool " vaut approximativement mn. Les risques relatifs sont donc approximativement multiplicatifs. En fait tout ce que nous avons écrit à propos des risques relatifs sur le jeu A reste vrai pour le jeu B à condition de remplacer addition par multiplication. Le statisticien dira encore qu’il n’y a pas d’interaction puisqu’il sait décomposer (mais par une multiplication) le risque de cancer en risque dû au tabac et en risque dû à l’alcool.
Contrairement à ce qu’écrit D. Schwartz, nous ne pouvons pas dire qu’il y a absence de synergie de l’effet tabac et de l’effet alcool car les effets tabac et alcool sont indiscernables, au sens où notre jeu ne permet pas de connaître la cause du cancer ; ce qui n’était pas le cas dans le premier jeu. Le nombre de cartes tirées dans la dernière étape dépend de ce qui s’est passé dans la seconde. Pourtant nous pouvons quantifier chacun des deux effets.
Pour cela, remarquons que :
mn = 1 + (m-1) + (n-1) + (m-1)(n-1)
1 est le risque relatif du témoin,
(m-1) est le risque relatif dû à l’alcool seul,
(n-1) est le risque relatif dû au tabac seul,
(m-1)(n-1) est le risque relatif dû à la combinaison alcool-tabac.
Nous voilà avec une addition ! On passe du premier modèle au second en lui ajoutant un terme d’interaction.
Pour le second modèle, nous nous sommes bien gardés d’user du mot indépendance, qui à notre avis aurait prêté à ambiguïté. Par contre, l’expression (du statisticien) "absence d’interaction" est justifiée dans les deux jeux, mais il faut avoir conscience que cette expression est relative à un modèle et ici les deux modèles sont distincts.
Reste une grande interrogation, comment, après avoir observé une population composée de fumeurs et de non-fumeurs, d’alcooliques et de non-alcooliques, de cancéreux et de non-cancéreux, choisir entre ces deux modèles et comment estimer les paramètres m et n ? Y répondre nous entraînerait dans des développements mathématiques sans doute trop longs.
Notre conclusion : à cumuler l’ambiguïté des mots, on multiplie le risque de malentendus.
Gérard Grancher et Elise Janvresse
Nota Bene : Des deux auteurs, l’un n’a jamais fumé et l’autre ne fume plus, et tous deux ne boivent que très modérément des boissons alcoolisées. Mais leur hygiène de vie ne date pas de l’écriture de ce texte !
Annexe
Cette annexe répond aux interrogations de R. Padieu, sur ce qui se passe si p n’est pas trop petit. Les approximations ne sont plus alors justifiées. Voyons ce que donne le second jeu pour quelques valeurs de p, n et m ; nous avons calculé le risque relatif exact d’un modèle multiplicatif.
risque naturel : p=0.001
m-1/n-1
|
0
|
10
|
20
|
30
|
40
|
0
|
1.000
|
9.955
|
19.811
|
29.569
|
39.230
|
1
|
1.999
|
19.811
|
39.230
|
58.264
|
76.921
|
2
|
2.997
|
29.569
|
58.264
|
86.110
|
113.133
|
3
|
3.994
|
39.230
|
76.921
|
113.133
|
147.924
|
risque naturel : p=0.01
m-1/n-1
|
0
|
10
|
20
|
30
|
40
|
0
|
1.000
|
9.562
|
18.209
|
26.030
|
33.103
|
1
|
1.990
|
18.209
|
33.103
|
45.284
|
55.248
|
2
|
2.970
|
26.030
|
45.284
|
59.527
|
70.062
|
3
|
3.940
|
33.103
|
55.248
|
70.062
|
79.972
|
risque naturel : p=0.1
m-1/n-1
|
0
|
10
|
20
|
30
|
40
|
0
|
1.000
|
6.513
|
8.784
|
9.576
|
9.852
|
1
|
1.900
|
8.784
|
9.852
|
9.982
|
9.998
|
2
|
2.710
|
9.576
|
9.982
|
9.999
|
10.000
|
3
|
3.439
|
9.852
|
9.998
|
10.000
|
10.000
|
Le premier tableau (risque naturel égal à 0,001) est très semblable à celui de D. Schwartz. Les risques relatifs sont quasiment multiplicatifs. Près de 15% des gros fumeurs très alcooliques sont atteints d’un cancer, leur risque relatif est de l’ordre de 150. Ce tableau illustre que, pour un risque naturel faible, l’approximation est excellente.
Le deuxième tableau (risque naturel égal à 0,01) diffère sensiblement de celui de D. Schwartz. L’augmentation du risque naturel conduit à une diminution des risques relatifs, mais à une augmentation des risques absolus. Près de 80% des gros fumeurs très alcooliques sont atteints d’un cancer, alors que leur risque relatif est de l’ordre de 80. Les risques relatifs n’apparaissent plus vraiment multiplicatifs, l’approximation est nettement moins bonne.
Le dernier tableau (risque naturel égal à 0,1) est très différent de celui de D. Schwartz. Les risques relatifs sont relativement faibles (par rapport à ceux des tableaux précédents), mais les risques absolus sont des quasi-certitudes de cancer. Les risques relatifs ne sont plus du tout multiplicatifs.
Pénombre, Novembre 2000