En pleine pandémie de Coronavirus, en France une controverse doublée d’une polémique a vu le jour autour de Didier Raoult, infectiologue à l’IHU de Marseille et de la Chloroquine. EuropeanScientist ouvre le débat en donnant la parole aux auteurs qui commentent « la querelle de la Chloroquine ». Pro et anti Raoult s’affrontent sur la « méthode Raoult » et ses propositions. Voici un texte de Marc Rameaux, statisticien de formation et auteur de plusieurs ouvrages qui prend la défense du médecin marseillais. Nous vous invitons à lire également l’analyse de Laurent Alexandre, qui lui a choisi la position critique.
Les essais cliniques randomisés : la méthode la plus fiable, non un absolu
Les essais en double aveugle randomisés sont la méthode la plus fiable pour tester l’efficacité d’un médicament:
- Les RCT éliminent tous les biais statistiques de la population de référence sur laquelle on a effectué la randomisation, sans avoir à postuler un seul a priori sur les variables influant sur la pathologie : le tirage aléatoire égalise leurs effets sur les deux populations comparées.
- Les RCT ont réfuté à plusieurs reprises des intuitions qui paraissaient évidentes. L’on a ainsi administré pendant plusieurs années de la Flécaïne, un antiarythmique, pour éviter les morts subites dues aux extrasystoles ventriculaires apparues lors d’infarctus du myocarde. Contrairement au raisonnement causal qui paraissait évident, la Flécaïne avait l’effet exactement inverse. Faute d’avoir testé ce médicament par RCT, des milliers de morts ont été provoquées par un raisonnement causal trop sûr de lui-même, qui n’a pas été soumis à une vérification rigoureuse.
Les RCT ne sont cependant pas un accès direct aux faits. La science n’a jamais accès directement aux faits, elle teste des hypothèses. Les essais en double aveugle randomisés sont la meilleure méthode de test. Ils ne sont pas la vérité absolue.
Les RCT sont ce qui permet d’éliminer le plus efficacement beaucoup de biais statistiques. Mais pas tous. Comme tout échantillonnage aléatoire, ils rencontrent trois limites :
1. Le tirage aléatoire ne peut jamais être fait sur toute la population mondiale. Il est réalisé sur une ou quelques sous-populations, circonscrites dans l’espace : les patients disponibles pour l’expérience, dans une ou quelques régions géographiques. On échantillonne aléatoirement sur ce qui est déjà un échantillon, qui lui n’est pas aléatoire. Il n’est donc pas garanti que le résultat des mesures soit généralisable partout.
Exemple : le degré d’obésité joue sur la virulence du COVID-19. Un échantillon randomisé sur une sous-population en France, en Crète ou aux Etats-Unis ne donnera pas les mêmes résultats. Egalement, la sous-population locale pourra présenter des particularités génétiques ayant une influence aussi bien sur l’action du COVID que sur le médicament. L’élimination des biais n’est effective que sur une population de référence limitée géographiquement, avec des caractéristiques génétiques, physiologiques et des modes de vie spécifiques à cette région. Pour généraliser, l’on réintroduit de façon plus ou moins implicite un a priori sur le fait que les variables en dehors de la région n’auront pas ou peu d’influence.
Ce point n’est pas un pinaillage méthodologique sur des situations ne se produisant jamais. Les contre-indications génétiques sont cliniquement très fréquentes. Exemple : l’allopurinol, un traitement contre les hyperuricémies, provoque des effets secondaires très nuisibles chez les patients dont le génotype comporte l’allèle HLA-B*5801. Or cet allèle est présent jusqu’à 20 % dans la population chinoise d’ethnie Han, 8-15 % dans la population thaïe, environ 12 % dans la population coréenne et 1-2 % chez les personnes d’origine japonaise ou européenne. Un RCT mené rigoureusement en Europe aurait donc très bien pu conclure à une bonne efficacité de l’allopurinol et découvrir qu’il n’est plus adapté lors de son administration en Chine, en Thaïlande ou en Corée.
2. La plupart des médicaments ont des contre-indications (ex : fragilité cardiaque pour l’hydroxycholoroquine). Il faudra donc éviter le test sur ces contre-indications si elles sont connues, ou scinder l’étude en deux populations distinctes (sous-groupes) si ces contre-indications sont découvertes au cours du test : un résultat moyen n’a plus d’intérêt clinique si le médicament a un effet bénéfique dans la plupart des cas mais létal pour certaines contre-indications.
3. Un traitement n’agit pas nécessairement directement sur la cause de la pathologie, mais peut se contenter de limiter ses effets. Exemple : cela reste à démontrer complètement, mais l’hydroxychloroquine semble avant tout empêcher « l’orage de cytokines », c’est-à-dire la surréaction immunitaire, qu’être un véritable antiviral. Cf l’excellent article du pharmacologue Michel Bendahan ci-après (1) . Autre exemple : certains traitements anti-grippaux inhibent l’action des calpaïnes, protéases qui accroissent la cascade inflammatoire de la maladie. Faute de disposer d’un anti-viral véritable, l’on agit sur les effets du virus de la grippe.
En conjonction avec le point 1. ci-dessus, il sera nécessaire de connaître ce mécanisme indirect pour interpréter correctement les résultats d’un RCT, si sa généralisation échoue ou est médiocre lors de l’extension à des populations beaucoup plus vastes.
Opposer RCT, observationnel et raisonnement causal : une polémique artificielle et bien peu scientifique
Les trois limites des RCT nécessitent de revenir à un raisonnement causal ou à des données observationnelles à certains moments de l’étude. Des observations antérieures peuvent alerter sur certains dangers de contre-indications plutôt que de les essayer au hasard. Un raisonnement causal assorti d’observations permet de mieux cerner l’action directe (anti-virale) ou indirecte (inhibition des agents responsables de la cascade inflammatoire) du traitement, indispensable pour interpréter correctement les résultats du RCT et décider de re-scinder l’étude en sous-groupes plus précis.
Pour ces raisons, tout statisticien alterne les vérifications randomisées et les raisonnements de causalité ou d’observation. Ceci est valable dans toutes les utilisations de la statistique, pas seulement en médecine. Un data scientist expérimenté intègre cela à son travail au quotidien : une étude randomisée nécessite de s’y reprendre à plusieurs fois, de faire varier les sous-groupes et les stratifications. Pour ces étapes, le statisticien réintroduit des a priori, les teste à nouveau par des RCT plus fins, revient ensuite à des raisonnements de causalité ou des observations pour les interpréter, et ainsi de suite.
En statistique, il existe toujours un postulat non statistique sur les variables explicatives. La rigueur du calcul des probabilités ne doit pas aveugler : le calcul porte sur un champ de variables et de biais identifiés a priori. Tout échantillonnage porte avec lui un modèle sous-jacent, c’est-à-dire une relation entre des variables explicatives et une variable expliquée : le tirage aléatoire ne nous fait pas atteindre l’objectivité divine ou « les faits », il n’est qu’une mise à l’épreuve efficace de nos hypothèses et comporte des hypothèses a priori implicites dès que l’on sort de la population de référence ayant servi au tirage.
La statistique ne pense ni ne décide à notre place. Elle soumet nos hypothèses à une mesure quantitative de fiabilité la plus rigoureuse possible, ce qui est déjà très bien. Elle aide également à savoir où chercher, si des biais inattendus apparaissent, en évitant de mélanger toutes les causes concourant au résultat, ce qui est également très bien. Mais nul n’échappe à une interprétation et une vérification humaine, pour savoir si l’échantillonnage aléatoire est effectivement représentatif ou s’il renferme encore des biais non repérés. La statistique ne dispense pas des connaissances sur le métier auquel elle s’applique : ceci est valable en médecine ou dans tout domaine industriel (nucléaire, aéronautique, automobile, ..) auquel on applique un contrôle randomisé : une analyse organique est nécessaire. Seuls les data scientists débutants pensent qu’ils peuvent se passer de la connaissance du métier auquel ils appliquent leurs algorithmes.
Les fantasmes suscités par la « neutralité » du hasard
Des dérives n’ayant plus rien de scientifique ont – pour la raison précédente – accompagné la généralisation des RCT. Le fantasme d’une décision automatisée et « objective » attire les politiques qui ne veulent pas prendre de responsabilités ou d’engagement, en se réfugiant derrière une procédure. Malheureusement pour eux, toute procédure aussi rigoureuse soit-elle nécessite une interprétation, des hypothèses explicites ou implicites sur les a priori résiduels et in fine une décision, c’est-à-dire un choix politique.
L’autre dérive est que la nature « objective » du tirage aléatoire séduit les mégalomanes cherchant à présenter un débat en s’attribuant la seule position « objective » tandis que leurs contradicteurs seraient embourbés dans le marais de la subjectivité et de l’obscurantisme. Ils s’investissent alors de la mission d’éclairer l’humanité.
Cette attitude rappelle celle que j’avais dénoncée concernant le « fact checking » et la lutte contre les « fake news ». L’erreur est toujours la même : il n’existe aucune position privilégiée en matière de connaissance (le « point de vue de Dieu » disent ironiquement les logiciens). Il est dans la nature humaine de tenter des représentations imparfaites et partiales du réel. Ce qui leur donne une valeur scientifique n’est pas d’être infaillibles ou « objectives » ni « factuelles », mais d’avoir été confrontées aux vérifications les plus rigoureuses possibles. Plus les vérifications sont exigeantes et sévères, plus la connaissance qui y survit a de la valeur.
Ceci permet de renvoyer dos-à-dos les relativistes et les mégalomanes se sentant investis d’une connaissance absolue. Il y a à ce propos une terminologie inquiétante dans le terme d’« Evidence Base Medicine », qui me fait irrésistiblement penser au « Fact checking », la même mégalomanie et la même malhonnêteté intellectuelle consistant à s’approprier l’objectivité. Le glissement sémantique entre « essais randomisés », qui n’est qu’une demande légitime de davantage de rigueur et EBM, qui est la croyance que l’on est capable de lire directement les faits dans toute leur objectivité, résume la dérive de cet usage de la statistique.
Il n’existe pas une seule méthodologie de la preuve et la combinaison de méthodes qui seront nécessaires à une preuve n’est pas prédictible a priori
Il est stérile et inexact d’opposer la démarche randomisée, la démarche observationnelles et le raisonnement causal. Ces trois termes sont le trépied sur lequel s’appuie la preuve. Une preuve solide combine les trois, en les faisant s’alterner.
Dans le débat concernant le Pr Raoult, j’ai vu des interlocuteurs dénigrer totalement toute étude observationnelle comme n’étant d’aucune valeur et assortir leur propos de nombreux exemples où les études observationnelles se révéleraient systématiquement erronées. Le problème est que l’on peut très facilement trouver autant d’exemples où ce sont des RCT qui ont mené à des erreurs importantes (2) (3) (4). Lorsque des RCT sont appliquées aveuglément et n’itèrent pas avec des phases d’interprétation observationnelles ou causales, elles peuvent aboutir à des conclusions aberrantes.
Les études observationnelles, bien que moins rigoureuses que les RCT, ont une méthodologie qui leur est propre : l’application des critères de Bradford Hill (5). Il sera toujours possible d’exhiber des études observationnelles ayant échoué : dans la très grande majorité des cas, elles ne respectaient pas les critères de Bradford Hill.
Très souvent, les études nutritionnistes servent à démolir l’approche observationnelle : les recommandations nutritionnistes sont presque toujours des lieux communs sans aucune base scientifique, encombrant les magazines bas de gamme plus que des publications scientifiques : il faut dire que le thème fait vendre. Ce qui rend quasi impossible de faire du nutritionnel une science est que c’est un domaine où les confusions corrélation-causalité sont innombrables, ainsi que les inversions entre causes et effets. Des yuppies new-yorkais se sont ainsi convertis à la cuisine du sud-ouest de la France arrosée d’un Monbazillac, parce que l’on avait observé une plus grande longévité dans la région. Inutile de préciser que d’innombrables facteurs régionaux et contextuels rendent une telle transposition absurde.
Mais devant un tel enchevêtrement, plus aucune méthode statistique ne fonctionne : les RCT échoueraient tout autant, parce que cette fois les facteurs contextuels du mode de vie, des différences génétiques et physiologiques feraient se retourner les résultats comme une crêpe à chaque changement de population de référence. Chaque fois qu’un interlocuteur me présente l’échec d’une étude observationnelle comme une preuve de leur absence générale de valeur, je le renvoie aux critères de Bradford Hill, généralement jamais respectés.
Le dénigrement total et absolu des études observationnelles bute sur une autre incohérence : il faudrait dans ce cas considérer que la totalité des connaissances en médecine préalablement aux années 1920 sont une charlatanerie sans valeur, y compris les travaux de Pasteur. Je demande ainsi à ceux qui ne jurent que par les RCT seules de m’en montrer une seule datant d’avant 1920. C’est évidemment impossible, la théorie rigoureuse des probabilités sur laquelle elles s’adossent datant des travaux de Ronald Fisher. Elles ne sont par ailleurs devenues le meilleur standard de vérification reconnu en médecine que bien plus tard, systématisées seulement à partir des années 1960, ne serait-ce que parce qu’il fallait les moyens technologiques de calcul adaptés. Est-ce à dire que tous les autres travaux ne valent rien ? Il faut sortir de cet infantilisme.
L’observationnel, lorsqu’il respecte les critères de Bradford-Hill, constitue une base de connaissances très utile, complémentaire de celle des RCT. Il permet dans bien des cas de réorienter les RCT lorsque ceux-ci ont buté sur l’une de leurs limitations, et qu’il faut prendre du recul sur leur interprétation, notamment afin de circonscrire et anticiper les contre-indications lorsque l’on cherche à généraliser un RCT.
Enfin, l’opposition des « deux EBM », l’Evidence Based Medicine contre l’Eminence Based Medicine relève là encore plus du manichéisme et de la dévalorisation rhétorique que de la science. La réintroduction d’hypothèses a priori est – comme nous l’avons vu – inéluctable, ce qui n’empêche pas bien entendu de les tester ultérieurement.
Ce qui est caricaturé comme un argument d’autorité est une pratique qui a cours depuis des siècles en science et qui continuera d’advenir : la confirmation et le recoupement entre pairs, c’est-à-dire non pas l’affirmation arbitraire de l’autorité d’une seule personne sur sa réputation, mais la confirmation et la critique par une communauté de quelques centaines d’experts reconnaissant mutuellement leurs travaux, sur la base de leur formation académique et de leurs vérifications croisées.
Si l’on poussait à sa limite la croyance absolue en l’EBM, il n’y aurait plus besoin de médecins ou d’experts dans aucune discipline, seulement de statisticiens appliquant mécaniquement un calcul de probabilités. Egalement, toute parole aurait le même poids, quelles que soient les années d’études faites dans une spécialité : la démocratisation du savoir trouve sa limite dans le mérite à avoir accompli des études. Sans avoir nullement recours aux RCT, des générations de médecins et biologistes n’ont cessé d’échanger et de recouper leurs résultats par des expériences croisées.
Enfin, avant que les RCT n’existent, les études observationnelles employaient une échelle de temps bien différente de maintenant. Un RCT se suffit à lui-même : il est interprétable sur la population testée. Lorsque le Pr Raoult présente l’une de ses études observationnelles, il est évident pour lui qu’elle forme un corpus avec l’ensemble des études observationnelles sur le même sujet menées par des centaines de collègues, depuis plusieurs dizaines d’années et dans différents endroits du monde.
La connaissance d’une pathologie et d’un traitement est l’objet de pans entiers de leurs carrières. Et le souci de la représentativité statistique n’a jamais été absent des pratiques scientifiques avant les RCT : le long-terme temporel, le croisement avec les résultats de nombreux collègues et l’expérience de terrain partout dans le monde (le Pr Raoult est un grand connaisseur de l’Afrique) était une façon de se rapprocher de la représentativité statistique. Même moins rigoureuse que les RCT, cette démarche a pu produire des données de grande valeur.
Les personnes qui divinisent les tirages aléatoires et les RCT n’en ont compris le sens que très superficiellement. Elles ont généralement appris la statistique comme une technique formelle, qu’elles peuvent appliquer très rigoureusement dans leur domaine, mais sans en connaître les limites. Bradford Hill est issu du même creuset intellectuel que Pearson et Fisher. Ces pères fondateurs de la statistique moderne connaissaient très bien l’impossibilité d’un tirage aléatoire neutre et les questions épistémologiques sur les rapports entre causalité, corrélation et hasard que la statistique pouvait poser. Opposer l’analyse par tirage aléatoire et le raisonnement causal ou observationnel était pour eux un non-sens : ils ont forgé des outils rigoureux aussi bien pour l’un que pour l’autre.
Quand les parangons de la rigueur perdent totalement celle-ci
On peut reprocher plusieurs points au Pr Raoult et je ne suis pas le dernier à le faire. En tant que statisticien, certaines de ses études sans aucun groupe de contrôle m’ont plus qu’agacé : plus aucune comparaison n’est possible avec le taux de guérison naturelle !
Egalement, son dédain des méthodes randomisées affaiblit la force de ses travaux. Il ouvre des voies intéressantes par son talent, mais laisse en quelque sorte les autres terminer le travail : il ne va pas jusqu’à la démonstration. L’approche causale + observationnelle peut renfermer une grande valeur et c’est le cas de ses travaux. Mais si elle était admise comme référence de la preuve il y a des dizaines d’années, elle ne peut avoir ce statut de nos jours. Le causal et l’observationnel sont des compléments indispensables au RCT, mais ils ne sont plus suffisants à la prévention du risque sur un traitement.
Enfin, si le Pr Raoult avait fait quelques concessions aux RCT en janvier 2020, nous aurions gagné un temps et une précision précieux pour la prise de décision, quand ceux-ci nous manquent cruellement maintenant : l’administration ou non de l’hydroxychloroquine ne ferait aucun doute pour quiconque.
En revanche, le niveau d’argumentation de beaucoup trop de ses détracteurs laisse songeur : à côté d’eux, le Pr Raoult est un aigle de la rigueur démonstrative. Ceci est d’autant plus cocasse que ces contempteurs se prévalent de la rigueur scientifique. Si le Pr Raoult a fait quelques entorses à celle-ci, nombre de ses détracteurs commettent des erreurs beaucoup plus grossières :
- Ils défendent de façon totalement manichéenne les RCT contre l’observationnel, avec une absence totale de sens critique pour les premiers et un dénigrement qui fait table rase de toute l’histoire la médecine pour le second. Nous savons ce qu’il en est maintenant : cette opposition est fausse et puérile, ne provenant que de personnes ayant un faible niveau en statistiques.
- Ils ne respectent absolument pas les conditions de fonctionnement que le Pr Raoult a énoncées avec son protocole : comme tout bon observationnel, le médecin marseillais a décrit précisément et de façon transparente comment appliquer son traitement, sous quatre conditions :
- Seulement pour des personnes aux stades précoces de l’affection virale. Ce qui corrobore le fait que son traitement est davantage une prévention de l’orage de cytokines qu’un véritable anti-viral.
- En s’abstenant de l’administrer sur toute contre-indication, les plus fréquentes étant d’ordre cardiaque. Des dizaines d’années d’administration sur des millions de patients par des milliers de médecins ayant échangé et recoupé leurs résultats fournissent une connaissance précise des cas contre-indiqués. Prétendre que cette connaissance n’a aucune valeur relève de la malhonnêteté rhétorique, non du discours scientifique.
- En le combinant avec de l’azithromycine : le traitement du Pr Raoult est une bithérapie. Il a suffisamment répété que l’hydroxychloroquine seule n’avait pas de résultat.
- Dans le cadre d’une hospitalisation et sous suivi médical régulier.
La très grande majorité des études circulant dans les médias grand public contrevient à au moins un de ces quatre critères, chacun étant nécessaire. Je rejette 90% des publications de contradicteurs en quelques secondes par cette simple vérification. Le respect de ces 4 règles est pourtant beaucoup plus simple que le calcul d’un t de Student ou d’un F de Fisher. Comment des gens qui se prévalent de la rigueur peuvent-ils décemment faire comme si elles n’avaient pas été énoncées ?
Les résultats négatifs sont accentués à grand renfort de gros titres de journaux, se gardant bien de mentionner qu’ils ont eu lieu sur des patients en stade grave ou sans combinaison d’antibiotique, ou en montant en épingle la mort de deux patients cardiaques pour souligner le risque, ce que l’on sait depuis des dizaines d’années. Dans ce dernier cas, la violation de l’éthique est même scandaleuse : si une étude a laissé passer l’administration d’HCQ à des cardiaques, elle est criminelle. Les personnes portant ce genre d’argument sont supposées intelligentes. Même en étant bien disposé, on ne peut donc que conclure à leur malhonnêteté. On peut argumenter très fermement contre un contradicteur. Encore faut-il respecter le minimum d’éthique vis-à-vis de ce sur quoi il s’est engagé et a annoncé explicitement.
Espoir hasardeux ou calcul d’espérance mathématique ?
La prise d’hydroxychloroquine + azithromycine dans les conditions d’incertitude actuelles est présentée comme un pari hasardeux. Encore une fois – et tout ce qui précède le rappelle – je considère que le Pr Raoult n’a nullement apporté une preuve et on peut à bon droit le lui reprocher. Cette administration du traitement n’est cependant pas aussi irrationnelle qu’il y parait. Est-elle un espoir totalement hasardeux ou suit-elle un calcul d’espérance mathématique ?
Les termes en sont très simples, beaucoup plus qu’un calcul de significativité statistique :
- Soit Phcqm, la probabilité que le traitement fonctionne, c’est-à-dire fasse baisser même dans une faible proportion le taux de létalité du COVID-19. On remarquera que l’on n’affirme nullement que le traitement fonctionne. On évalue simplement la probabilité qu’il ait un effet, ce qui est le propre d’un calcul d’espérance mathématique. Fixons à 10% la valeur de Phcqm : seulement 10% de chance que le traitement ait un quelconque effet, même faible.
- Soit Rrhcqm, le ratio du risque de décès sans traitement sur le risque de décès avec traitement. Soyons pessimistes et fixons-le à 1,2 : le traitement, s’il marche (10% de chances), n’empêchera le décès que de 20% de la population qui serait morte sans traitement.
Le COVID-19 fait environ 3500 morts par jour dans le monde. En espérance mathématique, le traitement empêcherait le décès de 70 morts par jour. C’est très peu et c’est beaucoup : 2100 morts sur un mois, dans une hypothèse pessimiste sur les effets du médicament.
Bien évidemment, il faudrait soustraire à ces vies sauvées le nombre de morts dus à des effets secondaires létaux ou gravement handicapants : attention au syndrome de la Flécaïne ! On ne peut simplement se dire « si cela ne fait pas de bien, cela ne peut pas faire de mal ». Cette estimation est plus difficile : même si la probabilité est très faible (les contre-indications sont très bien connues), elle porte sur une population de référence bien plus vaste, ceux à qui l’on administre le traitement. Appelons Padveff cette probabilité.
Le bénéfice total en vies sauvées par jour, en espérance mathématique, du traitement du Pr Raoult serait :
Phcqm x (Rrhcqm-1) x 3500 – Padveff x Nb Patients traités
Toute la question du risque est de savoir si le terme négatif va l’emporter ou non sur le positif.
Je pense que ceux qui estiment qu’il faudrait administrer préventivement le traitement du Pr Raoult font ce type de calcul d’espérance mathématique. Le Pr Raoul a tort sur certains points de méthodologie mais raison pragmatiquement : en espérance mathématique, les effets secondaires létaux ont très peu de chances de l’emporter sur les guérisons, même sur une population importante, si l’on écarte du traitement tous les patients contre-indiqués : les bases observationnelles de son traitement sont beaucoup plus profondes qu’elles ne l’étaient sur le cas d’école de la Flécaïne. Et le compteur tourne, de plusieurs milliers de morts par jour. L’on fait ce type de calcul en situation critique, ou aucune décision n’est bonne, mais lorsque le temps court : comment maximiser ses chances de survie dans le crash d’un avion ou lorsque l’on croise un grizzly en forêt ? La situation est dramatique. Le calcul n’en est pas moins rationnel.
Une très grande scientifique, de capacités que je pense supérieures au Pr Raoult est d’un avis inverse : Françoise Barré-Sinoussi. Pour elle, les risques d’une administration du traitement sont trop élevés, par rapport aux guérisons potentielles.
Le Pr Barré-Sinoussi rajoute probablement un facteur additionnel à son calcul d’espérance mathématique : en situation de pandémie, la panique gagne au point qu’il est très difficile de contrôler la prise de médicament : par des voies détournées et clandestines, tout le monde s’en procure. Françoise Barré-Sinoussi a vécu la propagation du VIH dans des situations humaines dramatiques et a pu mesurer quels comportements pouvaient surgir en situation de désespoir. Son propre calcul d’espérance mathématique suit donc des hypothèses tout à fait rationnelles, tout autant que le calcul propre au Pr Raoult : tout dépend de la valeur que l’on fixe aux paramètres, qu’aucune méthodologie ne donnera.
Il ne me viendrait jamais à l’esprit de dénigrer ni Françoise Barré-Sinoussi, ni le Pr Raoult, de les traiter de charlatans et d’abaisser leur valeur scientifique. Ce sont pour moi deux grands scientifiques, d’avis différents sur cette estimation de risque. Les lynchages à l’emporte-pièce sont devenus le symbole de l’abaissement intellectuel de la nation et sont le fait d’esprits faibles. La criticité de la situation mériterait plus de dignité.
L’on peut encore une fois critiquer de nombreux points de la démarche du Pr Raoult et être en désaccord avec sa conclusion, pour des raisons hautement estimables. Encore faut-il le faire par des arguments non superficiels et de façon intellectuellement honnête. Surtout lorsque l’on prétend être un modèle de rigueur scientifique.
(1) https://www.lopinion.fr/edition/economie/coronavirus-mecanisme-derriere-chloroquine-tribune-michel-bendahan-215916
(2) https://academic.oup.com/ndt/article/28/4/826/1853056
(3) https://www.sciencedirect.com/science/article/pii/S0277953617307359
(4) https://voxeu.org/article/limitations-randomised-controlled-trials
(5) https://fr.wikipedia.org/wiki/Crit%C3%A8res_de_Hill
Retrouvez tous les textes de notre série la Querelle Raoult
Laurent Alexandre : L’intuition médicale tue
Marc Rameaux : A la recherche de la raison dans la controverse sur l’hydroxychloroquine
Claude Escarguel : Approches prophylactiques, préventives et curatives de l’infection à Covid19
François Vazeille : La Querelle Raoult (Série) : pandémie et post-modernisme
Laurent Alexandre 2 : Les 11 leçons politiques du Covid 19
Philippe Fabry : un nouveau Rossbach ?
Thierry Berthier : le big data une fantaisie délirante
Enfin un article posé dans ce débat de charretiers.
Merci de cette utile mise au point. Je souhaiterais y ajouter un élément oublié qui est le nombre absolu de cas nécessaire à une approche statistique pertinente.
Prenons l’exemple de la dernière étude de Raoult qui a inclus 1000 personnes et trouvé 8 décès. S’il avait scindé sa cohorte, avec 500 personnes dans le bras actif, il aurait eu entre 0 et 8 décès, la valeur la plus probable étant 4. Combien en aurait-il eu dans le bras contrôle et quelle serait la signification de ce nombre ?
Compte tenu des fortes incertitudes liées à ces petits nombres, un nombre entre 0 et 8 ne pourrait faire conclure qu’ à « une différence non significative ». Un nombre plus élevé serait significatif mais signifierait qu’on a sacrifié les cas en excès ce qui n’est peut être pas très éthique.
Compte tenu des aspects très variés de cette maladie, on n’aura sas doute JAMAIS les échantillons suffisants pour une quelconque analyse statistique « dans les normes ». Ou alors après des centaines de milliers de morts, ce que personne ne souhaite. Il faut donc penser une stratégie complètement différente. A mon avis multiplier les coups de sonde en espérant qu’un soit positif et ouvre la voie à un traitement.
@Un Physicien : justement, il faudrait un échantillon le plus significatif possible… Mais admettons que la différence ne soit pas flagrante à la fin, cela ne voudrait-il simplement pas dire que l’HCQ + Azitromicine n’a pas d’influence particulière tout simplement ? De plus, ce genre d’études devrait être réalisée par plusieurs hôpitaux de manière à avoir à la fin un ensemble d’étude permettant d’avoir un début de direction non? Ca permettrait d’éviter un éventuel jeu de test ‘out lier’ avec 0 signification statistique non?
Sympa l’article en tout cas, c’est chouette d’avoir des avis posés en effet.
Quelques points que je ne saisis pas par contre : dans la conclusion vous dites :
« Soit Phcqm, la probabilité que le traitement fonctionne » et vous utilisez ensuite 10%, en sous entendant que ce chiffre est surement sous évalué. De fait, le nombre de vie sauvées serait de 70 par jour.
Mais d’ou sort ce 10% ? C’est complètement à la louche. Il n’y a actuellement pas moyen de savoir si déjà l’HCQ a 10% de chance d’avoir un effet positif, ni même si elle ne peut pas potentiellement intér agir négativement avec le coronavirus… A moins que j’ai raté quelque chose quelque part ?
Je trouve que cette conclusion fausse un peu l’article (qui permet de mettre en perspective le sacro saint appel aux études randomisées) et donne ici l’impression d’un être qu’un gros argumentaire pro protocole Raoult. A moins encore une fois que j’ai raté quelque chose, ce qui est évidemment possible
L’étude est maintenant faite ici sur 96.000 patients de 671 hôpitaux : https://www.letemps.ch/sciences/lhydroxychloroquine-chloroquine-ne-seraient-efficaces-meme-nefastes-selon-une-etude
@ UN PHYSICIEN : Oui, c’est une dernière barrière des RCT. Le seul palliatif à ce stade est celui indiqué par @ PARA après votre post : mutualiser les essais sur plusieurs hôpitaux, ce peut aussi permettre de réduire les biais locaux.
@ PARA : Le « calcul » d’espérance n’est en rien un vrai calcul. J’ai « posé » ces valeurs pour fixer les idées : elles n’ont aucune justification précise.
L’idée était de montrer que l’on est dans la même situation que lorsque l’on cherche à maximiser ses chances de survie en rencontrant un Grizzly en forêt ou lors du crash d’un avion. La décision en environnement incertain et critique suit une logique, mais qui n’a plus rien à voir avec celle d’une preuve.
Dans ce genre de situation, on fait un raisonnement sur des ordres de grandeur, pas sur des valeurs exactes. Dans le cas de l’HCQ la probabilité d’action du traitement est faible mais celle d’effets secondaires est encore moindre.
Je ne soutiens pas à tout prix le protocole Raoult : je pense que le Pr Raoult n’admettrait pas mon raisonnement d’espérance mathématique, il est lui-même plus affirmatif sur son traitement. Mon point est que même avec des hypothèses faibles, la décision pragmatique serait d’adopter ce traitement en attendant mieux.
L’objectif principal de l’article, vous l’avez bien compris, était de replacer les RCT à leur juste mesure, pour éviter l’utilisation idéologique qui en est faite dans ce débat.
Marc
NON ! Il ne sert à rien de « pallier » aux faibles effectifs, au contraire. Il ne sert à rien de préciser la 2e décimale. Quand des milliers de gens meurent chaque jour, ces atermoiements ne sont pas de mise (pour parler gentiment).
L’important aujourd’hui est la vitesse et le nombre de pistes testées, en prenant en compte chaque jour les informations émergées la veille. C’est comme çà qu’on multiplie les chances de « tomber » sur un remède permettant de sauver des vies.
Je suis bien conscient que des expérimentations anarchiques peuvent présenter des dangers (qu’il faut essayer d’éviter évidemment) mais ils doivent être mis en balance avec le bénéfice qu’apporterait ne serait-ce qu’un seul jour d’avance dans la découverte d’un traitement.
Attention, des milliers de gens meurent chaque jour.
Loin de moi l’idée de minimiser la dangerosité du covid 19, mais il faut savoir que grâce à un certain nombre de mesure (avec un tête de liste le confinement) il est possible d’éviter un « ouragan ».
Et le rapport entre sa faible dangerosité (au niveau d’un individu) et sa grosse contagiosité fait que les coups de sonde sont compliqués à donner… Il est très dur d’étudier un remède à une maladie qui tue peu, et dont la grande majorité des infectés se sortent sans aide extérieur.
@Marc : Je trouvais juste que l’article – si lu un peu à la va vite – pourrait donner l’impression que les chiffres données aurait une quelconque valeur véridique, et je trouvais juste ça un peu dangereux 🙂 Typiquement j’ai peur que ce genre d’article soit repris comme une source de vérité (encore une fois je parle des chiffres, je n’ai rien à redire sur le raisonnement).
En revanche je ne suis pas d’accord avec l’affirmation suivante : « Dans le cas de l’HCQ la probabilité d’action du traitement est faible mais celle d’effets secondaires est encore moindre. » Aujourd’hui, rien ne permet de dire que l’HCQ n’a pas un effet délétère dans le cadre du traitement du covid 19. Alors certes ses effets mesurées sont connus et peu probables, il reste néanmoins impossible d’affirmer qu’un effet bénéfique de la molécule est plus probable (ce qui rend du coup le calcul de l’espérance mathématique un peu plus hasardeux).
Je suis en revanche de manière générale d’accord avec le principe d’espérance mathématique. C’est d’ailleurs ce qui m’a personnellement le plus attristé au début de cette polémique. En effet, une étude menée correctement par le professeur Raoult (disons sur quelques milliers de personnes) aurait – dans le cas ou en effet l’HCQ + Azithromycine avait un effet positif – conduit à quelques morts évitables à l’IHU Méditerranée mais aurait permis de sauver tellement de vie par la suite…
Certains avancent face à ce constat l’argument de l’éthique du médecin. Or cette éthique n’est remise en question que si le médecin n’utilise pas un traitement existant avéré plus efficace (cas dans lequel nous ne sommes pas!)
Bonne journée
@ Monsieur Rameaux et @ autres commentateurs,
Avez vous visionné la réponse de l’intéressé sur la question de la méthode, qui est intimement liée à l’éthique, à l’occasion de son audition devant la commission d’enquête parlementaire le 23 juin ?
Si non, voici l’extrait :
https://www.youtube.com/watch?v=K71LcQDnlOg&feature=youtu.be&t=11074
Personnellement, j’en déduis, depuis mon propre écosystème et ma propre expérience, que tout baratin théorique ne remplacera jamais la valeur de l’expérience concrète d’un(e) homme (femme) de terrain, qui plus est lorsque cette personne a déjà acquis une renommée mondiale dans son domaine.
On voit très bien dans cet extrait que Raoult n’est pas un guignol et qu’il est plutôt très sûr de lui… notamment quand il précise ce « nous verrons » qui en dit long…
Au regard des informations rapportées dans les différentes études, partir sur une hypothèse positive que » Dans le cas de l’HCQ la probabilité d’action du traitement est faible mais celle d’effets secondaires est encore moindre. » est ubuesque. On a pour l’instant aucun moyen de dire ça et plus le temps passe, plus les informations tendent à montrer un équilibre des deux facteurs négatifs. Actuellement la pharmacocinétique semble montrer l’impossibilité d’action (taux de concentration trop faibles pour qu’il puisse y avoir un effet positive clairement notable), et les différentes études cliniques sont toutes à dire que rien n’est clairement visible à part des effets secondaires bien identifiés eux ….
Donc je pense que la démarche de dire qu’en absence d’autres choses pour soigner c’est mieux que rien est très subjective et peu scientifique.
Très bon article.
Il est évident que les 2 approches décrites sont complémentaires et non antagonistes.
Par exemple, Raoult a eu l’intuition que HCQ était efficace. OK.
Il aurait pu et du enchaîner sur une étude en double aveugle et on serait fixé maintenant.
Au contraire il persiste en se basant sur un échantillon biaisé. Il choisit en effet ses patients parmi ceux ne présentant pas de contre-indications à HCQ ce qui est normal. Mais ces derniers sont aussi très souvent des patients à risques pour le covid. En exagérant il sélectionne donc les patients à risque faible et cela de bonne foi. Et après il claironne : « ça marche ».
Un parallèle peut être fait avec les 1000 marins du Charles De Gaulle. On aurait pu les traiter avec n’importe quoi (pas trop toxique quand même) et affirmer : « ça marche avec une guérison extraordinaire de 99.9% »
Maintenant l’argument « on a rien donc pourquoi ne pas essayer ? » peut être appliqué à toutes les molécules et association de molécules.
Avec des résultats potentiellement désastreux.
Bonjour,
Merci pour cet article très intéressant.
Je pense par contre que vous faites une petite erreur quand vous notez: « Seulement pour des personnes aux stades précoces de l’affection virale. Ce qui corrobore le fait que son traitement est davantage une prévention de l’orage de cytokines qu’un véritable anti-viral. ».
Son traitement est administré dans la phase précoce (phase virale: réplication du virus) et ils parlent par contre d’un effet anti-viral. Voir étude sur l’effet in-vitro sur le virus et aussi son premier article sur la réduction de la charge virale (qui d’ailleurs on l’oubli souvent dispose d’un groupe contrôle; même si je l’accorde volontiers il y a probablement un biais lié au stade de la maladie).
Il y a effectivement des études qui semblent porter sur une phase plus avancé (orage de cytokines). Efficace du à l’effet immunomodulateur de l’hydroxychloroquine ?
Que pensez-vous de la valeur de sa dernière étude qui essaie de comparer ses résultats avec d’autres études ? https://www.mediterranee-infection.com/randomised-controlled-trials-during-epidemic/
Merci.
Très bon article mais on apprécierait que monsieur Raoult se montrât aussi peu péremptoire qu’en est l’auteur. A l’inverse, il assène de nombreuses approximations, prédictions hasardeuses et contre-vérités fâcheuses.
En outre, il serait préférable que monsieur Raoult cesse de dénigrer les personnes qui travaillent dans d’autres domaines que le sien dans le but de justifier ses propres activités.
« que l’est l’auteur de cet article », pardon !
Merci pour votre commentaire. Encore une fois il s’agit moins d’écrire sur Didier Raoult que sur « pourquoi cette querelle a eu lieu ». Il me semble bien que cela dépasse la seule attitude des uns et des autres, même si il y a forcément des « protagonistes », sur lesquels il faudrait sans doute écrire un autre texte.