Molière était bien l’auteur de ses pièces d’après une nouvelle enquête statistique pourtant sur l’intégralité de son œuvre.
Depuis 1919 et un double article de Pierre Louÿs, dont le plus connu est intitulé « Molière est un chef-d’œuvre de Corneille », un doute existait sur la parenté des œuvres de Jean-Baptiste Poquelin, dit Molière, l’homme qui a donné son nom à la langue française. L’écrivain y affirmait que l’auteur était responsable de la plus grande supercherie littéraire de notre histoire littéraire, ayant en réalité faut rédiger ses œuvres en sous-main par l’auteur non moins illustre, Pierre Corneille.
Les tenants de cette théorie ont eu un second moment de gloire, avec la publication en 2003 d’une étude menée par le linguiste Dominique Labbé. Ce dernier avait passé les textes de Corneille et de Molière dans un mixeur lexical qu’il avait créé, et en concluait de la validité de la thèse dite « cornélienne ». Mais ces résultats se voient aujourd’hui complètement invalidées par une étude publiée mercredi dernier dans la revue américaine Science Advances.
Le document explique « comment un comédien, présumé sans grande éducation littéraire, à la fois valet de chambre du roi et directeur de troupe de théâtre, aurait pu écrire tant de chefs-d’œuvre ». Les Français Florian Cafiero, chercheur à l’école Polytechnique, et Jean-Baptiste Camps, de l’école nationale des Chartes, ont réussi à écarter les hypothèses de parenté cachée des œuvres de Molière, exactement un siècle après le lancement de la polémique.
« Le principe général consiste à mesurer un degré de ressemblance entre chacun des textes, puis à regrouper ces derniers en ensembles homogènes grâce à des algorithmes dit de ‘partitionnement de données’. Pour cela, on commence par identifier les éléments révélant la plume de l’auteur : les formes lexicales, grammaticales, les préfixes, les rimes, etc », note l’étude. « On soumet ensuite des textes de Corneille, de Molière et d’autres auteurs à un algorithme, sans lui indiquer qui a écrit quoi, et on lui demande comment il les regrouperait, en fonction des différentes propriétés relevées. »
« La puissance de calcul des ordinateurs permet ainsi d’appréhender un grand volume de textes avec beaucoup de précision » poursuit l’auteur. « Nous nous sommes retrouvés dans cette controverse par hasard, dans un cours que nous donnons de philologie computationnelle. On a pris cette controverse en exemple », explique Florian Cafiero. « Quelles que soient les techniques utilisées en cours, on s’est rendu compte que ça mettait en doute les précédentes études linguistiques », explique le chercheur.
Ces travaux ont permis d’établir que les pièces de Molière possèdent des caractéristiques communes évidentes, qui n’ont rien à voir avec celles des autres auteurs de l’époque. De tous les auteurs de l’époque inclus dans l’étude, ce sont même des œuvres de Pierre Corneille qu’elles divergent le plus. « Nous avons eu la chance d’arriver dans ce débat sans a priori : à l’origine, nous cherchions juste un exemple amusant pour intéresser nos étudiants à la linguistique computationnelle » précisent les auteurs, avant de conclure en chœur : « La question est tranchée ! ».