Petr Plechac, un chercheur de l’Académie tchèque des sciences, à Prague, s’est servi de techniques liées à l’apprentissage machine pour identifier les sections de la pièce de théâtre Henry VIII qui ont été écrites par William Shakespeare, et celles qui ont été rédigées par John Fletcher. Les conclusions de ces travaux ont été mises en ligne sur le serveur de pré-impression arXiv.
Shakespeare a vécu et oeuvré de la fin des années 1500 au début des années 1600, et compte divers classiques à son actif, dont Hamlet, Macbeth et Roméo et Juliette. On lui attribue aussi la paternité de la pièce Henry VIII, bien que la plupart des historiens s’entendent sur le fait que le « Barde » a eu de l’aide pour en rédiger le texte.
Plusieurs d’entre eux estiment que son collaborateur était un auteur de théâtre du nom de John Fletcher. Dans le cadre de ces nouvelles recherches, M. Plechac s’est demandé si les techniques d’apprentissage machine pouvaient être utilisées pour déterminer quelles sections de la pièce étaient écrites par Shakespeare, et lesquelles étaient écrites par Fletcher.
Pour tester son idée, il a conçu un algorithme d’apprentissage machine pour analyser des textes écrits et identifier certaines caractéristiques liées au style d’écriture d’un auteur. Il a ensuite « éduqué » cet algorithme en lui faisant « lire » plusieurs pièces de Shakespeare de la même période, comme The Winter’s Tale, The Tragedy of Cymbeline, The Tempest et The Tragedy of Corionalus. Il a ensuite fait de même avec plusieurs écrits de Fletcher, comme Monsieur Thomas, Valentinian, Bonduca et The Woman’s Prize. Enfin, il a présenté Henry VIII à l’ordinateur.
M. Plechac a également analysé certaines des oeuvres de Philip Massinger, un autre auteur de théâtre de la même époque, à qui ont attribuerait une collaboration à Henry VIII. L’algorithme n’est toutefois pas d’accord, n’ayant pas pu trouver de « preuves » de son écriture dans le texte de la pièce.