Actualité web & High tech sur Usine Digitale

“Pour la première fois, on peut indexer toutes les discussions autour d'une même œuvre littéraire”

Twitter Facebook Linkedin Google + Email
×

L'entretien Humanités numériques Entretien Le web, les medias sociaux, et le numérique en général, font apparaître de nouveaux objets littéraires, courts, collaboratifs, délinéarisés. Autant de sujets d’études qui captivent les chercheurs en littérature. Mais pour ces scientifiques, le numérique est aussi un outil puissant, qui leur ouvre de nouveaux territoires. Alexandre Gefen, Chargé de recherche au Centre d'Étude de la Langue et des Littératures Françaises pour le CNRS-Université Paris 4 et membre du directoire de l’observatoire de la vie littéraire (Obvil), observe depuis plus de quinze ans cette double évolution. 

“Pour la première fois, on peut indexer toutes les discussions autour d'une même œuvre littéraire”
"Extrait" d Alienare, oeuvre pour iPad de Chloé Delaume et Franck Dion. Editions du Seuil © Capture écran

L’Usine Digitale : Le numérique est-il vraiment le creuset pour de nouvelles formes de création littéraire ?

Alexandre Gefen : Oui, il propose des objets autres que les livres sous forme de texte, de multimédia, d’hypermédia… L’approche numérique est souvent très différente de la littérature traditionnelle. Elle est non linéaire, profondément interactive, collaborative...  C’est le cas d’Alienare de Chloé Delaume, par exemple, un livre numérique, interactif, non linéaire, sous forme d’app mobile. Les laboratoires d’Orange travaillent aussi sur de nouvelles formes littéraires avec la BNF par exemple. On trouve aussi des textes géolocalisés par certains écrivains pour des musées ou des communautés urbaines.

 

Le laboratoire canadien NT2 (laboratoire de recherches sur les œuvres hyper médiatiques) recense ces nouvelles formes d’écriture et a identifié plusieurs centaines d’œuvres. Même si ces formes nouvelles sont toutes inventées à partir des outils numériques, elles sont à la limite de l’art. Elles se rapprochent du roman, mais aussi des nouvelles, des contes. Il est difficile de les catégoriser. Comment nommer, par exemple, une œuvre pour laquelle les trois quarts du travail est fait par le lecteur ?

 

Ce sont aussi des espaces où les écritures d’écrivains sont rejointes par des écritures "ordinaires". Comme sur la plate-forme Wattpad où tout le monde peut partager un texte, amateur ou écrivain déjà publié. Sur les sites de "fan fiction", on trouve des milliers de réécritures de Harry Potter, par exemple. Tout cela, c’est ce que l’on appelle de la littération, de la littératie de masse. Et cela peut aboutir à l’émergence de nouveaux écrivains.


L’écriture brève, en 140 signes sur Twitter par exemple, fait-elle aussi partie de votre champ de recherche ?

Bien sûr. Il existe ce qu’on appelle les Twaiku, des haikus de 140 signes ! Twitter est aussi un outil de création de romans en petits morceaux. Sur Facebook, on trouve des poèmes. L’écriture par statut est aussi une nouvelle forme d’écriture. En fait, les internautes détournent l’usage de ces réseaux sociaux  pour écrire de la poésie.

 

On entend pourtant souvent que le SMS, ou Twitter, et le numérique en général appauvrissent le langage, et détournent les internautes de la lecture et de l’écriture. Qu’en est-il vraiment ?

Nous sommes noyés par la surabondance sur Internet. Et bien, la brièveté pourrait justement devenir une nouvelle machine à penser ce monde dans lequel on peut avoir tendance à se replier, à s’isoler. Par ailleurs, je pense qu’écrire sa vie, l’inventer, sur les réseaux sociaux, entraîne plutôt un recours plus important au sens de la phrase, de la parole. Il est certain que l’ancienne correspondance, sur papier, a tendance à disparaître. Et il y a beaucoup de simplification. Certains comme l’écrivain Richard Millet ont une vision négative du phénomène et parlent de post-littérature. Mais en réalité, c’est plutôt une littérature diffuse, gazeuse, qui n’interdit absolument pas à la littérature traditionnelle, aux formes longues, difficiles, d’exister. Bien au contraire !

 

 

Le numérique transforme l’objet littéraire depuis les débuts du Web. Mais comment le numérique et la recherche en littérature se sont-il rapprochés ?

Il y a 15 ans, j’ai fondé le site Fabula. On peut considérer qu’il a fait partie de la première vague d’humanités numériques, ce rapprochement entre numérique et sciences humaines. C’était en effet l’un des premiers sites sur l’actualité de la recherche en littérature ouvert à tous. La deuxième vague est venue avec l’édition critique, l’analyse linguistique sur les mots qui apparaissent ou disparaissent par exemple, l’utilisation de méthodes statistiques… La troisième s’est intéressée à la production littéraire des écrivains et des amateurs dans le numérique. C’est là que l’on a commencé à étudier les blogs, les réseaux sociaux, l’hypertexte, le travail de certains écrivains sur CD Rom puis sur le web… C’est un des champs très importants des humanités numériques.

 

La quatrième vague est-elle celle de l’analyse quantitative, du big data de de la littérature et de la culture ?

Il est difficile de dire s’il s’agit d’une nouvelle vague. Mais c’est un mouvement très important pour l’histoire des idées, pour l’esthétique… On peut utiliser Google Books ou des développements spécifiques pour trouver les rapports entre différents écrivains. On peut réaliser des cartographies d’échange d’idées ou de formules. On peut procéder à l’analyse de la reprise d’autres textes…. On peut mettre la littérature en relation avec d’autres sciences humaines.


Concrètement, quels nouveaux types de recherche les humanités numériques autorisent-t-elles ?

Prenons par exemple le corpus énorme que constitue l’œuvre intégrale de Molière dans la Pléiade. Dans la scène du pauvre de son Don Juan, il y avait des formules qu’on ne comprenait pas. Avec des méthodes de big data, on a fini par les retrouver dans les manuels de charité présents dans la bibliothèque numérique Gallica. C’est un moyen de vérifier des intuitions. On peut aussi procéder à des analyses linguistiques pour savoir pourquoi certains écrivains sont plus lus que d’autres. Est-ce parce qu’ils utilisent certains mots ? Parce que leur vocabulaire est plus varié ?

Il y a quelques jours, The Guardian a publié un article sur des scientifiques polonais qui ont découvert une structure fractale dans Finnegan’s wake de James Joyce. C’était une incroyable surprise ! Ils ont rapproché la structure linguistique de la structure mathématique.

 

Les chercheurs disposent d’une quantité quasiment infinie de textes et d’expressions écrites en ligne. Quand vous évoquez le big data de la culture, parlez-vous de la capacité d’explorer ces bases ou du big data tel qu’on l’entend pour l’entreprise ?

Le big data de la culture, cela peut effectivement être des masses de livres, de journaux, la bibliothèque numérique Gallica, Google Books, l’ensemble des commentaires Amazon sur une œuvre, le forum Babelio (forum de discussion aux allures de café littéraire en ligne, ndlr), etc. Amazon, par exemple, sait combien de temps vous mettez pour lire une page… Et pour la première fois dans l’histoire, on peut indexer toutes les discussions qui concernent une même œuvre.

 

Parmi les outils d’analyse de la littérature, quelle est la place du machine learning, de l’intelligence artificielle ? Peut-on aller jusqu'à reconnaître le style d’un auteur dans une œuvre ?

On peut demander à une machine d’apprendre à reconnaître la préface d’un roman, ou à identifier un sonnet parmi un ensemble de poèmes. Nous travaillons avec l’ANR, l’université Paris 3, l’université de Chicago et Stanford sur une expérience qui permet de voir quelle page réécrit d’autres pages, dans une encyclopédie par exemple. J’ai dirigé le numéro d’aout-septembre de la revue Critique sur ces sujet (Des chiffres et des lettres, les humanités numériques, ndlr). Mais la reconnaissance du style reste toujours très polémique. On a déjà essayé d’invoquer la recherche informatique pour prouver que c’était Corneille qui avait écrit les pièces de Molière... 

L'Obvil, un laboratoire qui repense la littérature à l'ère numérique
Le laboratoire Obvil (Observatoire de la vie littéraire) dont Alexandre Gefen est membre du directoire, est un des des laboratoires d’excellence (Labex) créés en 2012 dans le cadre des investissements d’avenir. Il réunit des chercheurs en sciences humaines de l’université Paris IV Sorbonne et des chercheurs en informatique de Paris VI. Loin d’être uniquement consacré à l’usage des logiciels pour l’étude de la littérature, l’Obvil repense l’histoire de cette dernière, la vie littéraire, etc. à l’ère du numérique. Ses chercheurs s’appuient sur des analyses de textes numérisés, sur la traduction automatique, l’analyse lexicographique…. Les équipes du laboratoire travaillent aussi à la conception d’un futur mastère en humanités numériques. 

Réagir

* Les commentaires postés sur L’Usine Digitale font l’objet d’une modération par l’équipe éditoriale.

media

Les cookies assurent le bon fonctionnement de nos sites et services. En utilisant ces derniers, vous acceptez l'utilisation des cookies.OK

En savoir plus
Suivez-nous Suivre l'Usine Digitale sur twitter Suivre l'Usine Digitale sur facebook Suivre l'Usine Digitale sur Linked In RSS Usine Digitale