LePartisan.info À propos Podcasts Fil web Écologie Blogs REVUES Médias
Souscrire à ce flux
L’expertise universitaire, l’exigence journalistique

▸ Les 50 dernières parutions

08.06.2026 à 17:23

La Russie est-elle un État colonial  ?

Clémentine Fauconnier, Maîtresse de conférences, Université de Haute-Alsace (UHA)

Caucase du Nord, Tatarstan, Bouriatie, Iakoutie… : bien des régions de la Fédération de Russie ont été conquises par la force au cours des siècles.
Texte intégral (2333 mots)
*La conquête de la Sibérie par Ermak*, tableau de Vassili Sourikov peint en 1895, représente une bataille en 1582 entre les forces russes conduites par Ermak, un chef cosaque au service d’Ivan le Terrible, et l’armée du khanat de Sibérie. Musée Russe (Saint-Pétersbourg)

Si la Fédération de Russie est aujourd’hui l’État le plus étendu de la planète, c’est parce que, des siècles durant, l’empire russe dont elle est la descendante directe n’a cessé de s’agrandir à force de conquêtes vers l’Est et vers le Sud. Pour autant, si cette dimension impériale est bien connue et documentée, l’aspect colonial de l’État russe est longtemps demeuré un impensé. Or, impérialisme et colonialisme ne sont pas synonymes. Dans son ouvrage la Russie de Poutine. Du tournant autoritaire à la guerre, qui vient de paraître aux éditions Le Cavalier Bleu, la politiste Clémentine Fauconnier, maîtresse de conférences à l’Université de Haute-Alsace, chercheuse à l’UMR Sociétés, acteurs, gouvernement en Europe et cofondatrice du Collectif de recherche sur la Russie contemporaine pour l’analyse de ses nouvelles trajectoires, CORUSCANT, met en lumière les tensions internes à la Russie – où vivent de nombreux peuples non russes qui, souvent, conservent un sentiment national spécifique – et participe au débat en cours sur le caractère colonial de la guerre que le Kremlin livre actuellement à l’Ukraine. Extraits.


« Nous, les représentants des peuples autochtones et des régions colonisées de la Fédération de Russie, déclarons ouvert le processus de décolonisation complète et générale de la Russie. » Déclaration du Forum des peuples libres de la post-Russie, le 17 juillet 2022.

Fondé le 8 mai 2022 quelques semaines après l’invasion à grande échelle de l’Ukraine par la Russie, le Forum des peuples libres de la post-Russie s’est fait connaître par la diffusion d’une carte intitulée « L’Eurasie du nord en 2030 » représentant le territoire actuel de la Fédération de Russie morcelé en 41 États.

« L’Eurasie du Nord en 2030 » (cliquer pour zoomer). Forum des peuples libres de la post-Russie

Aussi radicale dans ses aspirations que controversée dans sa réception, l’initiative a cependant bénéficié d’un certain écho en multipliant les interventions en Europe, y compris au Parlement européen, en Amérique du Nord mais aussi au Japon ou encore à Taiwan. Fondé par l’entrepreneur ukrainien Oleg Magaletskyi, fervent soutien des révolutions orange et du Maïdan, les activités de ce forum sont emblématiques des enjeux de la mise à l’agenda de la dimension coloniale de la politique conduite par l’État russe, aussi bien à l’intérieur qu’à l’extérieur de ses frontières.

Un processus constitutif de la construction de l’État russe : de la grille impériale à la grille coloniale

S’il y a aujourd’hui consensus pour considérer le poids de l’histoire impériale de la Russie dans sa politique intérieure et extérieure actuelle, la dimension coloniale fait en revanche l’objet de débats bien plus marqués (Colin Lebedev, 2022).

Fondé en 1721 par le tsar Pierre le Grand, l’État russe a officiellement été un Empire pendant près de deux siècles, jusqu’à la révolution bolchévique. Pour autant, les siècles précédents ont été très fortement marqués par la politique d’expansion territoriale des dirigeants de la Grande principauté de Moscou (1263-1547). De même, la création du Tsarat de Russie (1547-1721) fait explicitement référence aux empereurs romains et byzantins : le terme de tsar constituant une version russifiée de César – titre des empereurs romains – tandis que la qualification par Ivan le Terrible de Moscou comme une « troisième Rome » marque la continuité avec les centres impériaux de Rome et de Constantinople. Officiellement anti-impérialiste, l’État soviétique n’en présente pas moins un certain nombre de caractéristiques impériales : expansion territoriale, centralisation du pouvoir et reconnaissance du caractère plurinational de sa population tout en octroyant une prééminence à la langue et la culture russes.

Auto-désignée comme « État multinational » selon la Constitution de 1993, la Fédération de Russie a conservé une structuration du territoire reconnaissant un petit degré d’autonomie aux régions historiquement peuplées de minorités – dites « nationalités » dans la terminologie russe : les républiques, les okroug et oblast autonomes. De même, elle a introduit la distinction entre citoyenneté et nationalité russe. L’adjectif rossiiskiï – parfois traduit « russien » en français – désigne, en effet l’ensemble des citoyens de la Fédération, là où celui de rousskiï désigne les Russes au sens ethnique du terme. S’il n’y a pas de discrimination formelle entre les différentes composantes de la population, il y a bien la mise en place d’un processus de différenciation et de hiérarchisation associé à un statut particulier accordé à la langue russe, dont la réforme constitutionnelle de 2020 précise qu’elle est « la langue du peuple constitutif de l’État » (art. 68).

Alimentée par les tentatives plus ou moins fructueuses de la Fédération de Russie de maintenir une emprise sur les anciennes républiques soviétiques devenues États indépendants, l’apposition d’une grille de lecture coloniale à l’histoire de la Russie émerge à partir des années 2000 sans cependant réellement pénétrer le champ intellectuel russe lui-même. L’invasion à grande échelle de l’Ukraine a modifié la donne. L’envoi massif de représentants des minorités ethniques, demeurant bien souvent dans les régions les plus éloignées et les plus pauvres, sur le front ukrainien agit comme un révélateur et suscite un mouvement de protestation d’une vigueur significative dans un paysage par ailleurs fortement marqué par la répression et le musellement de toute voix dissidente. En parallèle, on note l’apparition de différents médias en ligne – académiques, politiques ou culturels – et chaînes Telegram à destination du lectorat russe qui abordent désormais frontalement les enjeux liés au colonialisme (Vokuev, 2024).

Nier l’existence de la nation ukrainienne : l’invasion russe au prisme de la domination coloniale

Ne se recoupant que partiellement, les logiques impériale et coloniale supposent toutes les deux des processus de contrôle de la part d’un État sur un territoire et une population qui ne sont jamais totalement assimilés en restant dans une situation d’infériorité et d’altérité.

Si la domination impériale peut passer par la force et la conquête militaire, elle suppose néanmoins une certaine tolérance vis-à-vis des minorités, ainsi que des échanges entre cultures majoritaire et subordonnées. L’empire désigne un processus de formation de l’État, où le pouvoir est centralisé de façon autoritaire, bien souvent personnelle, mais où cette autorité s’exerce de façon hétérogène en incluant, de façon certes hiérarchique et différentielle, l’ensemble de ses composantes.

L’entreprise coloniale est, à l’inverse, davantage le fait d’une unité stabilisée – dont le régime politique interne peut-être autoritaire ou démocratique – qui s’engage dans une démarche de peuplement et d’exploitation unilatérale d’un territoire, éventuellement situé outre-mer, ainsi que de ses ressources. La frontière entre colons et colonisés est bien plus grande, la domination des premiers sur les seconds bien plus violente et systématique.

Comme le notent Adam Lenton et ses co-auteurs, le terme russe d’osvoienie (appropriation) utilisé par les autorités de la Grande principauté de Moscou au sujet de la conquête de la Sibérie au XVIᵉ siècle présente quelques points communs avec celui de colonisation tout en indiquant bien la volonté des dirigeants de se démarquer, en tout cas dans la terminologie, des entreprises menées en parallèle par les puissances européennes. C’est en revanche lors de la conquête de la Transcaucasie et de l’Asie centrale au XIXᵉ siècle que les vocables de koloniia et kolonizatsia font leur apparition, avec une connotation positive avant que le pouvoir soviétique n’inverse la donne en se réclamant anti-impérial et anti-colonial, deux syndromes alors exclusivement associés au bloc de l’Ouest (Lenton et al., 2025).

Néo-impériale, irrédentiste, coloniale : les différentes approches visant à mettre en perspective la guerre que la Russie fait à l’Ukraine ne sont pas mutuellement exclusives, mais elles permettent, chacune, d’insister sur des enjeux et des aspects particuliers. En affirmant que la guerre en Ukraine est coloniale, l’historien Timothy Snyder insiste particulièrement sur la volonté manifestée par Vladimir Poutine de nier l’existence même d’une nation ukrainienne et de qualifier son État d’artificiel. De même, la référence au colonialisme lui permet de dénoncer le peu de cas fait du droit des peuples à disposer d’eux-mêmes dans les échanges russo-américains depuis le début du second mandat de Donald Trump qui évoquent un possible découpage pérenne du territoire sans associer de représentants ukrainiens.

De la violence impériale à la violence coloniale, il n’y a pas qu’une différence de degré mais aussi de nature. Qu’il soit tsariste, soviétique ou post-soviétique, l’appropriation brutale par l’État russe de territoires, accompagnée de l’exploitation de leurs ressources et leur population avait fait l’objet d’un retour réflexif et donné lieu à l’émergence d’une grille de lecture coloniale de l’histoire du pays.

L’invasion de l’Ukraine a considérablement accru et politisé des critiques venant aussi bien du peuple ukrainien que des minorités vivant sur le sol de la Fédération de Russie et qui dénoncent autant le pillage des ressources naturelles pratiquées par l’État central sur leur territoire que la sur-représentation de leurs ressortissants parmi les combattants envoyés au front parfois contre leur gré. Dans ce contexte, le prisme de la décolonisation permet d’inscrire les préoccupations liées à l’espace historiquement dominé par la Russie dans le cadre comparatif plus large des études et des revendications décoloniales ou postcoloniales, même si cela suppose un travail d’adaptation et de redéfinition dans la mesure où ces théories ont, pour l’essentiel, visé à comprendre la domination historique et multiforme des pays du Nord vis-à-vis des Suds.

The Conversation

Clémentine Fauconnier ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

PDF

08.06.2026 à 17:22

Lire sur papier permet-il de mieux assimiler des informations que la lecture sur écran ?

Erik D Reichle, Professor of cognitive psychology, Macquarie University

Lili Yu, Senior Lecturer, Cognitive Psychology, Macquarie University

La lecture est l’une des compétences les plus difficiles à acquérir. Les supports numériques rendent-ils ce processus encore plus complexe ? Que dit la recherche ?
Texte intégral (2007 mots)
Quand nous lisons, nos yeux effectuent une série de mouvements rapides, appelés saccades. Michal Parzuchowski/Unsplash

La lecture est l’une des compétences les plus difficiles à acquérir. Les supports numériques rendent-ils ce processus encore plus complexe ? Que nous dit la recherche des différences entre lecture sur écran et lecture sur papier ?


Le gouvernement suédois a récemment annoncé qu’il renonçait à l’utilisation d’appareils numériques en classe pour revenir aux livres papier. Il a évoqué des inquiétudes liées à la baisse des résultats scolaires et à l’augmentation du temps passé devant les écrans.

Ces inquiétudes sont-elles fondées ? Et que dit la science des conséquences possibles des appareils numériques sur la lecture, en comparaison de la lecture sur papier ?

Pour répondre à ces questions, il convient de rappeler que, même si la lecture peut sembler une tâche facile, cette impression est trompeuse. La lecture est sans doute la compétence la plus difficile à acquérir : elle nécessite des années d’éducation formelle et de pratique pour être maîtrisée. Contrairement au langage oral, il s’agit d’une compétence à laquelle nous ne sommes pas biologiquement prédisposés.

Pourquoi lire est-il si difficile ?

Il faut d’abord en comprendre la physiologie de la lecture pour comprendre pourquoi cette tâche est si complexe.

Pendant que vous lisez cette phrase, vos yeux effectuent une série de mouvements rapides, appelés saccades, d’un mot à l’autre. Pendant ces saccades, le traitement de l’information visuelle est suspendu et n’est possible que pendant de brefs intervalles, appelés fixations, lorsque les yeux sont immobiles.

Des expériences visant à mesurer les mouvements oculaires pendant la lecture ont montré que nous fixons la plupart des mots, car notre capacité à extraire des informations visuelles lors de chaque fixation est extrêmement limitée.

Dans les langues, comme l’anglais ou le français, qui se lisent de gauche à droite, notre capacité à percevoir les caractéristiques qui distinguent les lettres est limitée à une petite zone du champ visuel appelée « champ de perception ». Ce champ s’étend de 2 à 3 espaces de lettres à gauche du point de fixation à 8 à 12 espaces de lettres à droite de celui-ci.

L’asymétrie de cette zone reflète le parcours du regard à travers le texte. Elle s’étend vers la gauche dans les langues comme l’arabe, qui se lisent de droite à gauche. La taille de cette zone est plus réduite pour les systèmes d’écriture denses, comme le chinois.

Nous savons également, grâce à des expériences d’oculométrie et d’imagerie cérébrale, que l’identification des mots prend du temps. Selon nos meilleures estimations, les informations visuelles mettent 60 millisecondes pour se propager des yeux au cerveau, et l’identification des mots nécessite ensuite 100 à 300 millisecondes supplémentaires (une milliseconde équivaut à un millième de seconde).

Ces contraintes limitent la vitesse maximale de lecture à 300-400 mots par minute, selon la difficulté du texte et le niveau de compréhension de chacun.

Le processus de lecture est complexe et suppose un grand niveau de coordination. Jess Morgan/Unsplash, CC BY

Les promoteurs de la lecture rapide, qui promettent à tort des vitesses de lecture plus élevées, vous apprennent à parcourir un texte en diagonale. La compréhension diminue dans une mesure inversement proportionnelle au gain de vitesse.

Il est important de noter que la vitesse de lecture maximale ne s’acquiert qu’au bout de plusieurs années de pratique, car elle exige que les systèmes cérébraux chargés de la vision, de l’attention, de la reconnaissance des mots, du traitement du langage et des mouvements oculaires fonctionnent de manière parfaitement coordonnée. Tout ce qui entrave cette coordination réduit donc la compréhension.

Les conséquences de la lecture sur écran

Quelles sont donc les conséquences probables de la lecture numérique ?

Avec certains appareils, comme les liseuses électroniques, il n’y a guère de raisons de penser que la lecture numérique diffère de la lecture sur papier, car ces deux formats favorisent les processus mentaux nécessaires à une lecture efficace.

Les dispositifs les plus discutables sont ceux qui introduisent des distractions (comme les sites d’actualités parsemés de publicités) ou qui présentent une mise en page peu optimale, comme un texte justifié au centre avec des espaces importants ou inégaux entre les mots. Ce dernier cas est rarement le fait des textes sur papier.

Bien que les conséquences de ces deux facteurs aient été peu étudiées, nos connaissances sur la cognition humaine sont désormais suffisantes pour formuler des prévisions éclairées.

Par exemple, des images et des sons sans rapport avec un texte, comme les publicités intempestives, peuvent capter l’attention. Si la plupart des adultes ont développé un niveau de contrôle exécutif suffisant pour ignorer de telles distractions, ce n’est pas le cas des jeunes enfants.

Les conséquences pour un enfant qui a du mal à saisir le sens d’un texte sont évidentes. Sa compréhension s’en trouvera affectée dans la mesure où il devra fournir un effort supplémentaire pour faire fi des distractions, ou s’il ne dispose pas encore de la coordination mentale nécessaire pour se rendre compte que la lecture du texte a été interrompue.

Des études fondées sur l’oculométrie montrent également que de nombreux environnements numériques, tels que les pages web, peuvent inciter à adopter des stratégies de lecture spécifiques, comme la lecture rapide, pour saisir l’essentiel ou la recherche d’informations.

La lecture sur smartphones est source de distraction. Ra Dragon/Unsplash, CC BY

Même si de telles stratégies peuvent s’avérer adaptées dans certains contextes, elles nuisent à la compréhension globale. Cette situation devrait être particulièrement préoccupante pour les enfants, car il faut des années de pratique pour coordonner les processus mentaux qui permettent d’atteindre un niveau de lecture équivalent à celui des adultes.

Ces préoccupations ont récemment fait l’objet d’une attention accrue, car le début de la pandémie de Covid-19 a entraîné un passage à l’enseignement en ligne et une augmentation sensible de la lecture numérique. Bien que ces changements aient été motivés par des impératifs pratiques, leurs conséquences à long terme restent incertaines.

Jusqu’à présent, les recherches sur l’oculométrie ont été menées sur des écrans d’ordinateur. De nouvelles technologies font leur apparition, qui nous permettront de comparer directement les mouvements oculaires et la compréhension entre les appareils numériques et le papier. Cela devrait nous aider à mieux cerner les avantages et les inconvénients des appareils numériques.

Étant donné que la capacité de lecture est un indicateur prédictif du niveau d’éducation, du statut socioéconomique et du bien-être d’une personne, on ne saurait trop insister sur l’importance d’évaluer les conséquences à long terme de la lecture numérique.

The Conversation

Erik D Reichle a reçu des financements de l'US National Institute of Health, l'US Institute of Education Sciences, le UK Economic and Social Research Council, et l'Australian Research Council.

Lili Yu ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

PDF

08.06.2026 à 17:21

Pourquoi les IA génératives hallucinent-elles ?

Rossana De Angelis, Maîtresse de conférences en sciences du langage, Université Paris-Est Créteil Val de Marne (UPEC)

Peut-être l’avez-vous remarqué en utilisant Claude ou ChatGPT, mais savez-vous pourquoi les IA génératives produisent des « hallucinations » ?
Texte intégral (2411 mots)
ChatGPT, comme les autres IA génératives de texte, invente une partie de ses réponses. Bertelli/Pexels, CC BY

Vous en avez peut-être déjà fait l’expérience : les intelligences artificielles, ou IA, génératives de texte inventent régulièrement des éléments de réponses, d’autant plus difficiles à détecter qu’ils s’intègrent à un ensemble qui paraît cohérent et se mêlent à des faits avérés. C’est en se penchant sur la manière dont ces IA recherchent des informations, sur leur façon d’analyser les textes « crawlés », ou scannés, que l’on peut comprendre pourquoi elles se trompent aussi régulièrement.


Cela fait déjà plus de trois ans que nous pouvons utiliser des intelligences artificielles (IA) génératives de textes et d’images. ChatGPT a été lancé en novembre 2022 dans une version gratuite, ouvrant la porte à un accès massif aux IA génératives, mais il n’avait pas encore accès au Web comme source d’informations. C’est à partir de janvier 2023 qu’il est devenu possible de poser toutes sortes de questions, soumettre des « prompts » ou « invites », car désormais, une large part de ce qui se trouve sur le Net peut être exploré par la machine.

Et c’est à partir de cette « présomption d’omniscience », autrement dit la capacité que nous attribuons à la machine de connaître toute chose, que nous avons commencé à faire l’expérience des « hallucinations » de l’IA : terme dérivant du latin hallucinatio, signifiant « méprise », construit à partir du verbe hallucinari qui veut dire « se tromper », « divaguer », mais aussi « tromper l’interlocuteur ».

J’ai été moi-même confrontée aux hallucinations de ChatGPT quand, à l’occasion de la préparation d’une conférence scientifique, j’ai demandé sur l’interface d’interaction : « Qui suis-je ? », pour tester les limites de l’interaction humain-machine dans le cadre d’un dialogue. Cette simple question a généré une expérience linguistique qui m’a permis de mieux comprendre comment naissent certaines hallucinations.

Cette expérience, qui a donné lieu à un article scientifique, me permet d’ébaucher de premières réponses aux questions : quand et pourquoi les IA génératives rédactionnelles se trompent-elles ?

Ce qui n’existe pas sur le Net n’existe pas pour l’IA générative

La présomption d’omniscience tombe si nous prenons en compte les critères qui permettent à une information d’être traitée par la machine. Premièrement, ces informations doivent être enregistrées sous forme de données numériques. Deuxièmement, elles doivent être disponibles à tout moment, car les machines fonctionnent seulement lorsqu’elles sont connectées aux serveurs qui assurent l’accès aux données porteuses d’informations. Troisièmement, ces informations doivent êtes repérables dans la masse considérable d’informations disponibles.

Les deux premières raisons permettent d’expliquer certains types d’hallucinations, car ce qui n’existe pas sur le Net n’existe pas pour les machines. Lorsque j’ai demandé à une IA générative rédactionnelle de répondre à la question : « Qui est ma grand-mère », en sachant que la grand-mère en question n’a pas de compte Instagram ni de blog ou de page institutionnelle, elle me répond : « Je ne peux pas savoir qui est ta grand-mère sans informations de ta part. Si tu me donnes son nom, le contexte, ou ce que tu veux savoir à son sujet, je pourrai t’aider au mieux. » J’ai alors donné « un nom », une étiquette valable pour que l’information soit repérée, ce qui a poussé la machine à proposer des descriptions incorrectes pour ne pas rester sans réponse.

La question du référencement

La troisième raison permet d’expliquer d’autres types d’hallucinations, car ce qui existe sur le Net mais n’est pas visible par les machines ne peut pas être immédiatement repéré par les IA génératives. Cette dimension est propre à l’écriture numérique : elle est liée au référencement des documents numériques à travers des étiquettes (les « tags ») qui indiquent ce qu’ils contiennent et ce à quoi ils renvoient, car les documents sont liés entre eux en formant un réseau de documents (le « Web »), les uns plus ou moins visibles par rapport aux autres. Il y a deux niveaux de référencement : le premier consistant à placer des mots clés et des liens utiles à la mise en avant des textes, et le deuxième consistant à acheter du trafic et des liens pour augmenter la visibilité des textes sur le Web.

Lorsque j’ai demandé à ChatGPT de me dire « Qui est Rossana De Angelis ? », la machine m’a proposé par erreur une définition de moi en tant qu’artiste, en raison de la présence sur le Net d’une artiste dont l’identité correspond partiellement à mon nom, avant de m’identifier comme chercheuse. Ceci s’explique par le fait que les documents dont se compose un site de vente d’objets d’art, où se trouvait la description de l’artiste en question, sont mieux référencés (et donc plus « visibles ») que les documents d’un site institutionnel, en raison de leurs enjeux commerciaux.

Les algorithmes qui dirigent les machines vers les données suivent les directions les plus visibles : les documents les mieux référencés, les mieux étiquetés sortent du lot en premier. Et si les documents les mieux référencés sont ceux qui ont une valeur commerciale, il en découle que les données les plus visibles sont celles liées à des enjeux commerciaux. Et cela, indépendamment de la qualité et de la véracité des contenus.

Les LLM, un fonctionnement complexe

Les trois critères de présence, de disponibilité et de visibilité n’expliquent pas toutes les hallucinations possibles, loin de là. La plus grande difficulté consiste à saisir la complexité propre au fonctionnement des IA génératives de textes et d’images qui utilisent des grands modèles de langage (LLM) pour traiter et générer du contenu.


À lire aussi : Comment fonctionne ChatGPT ? Décrypter son nom pour comprendre les modèles de langage


Par exemple, pour la reconnaissance des images, les premiers traitements capturent des aspects fondamentaux, tels que les contrastes, les bords, les lignes, leurs orientations, etc. Les traitements qui suivent combinent ces données avec d’autres données concernant, par exemple, les textures ou les matières. Enfin, à partir de cet ensemble, les traitements ultérieurs permettent de construire des représentations numériques d’images, comme des objets ou des visages, en enregistrant en tant que « valeurs » les différences et les similarités entre les données. Le traitement des données fonctionne ainsi par couches superposées (deep learning) : plus cette superposition est profonde, plus la capacité d’analyse augmente.

Les IA organisent leurs données dans un « espace vectoriel » : un ensemble d’objets qui occupent chacun un lieu précis. Prenons le jeu de ficelles : c’est comme multiplier à souhait le nombre de fils, leur longueur, leur épaisseur sans changer les règles du jeu, et ensuite pouvoir identifier un nœud. Dans cet espace, la position de chaque objet est déterminée par les relations qu’il entretient avec les autres. L’ensemble de ces relations détermine ce qu’on appelle leur « valeur vectorielle » : une combinaison de nombres qui définit un lieu dans un espace. Ces valeurs permettent d’identifier les données en tant que positions tout comme les nœuds d’un jeu de ficelles.


À lire aussi : De Cambridge Analytica à ChatGPT, comprendre comment l’IA donne un sens aux mots


Les valeurs vectorielles permettent d’identifier des régularités : les données proches (par exemple, les noms de fruits : fraises, cerises, abricots, etc.) portent des informations similaires (par exemple, ils peuvent être cueillis, coupés, cuisinés, mangés, etc.) Elles peuvent donc être repérées par leur proximité (par exemple, fruits similaires, actions similaires).

Pour repérer des données, et donc pour demander des informations, nous devons soumettre une demande (un « prompt » ou « invite ») à la machine qui va chercher ces régularités dans ces espaces vectoriels à l’aide de mots (par exemple, « recette du clafoutis aux cerises »). C’est la raison pour laquelle une IA générative rédactionnelle peut nous donner la bonne recette du « clafoutis aux cerises » d’abord en identifiant, puis en reproduisant la régularité des données à l’aide des mots « clafoutis, cerises, recette » (mots similaires, contextes similaires, actions similaires). La relation que les données entretiennent dans ces espaces dirige la reproduction plus ou moins correcte des informations, en complétant automatiquement des séquences de mots dans l’espace d’interaction.


À lire aussi : Les « world models », lorsque l’intelligence artificielle apprend à comprendre le monde


De l’importance du contexte

Ce qui permet l’usage des mots réside dans leur valeur. C’est un principe qui se trouve à la base de la linguistique générale. Plus précisément, la valeur d’un mot est une valeur différentielle : au sein d’une langue, le mot « chien » se différencie du mot « chat », comme le mot « bleu » du mot « vert », et ils veulent dire ce qu’ils veulent dire justement en raison de cette différence. Or, cette valeur se définit par rapport aux autres mots présents dans le texte (contexte sémantique : ce qu’on dit avec les mots) et par rapport au contexte dans lequel le texte est intégré (contexte pragmatique : ce qu’on fait avec les mots).

Prenons un exemple. Tout mot écrit sur un panneau routier fonctionne seulement dans un contexte précis (une route) et dans une pratique précise (conduire). La plupart des textes que nous produisons ou interprétons au quotidien fonctionnent de cette manière.

Comment une machine peut-elle extraire le contexte d’un texte ? Elle le fait justement à travers le processus évoqué plus haut : en définissant la valeur des mots en fonction de leurs positions vectorielles. De cette manière, la machine reproduit la valeur sémantique des mots. Mais, n’ayant pas toujours accès au contexte, la valeur pragmatique n’est pas toujours définissable. En reprenant l’exemple du panneau routier, « tourner à droite » ou « tourner à gauche » ne veut rien dire sans contexte. Dans ces conditions, si on demande à une IA générative s’il faut « tourner à droite ou à gauche », elle sera incapable de répondre correctement.

Autrement dit, quand la valeur pragmatique ne peut pas être définie, la machine peut se tromper. Il se produit alors ce qu’on peut appeler une « rupture pragmatique » : les contextes et les pratiques d’usages des mots étant inaccessibles, leur valeur pragmatique devient insaisissable.

Pourquoi est-il difficile de comprendre le fonctionnement des IA génératives ?

Ce qui empêche de comprendre le fonctionnement de l’IA générative est sa complexité. Par exemple, une difficulté consiste à imaginer que les données occupent des lieux dans des espaces qui ne sont pas bidimensionnels, mais vectoriels à n dimensions, car nous ne savons pas envisager et imaginer des espaces de plus de quatre dimensions (largeur, hauteur, profondeur, temps). Comme si on devait augmenter de n fois le nombre de fils du jeu de ficelles.

C’est un changement d’échelle démesuré dont la complexité nous dépasse, ce qui nous oblige soit à réduire la complexité du phénomène, soit à nous rendre à son incompréhensibilité. Ceci explique l’attitude de divinisation ou diabolisation que nous adoptons souvent face aux IA génératives.

Je me suis demandé plusieurs fois si, oui ou non, les IA génératives rédactionnelles pourront un jour remplacer l’humain dans les pratiques d’écriture. Ma position reste la même : non, l’IA ne va pas faire disparaître toutes nos pratiques d’écriture, car de manière évidente tout un ensemble d’écrits fortement situés, c’est-à-dire liés à un contexte, comme les échanges impromptus, les écritures sauvages ou les pancartes improvisées, ne peuvent pas être (re)produites dans un environnement numérique. Il y a donc des pans entiers d’expression écrite auxquelles les IA génératives rédactionnelles n’ont pas (encore) accès.

The Conversation

Rossana De Angelis ne travaille pas, ne conseille pas, ne possède pas de parts, ne reçoit pas de fonds d'une organisation qui pourrait tirer profit de cet article, et n'a déclaré aucune autre affiliation que son organisme de recherche.

PDF
21 / 50
  GÉNÉRALISTES
Ballast
Fakir
Interstices
Issues
Korii
Lava
La revue des médias
Time France
Mouais
Multitudes
Positivr
Regards
Slate
Smolny
Socialter
UPMagazine
Le Zéphyr
 
  Idées ‧ Politique ‧ A à F
Accattone
À Contretemps
Alter-éditions
Contre-Attaque
Contretemps
CQFD
Comptoir (Le)
Déferlante (La)
Esprit
Frustration
 
  Idées ‧ Politique ‧ i à z
L'Intimiste
Jef Klak
Lignes de Crêtes
NonFiction
Nouveaux Cahiers du Socialisme
Période
 
  ARTS
L'Autre Quotidien
Villa Albertine
 
  THINK-TANKS
Fondation Copernic
Institut La Boétie
Institut Rousseau
 
  TECH
April - Libre à lire
Dans les algorithmes
Framablog
Goodtech.info
Quadrature du Net
Revue Eur. Médias et Numérique
 
  INTERNATIONAL
Alencontre
Alterinfos
Gauche.Media
CETRI
ESSF
Inprecor
Guitinews
 
  MULTILINGUES
Kedistan
Quatrième Internationale
Viewpoint Magazine
+972 mag
 
  PODCASTS
Arrêt sur Images
Le Diplo
LSD
Thinkerview
🌓