Google va utiliser l'IA pour répondre à vos questions. Quelles conséquences pour la presse ?

Il y a une douzaine d'années, le PDG de Google Eric Schmidt anticipait le pivot de l'intelligence artificielle qui se joue cette semaine. Et les questions qu'il soulève - autour de l'économie des liens, de l'utilisation équitable et de l'agrégation - sont plus pressantes que jamais.

Joshua Benton
Joshua Benton

Arti­cle traduit par Marine Slav­itch — Ver­sion orig­i­nale pub­liée sur le site du Nie­man Lab le 7 février 2023.

Un futur qui semble a priori baroque et invraisemblable peut devenir réalité plus rapidement que ce que l’on imagine.

C'est du moins ce que je me suis dit lorsque je me suis souvenu d'un vieil article publié sur le site du Nieman Lab, en 2011 - un article qui me semble à nouveau pertinent aujourd'hui. Il s'agissait d'une conférence de presse qu'Eric Schmidt, alors président exécutif de Google, avait accordée aux journalistes Walt Mossberg et Kara Swisher lors de ce qui était alors la conférence annuelle All Things Digital. Dans cet entretien, tous trois abordent de nombreux sujets d’actualité, de la défaite de Google face à Facebook sur la question des « amis » jusqu’au rachat éventuel de Twitter. Une partie, qui concerne tout particulièrement les entreprises de presse avait déjà suscité de nombreuses réactions en 2011.

À l’époque, un des journalistes avait commencé par critiquer la baisse de qualité des résultats de recherche sur Google :

« En tant que consommateur, je trouve que les résultats de recherche de Google sont de plus en plus pollués par des liens que je ne veux pas voir ou qui ne semblent pas pertinents. Votre approche algorithmique de base - qui a connu un grand succès et qui était si différente de celle de tous les autres est-elle toujours la bonne ? Y a-t-il une possibilité pour quelqu'un d'arriver et de vous faire ce que vous avez fait à Altavista ? »

Altavista était le premier moteur de recherche du Web vers 1998, avant que Google ne lui chipe sa place.

Eric Schmidt a commencé par défendre la qualité des résultats de recherche sur Google, avant d’admettre :

« Nous essayons de passer de résultats basés sur des liens à des résultats basés sur des algorithmes, grâce auxquels nous pouvons réellement calculer la meilleure réponse qui peut être donnée à un utilisateur précis. Nous disposons désormais d'une technologie d'intelligence artificielle suffisamment développée pour vous donner la bonne réponse en la calculant littéralement. »

Quelque chose vous semble familier ? Google a bâti un empire en « polluant » les résultats de son moteur de recherche avec des publicités. Son angle mort ? Un concurrent qui serait capable de donner aux utilisateurs des réponses directes plutôt que des liens vers des sites Web susceptibles d'avoir des réponses.

Microsoft vient de dévoiler une nouvelle version de son moteur de recherche, Bing, qui intègre ChatGPT, l'IA conversationnelle et générative dévoilée à la fin de l'année dernière. Si l'on en croit une version qui a fait l'objet d'une fuite, le nouveau Bing serait construit autour de cette promesse : « Posez de vraies questions. Obtenez des réponses complètes. » En plus des résultats traditionnels du moteur de recherche, les utilisateurs seront également en mesure de chatter avec « un moteur de recherche alimenté par l'IA ». Ce nouveau Bing fait partie de l'investissement massif de 10 milliards de dollars de Microsoft dans OpenAI, le fabricant de ChatGPT.

Google l'a bien sûr vu venir, et a donc essayé de devancer l'actualité hier en annonçant le lancement de son propre chatbot à base d'IA, Bard. Celui-ci est d’ores et déjà disponible pour une poignée de « testeurs de confiance » et sera « plus largement disponible pour le public dans les semaines à venir ».

Même dans la conférence de presse de 2011, c'est Bing qui, selon les journalistes, était déjà en avance sur Google dans sa capacité à donner des réponses directes aux requêtes de recherche. Eric Schmidt l’a même reconnu, « pour certains cas limités ».

Tout cela est extraordinairement excitant et forme peut-être la révolution la plus importante de la technologie de consommation depuis l'iPhone. Je n'ai jamais été aussi peu confiant pour prédire à quoi tout ressemblera l’Internet dans un an ou deux. Ces nouvelles interfaces ne représenteront-elles qu'une modeste amélioration pour 5 ou 10 % de nos requêtes sur un moteur de recherche ? Ou l’intelligence artificielle deviendra-t-elle la technologie dominante pour diriger les utilisateurs vers des sites d'information en ligne ? Au rythme des progrès que nous observons, il est périlleux de fixer un plafond aux possibilités.

Mais il existe une autre question, qui concerne directement le secteur de l'information et à laquelle nous ne pouvons encore répondre. À l'heure actuelle, plutôt que des réponses directes, Google renvoie un fort trafic vers les sites d'information - plus que toute autre source externe, et de loin. Les médias consacrent du temps et de l'argent à travailler leur référencement, et la récompense qu’ils en tirent se transforme en trafic sur leurs sites, monétisé par de la publicité.

Mais plus Google répondra à des questions sans qu'il faille cliquer sur des liens, moins les sites d'information qui y répondent de manière directe recevront du trafic. Moins de trafic égal moins d'impressions publicitaires, donc moins de revenus.

Nous soulignions déjà ce problème dans notre article de 2011 :

« Le changement évoqué par Eric Schmidt, qui consiste à passer d'une approche « basée sur les liens » à une approche « basée sur les algorithmes », pourrait avoir un impact considérable sur les médias dont l'activité consiste à fournir des réponses aux questions des utilisateurs des moteurs de recherche. [...] »

En 2011, les questions auxquelles Google acceptait de répondre sans rediriger vers des liens étaient assez limitées. Elles se fondaient toutes sur des données structurées, principalement des chiffres précis.

Mais même à ce moment-là, il était clair que leur gamme allait s'élargir :

« Pour l'instant, la capacité de Google à répondre directement aux questions est limitée par ce que ses algorithmes peuvent savoir. Mais ils deviendront plus intelligents, et les commentaires d’Eric Schmidt montrent clairement que l'un des objectifs stratégiques de la firme est de faire en sorte qu'ils le deviennent. Imaginez donc que, dans un avenir proche, Google puisse donner des réponses directes à des questions telles que :

  • À quelle heure passe Modern Family ?
  • Qui sont les Républicains qui se présentent à l’élection présidentielle ?
  • Quels chemisiers rouges sont en vente chez Macy's ?
  • Qui joue arrière gauche dans l’équipe des Saints de Nouvelle-Orléans ? »

Si Modern Family a disparu depuis longtemps, Google vous indique aujourd’hui sans problème à quelle heure passe Abbott Elementary. Et le moteur de recherche est heureux de laisser Macy's acheter de l'espace publicitaire pour parler de ses chemisiers rouges. Mais il s'appuie toujours sur des liens pour parler des candidats à l’élection présidentielle et de la ligne offensive des Saints.

Dans sa forme actuelle, ChatGPT n'est pas connecté à l'Internet ouvert et n'est formé qu'à des informations allant jusqu'en 2021, ce qui fait que le logiciel n'est pas très doué pour converser sur des événements actuels. Cependant, Google et Microsoft ont tous deux déclaré que leurs robots seront en mesure de puiser dans l'ensemble du web, en temps réel, et que leurs résultats seront probablement « excellents ».

Revenons un instant en 2011. Les programmes télévisés, les compositions d'équipes et la liste des candidats à la présidence sont encore des données structurées - le genre de choses qui ne semble pas trop hors de portée à l'époque. Mais qu'en est-il alors du niveau de difficulté suivant ?

« Imaginez que le système d’intelligence artificielle de Google s'améliore au point de pouvoir répondre à des questions comme celles-ci :

  • Le conseil municipal de Dallas a-t-il approuvé un changement de zonage hier soir ?
  • Le plan de relance était-il trop faible pour être efficace ?
  • Qu'est-ce qui va remplacer le programme de la navette spatiale ?
  • Quel est le meilleur film de Terrence Malick ?
  • Oussama ben Laden a-t-il vraiment utilisé sa femme comme bouclier humain ?
  • Le nouvel album de My Morning Jacket est-il bon ?

Certaines de ces questions sont suffisamment complexes pour que Google ne soit pas en mesure de donner une réponse unique et définitive, comme il peut le faire avec une base de données. Mais il n'est pas difficile d'imaginer qu'il pourrait fournir un regard de type Metacritic sur la synthèse des avis critiques concernant l'album de My Morning Jacket, ou un résumé des avis des clients sur les DVD de Terrence Malick sur Amazon. Il pourrait puiser dans les données publiques sur l'activité gouvernementale pour vous dire ce qui s'est passé au conseil municipal (et peut-être déterminer quelles parties de l'ordre du jour étaient importantes, en fonction des articles de presse, des blogueurs communautaires et du trafic sur les médias sociaux). Il pourrait rassembler des articles provenant de sources d'information et de sources gouvernementales dignes de confiance sur la NASA et les combiner de manière algorithmique en autant d'informations que le chercheur le souhaite. Il s'agit d'un changement d'orientation dans le jugement de Google ; les sites Web à l’origine concurrents pourraient se retrouver sur la même ligne les uns par rapport aux autres à découper et à analyser leurs données pour trouver une réponse. »

J'ai posé chacune de ces questions à ChatGPT et le logiciel s'est plutôt bien débrouillé. Il a réussi à fournir des réponses correctes à ces deux questions :

« Qu'est-ce qui va remplacer le programme de la navette spatiale ?

  • Le programme de la navette spatiale a été officiellement mis à la retraite en 2011 et a été remplacé par le programme Commercial Crew. Le Commercial Crew Program est une initiative de la NASA visant à externaliser la conception, le développement et l'exploitation de vaisseaux spatiaux pour le transport spatial humain vers l'orbite terrestre basse. Le programme a été créé pour fournir un accès fiable et sûr à la Station spatiale internationale (ISS) aux astronautes de la NASA et aux partenaires internationaux. Les deux entreprises qui ont été sélectionnées pour participer au programme sont Space et Boeing. Le vaisseau spatial de SpaceX, le Crew Dragon, a déjà effectué avec succès plusieurs missions vers l'ISS, et le vaisseau spatial de Boeing, le CST-100 Starliner, est actuellement en phase de test et de certification. Ces nouveaux engins spatiaux sont conçus pour être plus rentables et plus efficaces que la navette spatiale, et ils devraient assurer le transport fiable et sûr des astronautes vers l'ISS pendant de nombreuses années. »

« Oussama ben Laden a-t-il vraiment utilisé sa femme comme bouclier humain ?

  • Oui, des rapports indiquent qu'Oussama ben Laden a utilisé sa femme comme bouclier humain lors du raid sur son complexe à Abbottabad, au Pakistan, le 2 mai 2011. Selon le récit officiel du raid, la femme de ben Laden, Amal al-Sadah, a reçu une balle dans la jambe alors qu'elle était utilisée comme bouclier par ben Laden pour tenter de se protéger. L'incident a été rapporté par diverses sources d'information, y compris des responsables du gouvernement américain, et a été confirmé ultérieurement dans l'enquête sur le raid. »

Il a été utile, bien qu'équivoque, sur ces points :

« Quel est le meilleur film de Terrence Malick ?

  • Terrence Malick est un cinéaste très estimé, et ses œuvres sont souvent considérées comme faisant partie des meilleures de l'industrie. Il est subjectif de désigner un film spécifique comme étant son « meilleur », car cela dépend des goûts et de l'interprétation de chacun. Cependant, certaines de ses œuvres les plus acclamées incluent The Tree of Life (2011), Badlands (1973) et Les Moissons du ciel (1978). Ces films sont souvent cités comme faisant partie des meilleurs de sa filmographie, et mettent en valeur son style unique, la beauté de la photographie et les thèmes de la nature et de la spiritualité. »

« Le plan de relance était-il trop faible pour être efficace?

  • L'efficacité du plan de relance fait l'objet de débats et dépend de divers facteurs économiques, politiques et sociaux. Certains économistes affirment que le plan de relance était trop modeste pour avoir un impact significatif sur l'économie, car il n'a pas apporté un soutien suffisant aux personnes les plus touchées par le ralentissement économique. D'autres affirment que l'ampleur du plan de relance était appropriée compte tenu des contraintes politiques et économiques de l'époque. Selon eux, le plan a apporté un soutien suffisant pour stabiliser l'économie et l'empêcher de s'effondrer davantage, tout en finançant d'importants projets d'infrastructure et programmes qui ont contribué à créer des emplois et à stimuler la croissance. En fin de compte, l'efficacité du plan de relance est difficile à quantifier et à mesurer, et elle dépend d'une variété de facteurs et de perspectives. »

ChatGPT ne savait pas quel était le dernier album de My Morning Jacket. J'ai donc posé une question spécifique à leur album de 2011 :

«  L'album Circuital de My Morning Jacket est-il bon ?

  • Circuital est le sixième album studio de My Morning Jacket, sorti en 2011. L'album a reçu des critiques généralement positives de la part des critiques musicaux, qui ont loué son mélange de styles musicaux éclectiques et la capacité du groupe à élaborer des chansons convaincantes et atmosphériques. De nombreux fans du groupe considèrent Circuital comme l'un des albums les plus forts de leur discographie, et il est souvent loué pour son son cohérent et ses chansons mémorables. L'album a également été bien accueilli commercialement, atteignant le top 30 du Billboard 200 et recevant des critiques positives de nombreuses publications musicales connues.

En fin de compte, le fait que Circuital soit ou non un bon album est subjectif et dépend des goûts personnels de chacun. Si vous êtes un fan de la musique de My Morning Jacket ou si vous appréciez un mélange de rock, d'alternatif et d'influences psychédéliques, il vaut la peine d’être écouté. »

« Un son cohérent et des chansons mémorables » sont des éloges assez peu spécifiques, il faut le noter, et l'album a effectivement atteint la cinquième place du Billboard 200, pas « seulement » le top 30).

La dernière question - « Le conseil municipal de Dallas a-t-il approuvé un changement de zonage hier soir ? » - est une question à laquelle ChatGPT ne peut pas répondre pour le moment, étant donné qu'elle reste bloquée sur le plan informationnel en 2021. Mais là encore, Google et Microsoft n'auront pas ce problème. Et pour les organismes de presse locaux, la capacité des entreprises technologiques à répondre correctement à ce type de questions sera essentielle. Les informations recueillies par des journalistes locaux peuvent ainsi être précieuses. Les moteurs de recherche seront-ils capables d'ingérer ces connaissances et de les transmettre aux utilisateurs sans même les rediriger vers le lien d’un média en ligne ?

Les débats (et les procès) autour de l'éthique des images générées par l’intelligence artificielle posent des questions similaires - bien que le fait d’utiliser une IA d'image pour reprendre le style d'un artiste reste différent du fait de reprendre des faits spécifiques d'une publication dans le cas d’une IA conversationnel. « Comment écrire un article sur le conseil municipal ? » ≠ « Qu'est-ce que le conseil municipal a fait hier soir ? ». Ce type d'amalgame diffère-t-il, sur le plan juridique ou éthique, de l'indexation du contenu que les moteurs de recherche ont toujours effectuée ? Alors que les éditeurs du monde entier ont demandé à Google de les dédommager, la réponse de la société a été simple : Mais nous vous envoyons tout ce trafic ! Le débat change-t-il lorsque cela devient de moins en moins vrai ? Ou bien Google, voyant ce risque, décidera-t-il de se concentrer sur l'univers plus stratégique de l'information non locale, considérant que les risques juridiques et de relations publiques sont moindres lorsqu'on résume Wikipédia plutôt que The Hometown Gazette ?

Qui peut le savoir ? Pas moi. Le moi de 2011 ne le savait pas non plus :

« Ces questions ne sont pas à portée de main - elles deviennent rapidement des problèmes d’intelligence artificielle très compliqués. Mais elles montrent toutes que Google travaille dur pour réduire le nombre de fois où les internautes doivent quitter google.com pour obtenir des réponses à leurs questions. Malgré toutes les fois où Google a déclaré qu'il n'était pas actif dans le domaine du contenu, il n'est pas difficile d'imaginer un avenir où sa mission d' « organiser les informations du monde » va bien au-delà de la recherche et de la création de liens et se traduit par un traitement algorithmique des réponses au lieu du PageRank.

Cette évolution - bien plus que les précédentes plaintes des organismes de presse à l'égard de Google - pourrait exercer une réelle pression sur les modèles économiques des sites d'information. Cela remet en question la façon de naviguer dans l'économie des liens et sur la signification de concepts tels que l'optimisation des moteurs de recherche, l'utilisation équitable et l'agrégation. Et il semble bien qu’Eric Schmidt ait montré la voie hier soir. »

Une douzaine d'années plus tard, toutes ces questions sont en train de devenir plus que rhétoriques.


Note de la rédaction

Ce texte ne con­stitue pas une tra­duc­tion mot à mot de l’article orig­i­nal pub­lié sur le site du Nie­man Lab. Nous avons ajouté des élé­ments de con­tex­tu­al­i­sa­tion, adap­té cer­taines expres­sions et sup­primé cer­tains pas­sages con­tenant des références pointues adressées à des lecteurs·ices anglo­phones ou Américain·es. Nous avons égale­ment fait le choix d’appliquer à cette tra­duc­tion les règles de l’écriture inclu­sive, con­for­mé­ment à la charte édi­to­ri­ale en vigueur sur l’ensemble des con­tenus Médianes.


intelligence artificielleGAFAMpresse en ligneStratégie

Joshua Benton

Joshua Benton est le fondateur du Nieman Lab.