Les moteurs de recherche alimentés par l'IA sont-ils sûrs ?

L'une des toutes premières utilisations de la technologie de l'IA que la plupart des gens ont adoptée concerne la recherche d'informations en ligne. De nombreux moteurs de recherche existants intègrent l'IA et tentent d'améliorer l'expérience des utilisateurs. Grâce à la capacité de l'IA à analyser et à comprendre les données à un niveau différent de celui des algorithmes de recherche, de nombreuses personnes utilisent déjà ces moteurs de recherche pour remplacer la recherche traditionnelle sur Google ou Bing.  

TÉLÉCHARGER UN ANTIVIRUS GRATUIT POUR TOUS LES APPAREILS

Que sont les moteurs de recherche alimentés par l'IA et comment fonctionnent-ils ?

Les moteurs de recherche ont parcouru un long chemin depuis qu'ils se contentent de faire correspondre des mots-clés à des pages web. Google dispose déjà d'un algorithme extrêmement puissant qui est constamment amélioré, mais la prochaine étape de la recherche pourrait bien avoir lieu. 

Les moteurs de recherche alimentés par l'IA vont plus loin, en utilisant des modèles d'apprentissage automatique avancés pour comprendre l'intention, analyser le contexte et générer des résultats plus précis. Contrairement aux moteurs de recherche traditionnels qui s'appuient sur des algorithmes de classement et sur les pages indexées des sites web, ces outils pilotés par l'IA traitent les requêtes plus comme le ferait un humain. Souvent, leurs réponses ne renvoient pas les internautes à un site web et sont plutôt conçues pour résumer l'information. 

Ces systèmes utilisent de grands modèles de langage pour passer au crible de vastes quantités de données, résumer le contenu et parfois même prédire les informations dont les utilisateurs ont besoin avant qu'ils ne les demandent. Certains moteurs de recherche IA intègrent également la navigation web en temps réel, ce qui leur permet d'obtenir des informations fraîches plutôt que de s'appuyer uniquement sur des résultats préindexés. Dans le monde en constante évolution de l'actualité et de la technologie, cela peut s'avérer crucial. 

Qu'est-ce que l'IA Perplexité ?

Perplexity est un moteur de recherche conversationnel conçu pour fournir des réponses naturelles aux questions posées par les internautes. Les gens l'ont décrit comme un croisement entre ChatGPT et Google dans la manière dont il fournit des résultats. Il s'agit d'une sorte d'assistant numérique qui passe au crible un grand nombre d'informations relatives à la requête et fournit une réponse simple en utilisant le langage naturel. 

Il est basé sur la technologie LLM de certains des géants de cette industrie, notamment GPT-4, Claude 3.5, Grok-2, Llama 3 et les LLM Perplexity qui ont été développés au sein de l'entreprise. 

Qu'est-ce que Google SGE (Search Generative Experience) ?

Vous avez peut-être déjà expérimenté le SGE de Google sans le savoir. Il a commencé à être déployé en mai 2024 et est aujourd'hui utilisé pour de nombreuses recherches sur la plateforme de Google. Il s'agit d'une version améliorée par l'IA de son moteur de recherche standard. 

Au lieu de renvoyer simplement des liens, SGE utilise l'apprentissage automatique pour générer des résumés, fournissant aux utilisateurs des informations instantanées sans qu'ils aient besoin de cliquer sur de multiples résultats et de lire des sites web pour trouver ces informations. 

Ce système intègre des réponses générées par l'IA en haut des résultats de recherche, offrant un aperçu des informations pertinentes tout en permettant aux utilisateurs d'explorer les liens traditionnels s'ils le souhaitent. L'information peut également être citée avec la source originale pour que les gens puissent la vérifier ou la lire plus en détail. 

Comment fonctionne la recherche Microsoft Copilot ?

Le concept de Microsoft Copilot est similaire à celui du SGE de Google. La recherche s'effectue au sein de Bing et améliore la recherche traditionnelle grâce à une synthèse alimentée par l'IA et à la récupération de données en temps réel. En intégrant la technologie d'OpenAI (la société qui produit ChatGPT), Copilot fournit des réponses détaillées tout en maintenant l'accès aux liens web conventionnels pour ceux qui le souhaitent. Microsoft affirme également que le logiciel comprend le contexte, ce qui peut grandement aider les utilisateurs à obtenir les bons résultats. 

Qu'est-ce que la recherche ChatGPT et comment fonctionne-t-elle ?

La fonction de recherche de ChatGPTcombine des réponses génératives alimentées par l'IA avec une navigation en temps réel sur le web. Elle peut extraire des citations et des informations directement de sites en ligne, mais s'appuie également sur l'immense connaissance du LLM lui-même. 

Contrairement aux moteurs de recherche traditionnels qui privilégient le classement et l'autorité des pages, ChatGPT offre une expérience plus interactive en permettant aux utilisateurs de modifier leurs requêtes dans le cadre d'une approche conversationnelle.

Que sont les hallucinations liées à l'IA et comment se produisent-elles ?

Lorsqu'un système d'IA génère des informations inexactes, trompeuses ou susceptibles d'être qualifiées de "fake news", on parle généralement d'hallucination de l'IA. Plusieurs raisons peuvent expliquer ce phénomène. Pour simplifier, cela provient de la manière dont les modèles d'IA traitent et prédisent les textes. 

Les moteurs de recherche intelligents ne pensent pas comme les humains : ils prédisent les réponses en se basant sur les schémas des données sur lesquelles ils ont été formés. Parfois, ce processus ne fonctionne pas correctement, en particulier dans les domaines où les opinions divergent fortement. Certaines études ont même suggéré que les modèles d'IA pourraient avoir été formés en utilisant des biais humains, ce qui peut provoquer des hallucinations. 

Des hallucinations peuvent également se produire lorsqu'une IA tente de combler des lacunes dans ses connaissances en inventant des faits pour créer ce qui semble être une réponse complète et sûre. L'IA est conçue dans le but de répondre aux questions et le fera parfois avec des informations inexactes. Il est important de développer des défenses et des mécanismes de détection robustes pour atténuer les menaces potentielles.

Exemples d'hallucinations de l'IA dans les moteurs de recherche

Beaucoup d'entre nous l'ont déjà constaté de manière anecdotique s'ils utilisent l'IA. Il existe de nombreux exemples d'affirmations erronées fournies en toute confiance par des moteurs de recherche IA.  

Lors d'une démonstration en 2023, le chatbot Bard de Google a [incorrectement expliqué] (https://mashable.com/article/google-bard-james-webb-telescope-false-fact) que le télescope spatial James Webb avait capturé les premières images au monde d'une planète située en dehors de notre système solaire. Il s'agissait d'une invention de l'IA, qui a même fait perdre des milliards à la valeur des actions de la société holding de Google. 

Certaines réponses ont été humoristiques. Un internaute a partagé une capture d'écran d'un aperçu de l'IA pour la requête "fruits se terminant par um", affirmant que "applum, banana, strawberrum, tomatum et coconut" étaient tous des exemples utilisés. 

Les moteurs de recherche IA peuvent-ils être manipulés ? 

Le potentiel de manipulation existe et a même été prouvé au cours des derniers mois. En plus de générer des réponses incorrectes, les moteurs de recherche IA peuvent également être influencés par les données sur lesquelles ils sont formés. 

L'IA s'appuie sur les données qu'on lui "donne" (proverbialement parlant) et a besoin de sources fiables en premier lieu. Cela signifie que la technologie est susceptible d'adopter des préjugés en fonction de ses sources. Par exemple, certaines enquêtes ont suggéré que les outils d'IA évaluent les photos de femmes de manière plus suggestive que les images d'hommes, peut-être parce que de nombreux créateurs de la technologie sont eux-mêmes des hommes, avec des points de vue subjectifs. 

Des études ont également montré que le texte que ChatGPT et d'autres moteurs d'IA similaires parcourent pourrait être manipulé, en utilisant un texte caché qui pourrait être renvoyé à l'utilisateur final. Il est également possible que divers sites web collaborent pour tenter de tromper ou de manipuler une IA : si un nombre suffisant de sources non fiables disent la même chose, un modèle d'IA pourrait l'accepter comme un fait et l'incorporer dans ses résultats. 

Les moteurs de recherche d'IA fournissent-ils des informations actualisées en temps réel ? 

Nous nous sommes tous habitués au fait que nous pouvons rechercher sur Google un article d'actualité ou un sujet à la mode et obtenir des résultats qui ont été publiés très récemment. L'IA ne fonctionne pas de la même manière. Dans quelle mesure les informations sont-elles à jour ? 

La recherche d'IA a-t-elle accès à des données en temps réel ? 

Les modèles d'IA sont généralement formés à partir d'un instantané de l'internet plutôt que d'actualiser continuellement leurs connaissances. Cela signifie qu'ils ne "voient" pas intrinsèquement les nouvelles pages web comme le fait un moteur de recherche traditionnel tel que Google. Toutefois, certains outils de recherche IA tentent de combler cette lacune en intégrant des recherches en temps réel sur le web. 

Copilot de Microsoft (anciennement Bing AI) et Search Generative Experience (SGE) de Google tentent d'intégrer des données actuelles en reliant les réponses de l'IA aux résultats de recherche en direct. Dans de nombreuses recherches d'IA, il peut y avoir un décalage entre le moment où de nouvelles informations sont publiées et le moment où les outils de recherche d'IA les reconnaissent. 

Quelle est la fraîcheur des données contenues dans les résultats de recherche de l'IA ? 

La fraîcheur des données dépend du modèle d'IA. Certains modèles d'IA ne connaissent que les données sur lesquelles ils ont été formés, ce qui signifie que leurs données peuvent être périmées de plusieurs mois, voire de plusieurs années. Par exemple, les données du modèle de pré-entraînement de ChatGPT ne vont que jusqu'en octobre 2023. Il s'agit là d'un inconvénient majeur pour les recherches portant sur des événements d'actualité ou de nouvelles découvertes scientifiques. Si vous demandez à certains moteurs de recherche IA quels sont les derniers lauréats d'un prix, par exemple, il se peut qu'ils ne connaissent pas les informations les plus récentes. 

L'IA classe-t-elle les informations de manière objective ? 

L'objectivité peut manquer à l'ère moderne de l'internet, et l'IA n'y remédie pas nécessairement. Au lieu de se contenter de classer les résultats existants, l'IA génère activement des réponses basées sur des modèles dans ses données d'apprentissage et ses algorithmes de recherche. Cela crée un risque de partialité. 

La manière dont l'IA sélectionne et résume les informations n'est pas toujours neutre. Si une IA a été entraînée sur des données qui penchent dans une certaine direction, ses résumés peuvent refléter ce parti pris, même si ce n'est pas intentionnel. 

Les développeurs y travaillent en permanence. Le nouveau modèle de ChatGPT annonce que le taux de biais et d'hallucinations a considérablement diminué, mais cette technologie n'en est qu'à ses débuts. 

Les moteurs de recherche alimentés par l'IA présentent-ils un risque pour la vie privée ? 

Les outils de recherche par IA traitent et génèrent activement des réponses basées sur les requêtes des utilisateurs. Cette couche supplémentaire de traitement soulève des questions sur la manière dont les données sont traitées et sauvegardées. 

Les moteurs de recherche IA tracent-ils vos données ? 

De nombreux moteurs de recherche d'IA collectent des données. L'ampleur de cette collecte varie en fonction de la plateforme. Certains stockent les requêtes pour améliorer leurs modèles d'IA, tandis que d'autres affirment éviter le suivi à long terme. Les outils alimentés par l'IA recueillent souvent des données pour affiner les réponses et personnaliser les résultats. Les gens se demandent si Copilot peut être utilisé en toute sécurité ou si SGE collecte des données. Il s'agit de sujets complexes.  

Selon Microsoft, "Copilot est construit sur Microsoft Azure OpenAI Service et fonctionne entièrement dans le nuage Azure. Azure OpenAI offre une disponibilité régionale et un filtrage responsable du contenu de l'IA". Copilot collecte des données, mais se targue de les sécuriser dans le nuage. 

Il est possible que les plateformes intègrent le comportement de recherche de l'IA aux profils d'utilisateurs existants. Cela signifie que l'activité de recherche pourrait être liée à d'autres habitudes en ligne, ce qui soulève des inquiétudes quant à la sécurité des données et à la publicité ciblée. 

Qu'advient-il de vos recherches sur les plateformes alimentées par l'IA ? 

Les données de recherche ne disparaissent pas automatiquement. Bien que les conditions d'utilisation puissent préciser que ces données ne sont pas partagées directement, elles peuvent être conservées pendant de longues périodes afin d'affiner les modèles d'apprentissage automatique. Certains moteurs de recherche IA utilisent même les requêtes antérieures pour façonner les réponses futures. 

Si un outil de recherche IA enregistre les données de l'utilisateur, ces données pourraient être analysées pour améliorer la précision ou former les futures versions du modèle. Bien que les entreprises affirment que les informations personnelles identifiables sont supprimées, les utilisateurs soucieux de leur vie privée peuvent encore se sentir mal à l'aise à l'idée que l'historique de leurs recherches soit enregistré. 

La plupart des entreprises sont motivées par le profit. Les moteurs de recherche et ceux qui leur fournissent des données (les éditeurs) peuvent utiliser des liens d'affiliation ou des annonces sous forme de contenu publicitaire. 

Le SGE de Google, par exemple, intègre déjà les résultats obtenus grâce à l'IA dans son écosystème publicitaire. Microsoft Copilot fait quelque chose de similaire en mélangeant les réponses de l'IA avec des liens promus. Le risque ici est que les résumés générés par l'IA poussent subtilement les utilisateurs vers des contenus payants sans que la distinction soit évidente. 

Ce qu'il ne faut jamais partager avec les moteurs de recherche IA

Comme pour toute publication en ligne, évitez de communiquer trop de données personnelles en ligne. La règle d'or est de ne pas partager vos informations personnelles identifiables. Comme l'écrit Amanda Caswell dans Tom's Guide, j'ai dit à ChatGPT quelque chose que je regrette encore - voici 7 choses que vous ne devriez jamais partager, vous ne devriez jamais partager les éléments suivants lorsque vous interagissez avec des outils de recherche d'IA (quel que soit l'outil !):

1 : Informations personnelles identifiables (PII ) - toutes ces informations sont interdites : votre vrai nom, votre date de naissance, votre numéro de sécurité sociale (SSN), votre adresse réelle, etc. Tout ce que vous ne voulez pas envoyer à une adresse e-mail inconnue, vous ne devriez pas l'utiliser pour converser avec ChatGPT. Vous voulez limiter cette exposition, alors utilisez un nom et une date de naissance "factices" si vous devez le faire. J'ai été Helly R. plus souvent que je ne voudrais l'admettre.

2 : Informations financières - numéros de cartes de crédit, comptes bancaires, informations fiscales.

3 : Mots de passe - bien qu'il puisse sembler une bonne idée de demander à ChatGPT de créer un mot de passe fort pour vous, ce n'est jamais le cas. Si vous devez utiliser un outil automatisé pour créer un mot de passe pour vous, assurez-vous au moins qu'il provient d'une source fiable - indice, utilisez plutôt notre générateur de mot de passe . Lisez aussi sur les passkeys et l'authentification multi-facteurs comme choix de connexion plus sûrs.

4 : Informations médicales - il peut être tentant de communiquer avec un assistant numérique utile au sujet de votre diagnostic. Nous avons écrit sur le fournisseur de chatbot d'IA qui expose 346 000 fichiers clients, y compris des documents d'identité, des CV et des dossiers médicaux. Si vous devez interagir avec ChatGPT au sujet de votre état de santé, veillez à ne pas mentionner qu'il s'agit de votre propre diagnostic. Prétendez mener une recherche plutôt que d'exposer vos données sensibles en ligne.

Les moteurs de recherche IA sont-ils sûrs pour les enfants ? 

Les jeunes sont de plus en plus nombreux à utiliser des outils d'IA pour faire leurs devoirs, naviguer et s'amuser, et les parents se posent une question importante : Les moteurs de recherche IA sont-ils sûrs pour les enfants ? Les moteurs de recherche traditionnels sont dotés de contrôles parentaux et de filtres qui permettent de bloquer les contenus explicites (ce qui ne veut pas dire qu'ils ont toujours été parfaits), mais les réponses générées par l'IA ajoutent une nouvelle couche de complexité. 

Perplexity AI est-il sans danger pour les enfants ? 

L'utilisation non supervisée est un sujet difficile et une décision que les parents doivent prendre eux-mêmes. Perplexité L'IA génère des réponses basées sur des modèles dans ses données d'apprentissage, elle peut parfois produire un contenu trompeur ou inapproprié. 

Bien que la plateforme prétende utiliser des techniques de filtrage, le texte généré par l'IA n'est pas toujours prévisible. Contrairement aux moteurs de recherche traditionnels qui bloquent simplement certaines pages, un outil d'IA pourrait toujours synthétiser un contenu inapproprié sur la base des requêtes de l'utilisateur. 

La recherche par IA filtre-t-elle les contenus inappropriés ? 

La plupart des moteurs de recherche dotés d'une intelligence artificielle tentent de filtrer les contenus explicites. Toutefois, aucun système n'est infaillible et des erreurs peuvent se produire. Le SGE de Google et le Copilot de Microsoft disposent d'outils de modération du contenu, mais l'IA peut parfois générer des réponses qui passent entre les mailles du filet. 

L'un des principaux problèmes réside dans le fait que l'IA ne "pense" pas comme les humains. Si elle est interrogée sur un sujet sensible, elle peut produire involontairement un contenu inapproprié pour les enfants, même si elle n'a pas été directement entraînée à le faire. C'est l'un des risques inhérents à son utilisation. 

Quel est le meilleur (et le plus sûr) moteur de recherche IA ? 

Les internautes doivent prendre une décision. À quel moteur de recherche IA font-ils confiance ? Certaines personnes sont très prudentes en ce qui concerne leurs données et la manière dont elles sont utilisées, et la vérification des conditions générales est essentielle dans ce cas. 

Quel moteur de recherche IA offre la meilleure protection de la vie privée ? 

Il y a des compromis, mais Perplexity AI permet une navigation anonyme et ne recueille que certaines données d'utilisation pour améliorer les résultats. Il s'agit sans doute de la meilleure option en matière de protection de la vie privée. 

Le SGE de Google et le Copilot de Microsoft, quant à eux, intègrent la recherche IA aux profils d'utilisateurs existants. Il est possible que les recherches soient liées à des données publicitaires ou à des comptes personnels. Le moteur de recherche Brave a été conçu pour tenter de renforcer la protection de la vie privée, car il génère les réponses dans votre navigateur plutôt que sur un serveur. 

La recherche en ligne de ChatGPT peut également enregistrer les interactions des utilisateurs disposant d'un compte gratuit. Les options d'IA les plus sûres sont celles qui ne nécessitent pas de connexion ou qui ne recueillent pas l'historique des recherches. 

Faut-il faire confiance aux moteurs de recherche IA plutôt qu'à Google ? 

Les moteurs de recherche IA sont sujets à des erreurs, présentant parfois des informations erronées ou des faits "hallucinés" comme étant la vérité. Ils sont également très récents et continuent d'évoluer, et l'avenir de la recherche pourrait être très différent au fur et à mesure de l'ajout de nouvelles fonctionnalités. 

Bien que les résultats de recherche de Google puissent également être biaisés (ou orientés par des publicités), les utilisateurs peuvent au moins recouper plusieurs sources avant de tirer des conclusions. Pour les sujets importants nécessitant des connaissances scientifiques ou médicales, l'utilisation de moteurs de recherche et le référencement de plusieurs sources sont sûrs.  

Pour ceux qui sont satisfaits de la collecte de données et qui souhaitent simplement avoir une vue d'ensemble d'un sujet, l'IA est souvent un excellent choix. 

Verdict final : devriez-vous utiliser des moteurs de recherche alimentés par l'IA ? 

Les utilisateurs doivent toujours être prudents et prendre le temps de lire les conditions du moteur de recherche qu'ils utilisent, qu'il soit doté d'une IA ou non. Les comptes Google et Microsoft peuvent être liés aux données, ce qui signifie que les entreprises peuvent se faire une idée plus précise des habitudes d'un utilisateur. 

Des préjugés peuvent également se glisser dans les moteurs de recherche traditionnels et les moteurs d'IA, et les utilisateurs doivent être vigilants et préparés à cette éventualité. Lorsque Google a commencé à diffuser l'IA auprès d'un public plus large, il a reçu de nombreuses critiques concernant la qualité de ses résultats de recherche. Il n'est pas rare de voir des discussions comme celle-ci sur Reddit : AI Has Made Google Search So Bad People Are Moving to TikTok and Reddit (L'IA a rendu la recherche Google si mauvaise que les gens se tournent vers TikTok et Reddit).

La recherche traditionnelle est souvent la meilleure pour tout ce qui est médical ou scientifique, mais la source de l'information doit toujours être vérifiée pour des questions critiques comme celles-ci. Pour un aperçu rapide de l'information et une approche plus conversationnelle, les moteurs d'IA peuvent être une alternative idéale. 

En fin de compte, la recherche par IA fait déjà ou fera partie de votre vie. Lorsque vous l'utilisez, n'oubliez pas de respecter la vie privée et de donner la priorité à la sécurité de votre appareil.

FAQ

Perplexity est-il un bon moteur de recherche ? 

Perplexity AI est un excellent moteur de recherche alimenté par l'IA qui fournit des réponses rapides et résumées, mais il ne fournit pas toujours des sources détaillées de manière aussi transparente que les moteurs de recherche traditionnels. 

Comment la recherche ChatGPT se compare-t-elle à Perplexity AI ? 

La fonction de recherche de ChatGPT génère des réponses conversationnelles mais peut parfois présenter des informations obsolètes ou incorrectes. L'IA Perplexity est conçue pour fournir des réponses plus fiables. Perplexity inclut également souvent des citations directes que les internautes peuvent vérifier. 

Les moteurs de recherche IA peuvent-ils remplacer Google ? 

Les moteurs de recherche IA peuvent compléter Google, mais dans leur forme conversationnelle, ils génèrent parfois des réponses incorrectes et ne disposent pas de la vaste base de données indexée de Google. Il est probable que Google restera en place, car il offre quelque chose de différent des moteurs d'IA en fournissant des résultats sous forme d'extraits et de liens vers des sites web.