¿Qué son los motores de búsqueda basados en IA y cómo funcionan?
Los motores de búsqueda han recorrido un largo camino desde que se limitaban a emparejar palabras clave con páginas web. Google ya cuenta con un algoritmo inmensamente potente que se ajusta constantemente, pero el siguiente paso en las búsquedas podría estar aquí.
Los motores de búsqueda basados en IA van más allá y utilizan modelos avanzados de aprendizaje automático para comprender la intención, analizar el contexto y generar resultados más precisos. A diferencia de los motores de búsqueda tradicionales, que se basan en algoritmos de clasificación y páginas indexadas de sitios web, estas herramientas basadas en IA procesan las consultas de forma más parecida a como lo haría un ser humano. A menudo, sus respuestas no remiten a un sitio web, sino que están diseñadas para resumir la información.
Estos sistemas utilizan grandes modelos lingüísticos para cribar grandes cantidades de datos, resumir contenidos y, a veces, incluso predecir qué información necesitan los usuarios antes de que la pidan. Algunos motores de búsqueda de IA también integran la navegación web en tiempo real para poder extraer información fresca en lugar de basarse únicamente en resultados preindexados. En el cambiante mundo de las noticias y la tecnología, esto puede ser crucial.
¿Qué es la IA de perplejidad?
Perplexity es un motor de búsqueda conversacional diseñado para dar respuestas naturales a las preguntas de los usuarios. La gente lo ha descrito como un cruce entre ChatGPT y Google en la forma en que proporciona resultados. Se trata de una especie de asistente digital que busca entre mucha información relevante para la consulta y ofrece una respuesta sencilla en lenguaje natural.
Se basa en la tecnología LLM de algunos de los gigantes del sector, como GPT-4, Claude 3.5, Grok-2, Llama 3 y los LLM internos Perplexity desarrollados por la empresa.
¿Qué es Google SGE (Search Generative Experience)?
Es posible que ya hayas experimentado el SGE de Google sin saberlo. Comenzó a desplegarse en mayo de 2024 y ahora es común para muchas búsquedas en la plataforma de Google. Se trata de una versión mejorada con IA de su motor de búsqueda estándar.
En lugar de limitarse a devolver enlaces, SGE utiliza el aprendizaje automático para generar resúmenes, proporcionando a los usuarios una visión instantánea sin necesidad de hacer clic en múltiples resultados y leer páginas web para encontrar esa información.
Este sistema integra respuestas generadas por la IA en la parte superior de los resultados de búsqueda, ofreciendo una instantánea de la información relevante y permitiendo al mismo tiempo a los usuarios explorar los enlaces tradicionales si lo prefieren. La información también puede citarse con la fuente original para que la gente la verifique o siga leyendo.
¿Cómo funciona la búsqueda Microsoft Copilot?
Microsoft Copilot es similar en concepto al SGE de Google. Funciona dentro de Bing, mejorando la búsqueda tradicional con un resumen potenciado por IA y la recuperación de datos en tiempo real. Al integrar la tecnología de OpenAI (la empresa que fabrica ChatGPT), Copilot proporciona respuestas detalladas al tiempo que mantiene el acceso a los enlaces web convencionales para quienes los deseen. Microsoft también afirma que el software entiende el contexto, algo que puede ayudar mucho a ofrecer a los usuarios los resultados adecuados.
¿Qué es la búsqueda ChatGPT y cómo funciona?
La función de búsqueda de ChatGPTcombina respuestas generativas impulsadas por IA con navegación web en tiempo real. Puede extraer citas e información directamente de sitios en vivo, pero también se basa en el inmenso conocimiento del propio LLM.
A diferencia de los motores de búsqueda tradicionales, que dan prioridad a las clasificaciones y a la autoridad de la página, ChatGPT ofrece una experiencia más interactiva al permitir a los usuarios cambiar sus consultas dentro de un enfoque conversacional.
¿Qué son las alucinaciones AI y cómo se producen?
Cuando un sistema de inteligencia artificial genera información inexacta, engañosa o que podría calificarse de "noticia falsa", suele hablarse de alucinación de inteligencia artificial. Esto puede ocurrir por varias razones. En pocas palabras, se debe a la forma en que los modelos de IA procesan y predicen el texto.
Los motores de búsqueda de IA no piensan como los humanos: predicen respuestas basándose en patrones de los datos con los que han sido entrenados. A veces, este proceso sale mal, sobre todo en temas en los que hay muchas opiniones contrastadas. Algunos estudios han sugerido incluso que los modelos de IA pueden haber sido entrenados utilizando sesgos humanos, lo que puede causar alucinaciones.
Las alucinaciones también pueden producirse cuando una IA intenta rellenar lagunas en sus conocimientos inventándose hechos para crear lo que parece una respuesta completa y segura. La IA está hecha con el objetivo de responder a las preguntas y a veces lo hará con información inexacta. portancia de desarrollar defensas y mecanismos de detección robustos para mitigar las amenazas potenciales.
Ejemplos de alucinaciones de la IA en los motores de búsqueda
Muchos de nosotros ya los hemos visto de forma anecdótica si utilizan IA. Hay muchos ejemplos de afirmaciones que no son correctas y que los motores de búsqueda de IA proporcionan con confianza.
El chatbot Bard de Google, durante una demostración en 2023, [explicó incorrectamente](https://mashable.com/article/google-bard-james-webb-telescope-false-fact) que el telescopio espacial James Webb había captado las primeras imágenes del mundo de un planeta fuera de nuestro sistema solar. Se trataba de una invención de la IA, que incluso hizo perder miles de millones del valor de sus acciones al holding de Google.
Algunas de las respuestas han sido jocosas. Un internauta compartió una captura de pantalla de un resumen de IA para la consulta "frutas que terminan en um" en la que se afirmaba que "applum, banana, strawberrum, tomatum y coconut" eran los ejemplos utilizados.
¿Se pueden manipular los motores de búsqueda?
Existe la posibilidad de manipulación e incluso se ha demostrado en los últimos meses. Más allá de generar respuestas incorrectas, los motores de búsqueda de IA también pueden verse influidos por los datos con los que se entrenan.
La IA se basa en los datos que recibe (en sentido proverbial) y, en primer lugar, necesita fuentes fiables. Esto significa que existe la posibilidad de que la tecnología capte sesgos basados en su material de origen. Por ejemplo, algunas investigaciones han sugerido que las herramientas de IA valoran las fotos de mujeres de forma más sugerente que las imágenes de hombres, quizá porque muchos de los creadores de la tecnología son ellos mismos hombres, con puntos de vista subjetivos.
Los estudios también han demostrado que el texto que ChatGPT y otros motores de IA similares rastrean podría utilizarse para manipular, mediante texto oculto que podría devolverse al usuario final. También es posible que varios sitios web colaboren para intentar engañar o manipular a una IA: si un número suficiente de fuentes poco fiables dicen lo mismo, un modelo de IA podría aceptarlo como un hecho e incorporarlo a sus resultados.
¿Proporcionan los motores de búsqueda IA información actualizada en tiempo real?
Todos nos hemos acostumbrado al hecho de que podemos buscar en Google una noticia o algo que esté de moda y ver resultados que se han publicado muy recientemente. La IA no funciona de la misma manera, así que ¿hasta qué punto está actualizada la información?
¿Tiene la búsqueda por IA acceso a datos en tiempo real?
Los modelos de inteligencia artificial suelen entrenarse a partir de una instantánea de Internet, en lugar de actualizar continuamente sus conocimientos. Esto significa que no "ven" intrínsecamente nuevas páginas web como lo hace un motor de búsqueda tradicional como Google. Sin embargo, algunas herramientas de búsqueda de IA intentan salvar esta distancia integrando búsquedas web en tiempo real.
Copilot de Microsoft (antes Bing AI) y Search Generative Experience (SGE) de Google intentan extraer datos actuales vinculando las respuestas de la IA con los resultados de las búsquedas en directo. En muchas búsquedas con IA, puede haber un desfase entre el momento en que se publica la nueva información y el momento en que las herramientas de búsqueda con IA la reconocen.
¿Qué frescura tienen los datos de los resultados de búsqueda de IA?
La frescura de los datos depende del modelo de IA. Algunos modelos de IA sólo conocen los datos con los que han sido entrenados, lo que significa que sus datos podrían estar desactualizados hace meses o incluso años. Por ejemplo, los datos del modelo de preentrenamiento de ChatGPT sólo llegan hasta octubre de 2023. Esto es un gran inconveniente a la hora de buscar cosas como acontecimientos actuales o nuevos descubrimientos científicos. Si, por ejemplo, preguntáramos a algunos motores de búsqueda de IA por los últimos ganadores de un premio, es posible que no conocieran la información más reciente.
¿La búsqueda por IA clasifica la información de forma objetiva?
La objetividad puede escasear en la era moderna de Internet, y la IA no lo arregla necesariamente. En lugar de limitarse a clasificar los resultados existentes, la IA genera activamente respuestas basadas en patrones de sus datos de entrenamiento y algoritmos de búsqueda. Esto puede dar lugar a sesgos.
La forma en que la IA selecciona y resume la información no siempre es neutral. Si una IA ha sido entrenada con datos que se inclinan en una determinada dirección, sus resúmenes pueden reflejar ese sesgo, aunque sea involuntariamente.
Los desarrolladores no dejan de trabajar en ello. El nuevo modelo de ChatGPT anunciaba que la tasa de sesgos y alucinaciones había disminuido considerablemente, pero estamos en los primeros días de esta tecnología.
¿Son los motores de búsqueda basados en IA un riesgo para la privacidad?
Las herramientas de búsqueda de IA procesan y generan activamente respuestas basadas en las consultas de los usuarios. Esta capa adicional de procesamiento plantea dudas sobre cómo se procesan y protegen los datos.
¿Los motores de búsqueda de IA rastrean tus datos?
Muchos motores de búsqueda de IA recopilan datos. El alcance varía según la plataforma. Algunos almacenan las consultas para mejorar sus modelos de IA, mientras que otros afirman evitar el rastreo a largo plazo. Las herramientas basadas en IA suelen recopilar datos para refinar las respuestas y personalizar los resultados. La gente se pregunta si es seguro utilizar Copilot o si SGE recopila datos. Son temas complejos.
Según Microsoft, "Copilot está construido sobre Microsoft Azure OpenAI Service y se ejecuta completamente dentro de la nube Azure. Azure OpenAI ofrece disponibilidad regional y filtrado responsable de contenidos de IA". Copilot sí recopila datos, pero presume de que están seguros en la nube.
Es posible que las plataformas integren el comportamiento de búsqueda de la IA con los perfiles de usuario existentes. Esto significa que la actividad de búsqueda podría vincularse a otros hábitos en línea, lo que suscitaría preocupación por la seguridad de los datos y la publicidad selectiva.
¿Qué ocurre con tus búsquedas en plataformas basadas en IA?
Los datos de búsqueda no desaparecen automáticamente. Aunque los términos y condiciones pueden detallar el hecho de que estos datos no se comparten directamente, pueden conservarse durante largos periodos para ayudar a refinar los modelos de aprendizaje automático. Algunos motores de búsqueda de IA incluso utilizan consultas anteriores para dar forma a respuestas futuras.
Si una herramienta de búsqueda con IA guarda las entradas del usuario, estos datos podrían analizarse para mejorar la precisión o entrenar futuras versiones del modelo. Aunque las empresas afirman que la información de identificación personal se elimina, los usuarios preocupados por su privacidad pueden sentirse incómodos con el registro de su historial de búsqueda.
¿Los enlaces de afiliación y los anuncios influyen en los resultados de búsqueda de la IA?
A la mayoría de las empresas les mueven los beneficios. Tanto los motores de búsqueda como quienes les suministran datos (editores) pueden utilizar enlaces de afiliación o anuncios en forma de contenido publicitario.
El SGE de Google, por ejemplo, ya integra resultados basados en IA con su ecosistema publicitario. Microsoft Copilot hace algo parecido mezclando respuestas de IA con enlaces promocionados. El riesgo aquí es que los resúmenes generados por la IA podrían empujar sutilmente a los usuarios hacia contenidos de pago sin que la distinción sea obvia.
Lo que nunca debes compartir con los motores de búsqueda de IA
Al igual que con cualquier otra cosa que publique en Internet, evite compartir demasiados datos personales. La regla de oro es no compartir tu información personal identificable. Como escribe Amanda Caswell en Tom's Guide le dije a ChatGPT algo de lo que todavía me arrepiento - aquí tienes 7 cosas que nunca debes compartir, nunca debes compartir lo siguiente cuando interactúes con herramientas de búsqueda de IA (¡independientemente de la herramienta!):
1: Información personal identificable (PII) - todo esto está fuera de los límites: tu nombre real, fecha de nacimiento, número de la seguridad social (SSN), dirección real, etc. Todo lo que no quieras enviar a una dirección de correo electrónico desconocida, no deberías utilizarlo conversando con ChatGPT. Usted quiere limitar esta exposición, por lo que el uso "ficticio" nombre y fecha de nacimiento si es necesario. He sido Helly R. más veces de las que me gustaría admitir.
2: Información financiera: números de tarjetas de crédito, cuentas bancarias, información fiscal.
3: Contraseñas - aunque pueda parecer una buena idea pedirle a ChatGPT que cree una contraseña segura para ti, nunca lo es. Si tiene que utilizar una herramienta automática para crear una contraseña para usted, al menos asegúrese de que proviene de una fuente de confianza - pista, utilice nuestro generador de contraseñas en su lugar. Lee también sobre las claves de acceso y la autenticación multifactor como opciones de inicio de sesión más seguras.
4: Información médica: puede ser tentador comunicarse con un asistente digital útil sobre su diagnóstico. Escribimos sobre AI chatbot provider exposes 346,000 customer files, including ID documents, resumes, and medical records. Si debes interactuar con ChatGPT sobre tu condición, asegúrate de abstenerte de mencionar que se trata de tu propio diagnóstico. Finge estar realizando una investigación en lugar de exponer tus datos confidenciales en línea.
¿Son seguros para los niños los motores de búsqueda de inteligencia artificial?
Cada vez son más los jóvenes que utilizan herramientas de IA para hacer los deberes y navegar en general, además de divertirse un poco, por lo que los padres se hacen una pregunta importante: ¿Son los buscadores de IA seguros para los niños? Los motores de búsqueda tradicionales tienen controles parentales y filtros que ayudan a bloquear contenidos explícitos (lo cual no quiere decir que siempre hayan sido perfectos), pero las respuestas generadas por IA añaden una nueva capa de complejidad.
¿Es Perplexity AI segura para los niños?
El uso no supervisado es un tema difícil y una decisión que deben tomar los propios padres. La IA genera respuestas basadas en patrones en sus datos de entrenamiento, a veces puede producir contenidos engañosos o inapropiados.
Aunque la plataforma afirma utilizar técnicas de filtrado, el texto generado por la IA no siempre es predecible. A diferencia de los motores de búsqueda tradicionales, que se limitan a bloquear determinadas páginas, una herramienta de IA podría sintetizar contenidos inapropiados en función de las consultas de los usuarios.
¿Filtra la IA los contenidos inapropiados?
La mayoría de los motores de búsqueda basados en IA intentan filtrar el material explícito. Sin embargo, ningún sistema es infalible y pueden producirse errores. SGE, de Google, y Copilot, de Microsoft, disponen de herramientas de moderación de contenidos, pero a veces la IA puede generar respuestas que se escapan de las manos.
Un problema importante es que la IA no "piensa" como los humanos. Si se le pregunta por un tema delicado, puede producir involuntariamente contenidos inadecuados para los niños, aunque no haya sido entrenada directamente para ello. Este es uno de los riesgos inherentes a su uso.
¿Qué motor de búsqueda de inteligencia artificial es el mejor (y el más seguro)?
Los internautas tienen que tomar una decisión. ¿En qué motor de búsqueda de inteligencia artificial confían? Algunas personas son muy cautelosas con sus datos y el uso que se hace de ellos, y comprobar los términos y condiciones es esencial en este escenario.
¿Qué motor de búsqueda de inteligencia artificial ofrece la mejor privacidad?
Hay ventajas y desventajas, pero Perplexity AI permite la navegación anónima y sólo recoge algunos datos de uso para mejorar los resultados. Podría decirse que es la mejor opción en cuanto a privacidad.
El SGE de Google y Microsoft Copilot, por su parte, integran la búsqueda por IA con los perfiles de usuario existentes. Es posible que las búsquedas se vinculen a datos publicitarios o cuentas personales. El motor de búsqueda Brave es uno de los que se han diseñado para intentar aumentar la privacidad, ya que genera las respuestas dentro del navegador en lugar de en un servidor.
La búsqueda basada en web de ChatGPT también puede registrar las interacciones de los usuarios con cuentas gratuitas. Las opciones de IA más seguras son las que no requieren inicio de sesión ni recopilan un historial de búsqueda.
¿Deberías confiar más en los motores de búsqueda de IA que en Google?
Los motores de búsqueda de inteligencia artificial son propensos a cometer errores y a veces presentan información errónea o hechos "alucinados" como verdad. También son bastante nuevos y siguen evolucionando, por lo que el futuro de las búsquedas podría ser muy diferente a medida que se añadan nuevas funciones.
Aunque los resultados de búsqueda de Google también pueden estar sesgados (o dirigidos por anuncios), los usuarios pueden al menos cotejar varias fuentes antes de formarse conclusiones. Para temas importantes que requieran conocimientos científicos o médicos, utilizar motores de búsqueda y referenciar múltiples fuentes es seguro.
Para los que se conforman con que se recopilen datos y sólo quieren una simple visión general de un tema, la IA suele ser una gran elección.
Veredicto final: ¿debería utilizar motores de búsqueda basados en IA?
Los usuarios siempre deben ser precavidos y tomarse el tiempo necesario para leer las condiciones del motor de búsqueda que utilicen, tanto si funciona con IA como si no. Las cuentas de Google y Microsoft pueden estar vinculadas a los datos, lo que significa que las empresas pueden hacerse una idea más amplia de los hábitos de un usuario.
La parcialidad también puede introducirse en los motores de búsqueda tradicionales y en los motores de IA, y los usuarios deben estar atentos y preparados para ello. Cuando Google empezó a extender la IA a un público más amplio, recibió muchas críticas sobre la calidad de sus resultados de búsqueda. Es habitual ver discusiones en Reddit como ésta: AI Has Made Google Search So Bad People Are Moving to TikTok and Reddit.
La búsqueda tradicional suele ser la mejor para todo lo relacionado con la medicina o la ciencia, pero siempre hay que verificar la fuente de la información para cuestiones críticas como éstas. Para obtener una visión rápida de la información y un enfoque más conversacional, los motores de IA pueden ser una alternativa ideal.
En última instancia, la búsqueda por IA ya forma o formará parte de tu vida. Cuando la utilices, recuerda ser inteligente con la privacidad y dar prioridad a la seguridad de tu dispositivo.
Preguntas frecuentes
¿Pueden los motores de búsqueda de IA sustituir a Google?
Los motores de búsqueda de IA pueden complementar a Google, pero en su forma conversacional a veces generan respuestas incorrectas y carecen de la vasta base de datos indexada que ofrece Google. Es probable que Google se mantenga, ya que ofrece algo diferente de los motores de IA en el hecho de que proporciona resultados en forma de fragmentos y enlaces a sitios web.