Baeza-Yates (Yahoo!): Buscadores entienden la sintáctica pero no la semántica

  • Sergio Andreu.

Sergio Andreu.

Barcelona, 19 ago.- En la "selva web" formada por 200 millones de sitios, los buscadores son una brújula vital, aunque según el vicepresidente de los laboratorios de investigación de Yahoo! en Europa y Oriente Medio, Ricardo Baeza-Yates, estos rastreadores entienden la sintáctica pero no la semántica de lo que se les pide.

Baeza-Yates explica, en una entrevista con Efe, que uno de los retos de los investigadores es precisamente hallar el "genoma diferencial" de cada uno, para discernir entre la web popular, que interesa a todos, y la particular, que identifica a cada usuario.

Este ingeniero chileno (1961), invitado por la Fundación Barcelona Media en su décimo aniversario para ofrecer una charla sobre cómo aprovechar mejor el conocimiento que aglutina la Web, supervisa los trabajos que desde Yahoo! Research se realizan en sus diferentes laboratorios para interpretar la información que se genera, almacena y demanda en la red, y cómo gestionarla.

- Pregunta: La red es una maraña creciente. ¿Qué hacer para que el usuario obtenga lo que quiere?

- Respuesta: "La web no tendría sentido sin buscadores. No se pueden manejar así como así 200 millones de sitios. El problema principal es cómo recolectarlo todo y decidir cuáles son las mejores respuestas a cada pregunta. Ése es el desafío y creo que se ha resuelto bastante bien. Los enlaces y los 'clics' que hace la gente nos ayudan a realizar las mejores búsquedas.

- P: ¿Cuál es la principal 'discapacidad' de los buscadores?

- R: "Los ordenadores no son inteligentes, se aproximan a entender lo que están indexando, pero no entienden la semántica, entienden la sintáctica, las relaciones que hay entre elementos, no pueden saber qué es lo que dicen.

- P: ¿En qué punto nos encontramos en la búsqueda de esa web semántica inteligente?

- R: "La tecnología existe. Si todos fuéramos coherentes a la hora de poner una información o al crear sitios nuevos, la semántica sería una realidad en la web. El problema es que la web es un reflejo de nosotros mismos, no todos somos organizados. Los ficheros tienen metadatos pero pocos los rellenan diciendo quién es el autor. Hay una combinación de elementos organizados, que sería la web semántica, y otra que crecerá de forma caótica.

- P: ¿Cómo ve un buscador a un usuario cuando éste le hace una consulta?

- R: "Hay muchas formas. Una en la que no ve al usuario y sólo ve la pregunta. Sabe que puede tener un historial con una serie de consultas, unas cookies de preguntas anteriores. Sabe qué cosas hiciste, pero la dificultad es que la mayoría de usuarios no hace su parte del trabajo, se impone la ley del mínimo esfuerzo. No contextualiza lo que está tratando de hacer ni busca a todas las personas que están haciendo lo mismo.

- P: ¿Cómo nos protegemos de la acumulación de datos personales que hace la web?

- R: "Uno deja huella en el papel de los libros que lee, en la televisión que graba, la única diferencia es que en la web siempre está ahí y es de más fácil acceso. Legalmente, uno podría tratar de eliminar un dato falso sobre su persona. Pero habría que hacerlo país por país, y se convierte en una tarea titánica. La solución va por otro lado, que las personas sepan lo que están haciendo y asuman los riesgos tanto como asumen los beneficios. A todo el mundo le gustan los servicios que ofrece internet pero no piensan que hay una contrapartida si ponen algo que no deben poner.

- P: La gente desconfía cada vez más de los buscadores ¿hacen bien?

- R: "Si los buscadores no fueran objetivos nadie los utilizaría. Yo mismo no lo usaría si supiera que están manipulados y no son objetivos. Lo que ordena los resultados son programas muy sofisticados que usan cientos de señales distintas para impedir que otras personas las manipulen. Entrenamos estas señales para que sean más robustas y evitar cualquier manipulación".

- P: ¿Cuál es el futuro a corto plazo de la web?

- R: "Tendrá que ver con el aprovechamiento las nuevas experiencias de los multidispositivos. Va a ser habitual que las personas vean la televisión de forma interactiva, junto con su smartphone e internet. Hay que aprovechar la sabiduría de la gente, de toda esa información para generar nuevas informaciones que serán nuevas composiciones de lo que ya se sabe.

- P: "Tener todo el conocimiento del mundo a golpe de clic en un smartphone, en el bolsillo, cambiará nuestra forma de conocimiento?

- R: "Se trata de un problema sociológico. Pasó con la calculadora y ahora hay gente que no sabe ni multiplicar. Cambiará la forma de hacer las cosas y la cantidad de conocimiento que se posee, pero, por otro lado, vamos a ser más hábiles en encontrar la información. Tiene ventajas y desventajas. La desventaja es que no sabré contestar inmediatamente a una pregunta porque no sé la respuesta, pero la ventaja es que podré contestar muchas más preguntas. Eso es productivo".

- P: ¿Qué proyectos tienen entre manos en los laboratorios de Yahoo!?

- R: "Hay muchas líneas de investigación de datos, de uso de la web, entenderla como una web de objetos más que una página, compuesta por actividades que son personas, lugares, y descifrar esas conexiones para que el buscador las entienda y pueda presentar los resultados de otra manera, como una red o como una línea de tiempos. Hay que aprovechar lo que la gente opina, sus sentimientos, permitir entender lo que quiere la gente".

Mostrar comentarios