Los buscadores

De entre las aplicaciones y servicios web indispensables hoy en día, hay que destacar los buscadores de internet.

Los buscadores de internet son aplicaciones web que nos permiten encontrar información en internet de manera rápida, mediante la introducción de una o diversas palabras clave. Nos devuelve una página índice que enlaza páginas web con información relacionada.

Desde el inicio de la web, el número de páginas fue creciendo de manera exponencial, lo que trajo con sigo un primer problema, ¿Cómo podemos encontrar la información deseada? En 1993 comenzaron los primeros intentos de agrupar las páginas por temas mediante páginas (Portales web) que contenían enlaces a otras páginas con una misma temática. Aparecieron los primeros «Índices temáticos», los primeros sistemas de búsqueda por temas como Lycos (1994) o Yahoo! (1995). Estos sitios tenían una organización jerárquica de temas y subtemas por la cual se podía navegar.

Lycos (1994)

 

Yahoo (1995)

Los Índices temáticos estaban formados por equipos de personas que se encargaban de identificar, clasificar y poner en listas las páginas web según temas o categorías. Era una tarea laboriosa y con limitaciones ya que eran humanos quien la realizaba. Dentro de esas páginas encontramos un formulario de búsqueda que permitía buscar dentro de las páginas que tenía indexadas, todo lo que no estuviera indexado no existía. Lo creadores de páginas web, dábamos de alta a nuestras páginas web en estos indexadores para poder existir, mediante un formulario de alta y después de la pertinente revisión, nuestra web aparecía en el listado.

Actualmente este método de indexación está en des uso por cuestiones tecnológicas (eficiencia y eficacia), a pesar de ello hay un proyecto que se llama Open Directory Project que ofrece un servicio de indexación gracias a la colaboración de una comunidad de editores voluntarios.

ODP del directory.mozilla.org (2019)

Desde inicios del siglo XX, los sitios de búsqueda evolucionan hacia los motores de búsqueda.

Los motores de búsqueda son programas que funcionan en tres fases:

  1. La descarga de páginas web. Mediante programas especializados que se conocen como arañas, se descargan las páginas web y siguen los enlaces que se encuentran para ir descargando más páginas web y así sucesivamente. Se almacena una copia en los servidores del buscador. Los más conocidos son Google, Yahoo! Search, Alltheweb, Bing, etc…
  2. Indexación de páginas web. El motor de búsqueda aplica una serie de algoritmos para extraer las palabras clave. las palabras que aparecen en el título de la página suelen tener más peso que el resto, también almacenan metainformación sobre la página que pueda ser de interés (idioma, licencia de uso, edad, etc.)
  3. Optimización de resultados (eficiencia y eficacia). Mostrar la información de manera útil al usuario, tiempo de espera bajo, etc.

No podemos terminar esta entrada sin hacer una pequeña referencia al algoritmo de Google.

Desde su origen, Google utiliza un algoritmo que se denomina, PageRank que da una valoración a una página a partir del número de páginas que enlazan y que a su vez tienen un PageRank alto, es decir nuestra página estará mejor situada si otras páginas que se encuentra bien situadas enlazan con la mía. Esta algoritmo se ha ido modificando en sucesivas «generaciones» sobre todo a partir de 2011, apareciendo nuevos algoritmos que han influido de manera decisiva el modo de construir internet.

  • 2011: Algoritmo Google Panda. Se centra en analizar el contenido de una página web, penalizando el abuso de keywords, las webs con escaso contenido, duplicado o que no aportaba valor al usuario.
  • 2012: Algoritmo Google Penguin. El objetivo es premiar aquellas webs que conseguían sus enlaces en base al contenido de forma natural y progresiva y no mediante la automatización o captura de enlaces.
  • 2012: Algoritmo Google Venice. Las IP se convierten en el elemento central de tus búsquedas, el usuario ya no buscará por ciudad sino que el propio Google mostrará sus resultados a partir de la localización IP.
  • 2013: Algoritmo Hummingbird. Analítica semántica con el objetivo de conseguir que los resultados de nuestras búsquedas sean más naturales.
  • 2014: De http a https. Seguridad en la comunicación a través de http.
  • 2014: Algoritmo Google Pigeon. Regula las búsquedas locales, favoreciendo la igualdad de oportunidades de negocios entre pequeñas y grandes empresas en internet. 
  • 2014-2019: Actualización a Pirate 2.0. Contra la piratería informática.
  • 2015: Algoritmo Mobilegeddon. «mobile-friendly»
  • 2016: Algoritmo Google Possum. Una actualización de Venice y mejora.

 

 

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información

ACEPTAR
Aviso de cookies
error: