Google lanza un nuevo sistema de búsqueda que ofrece resultados casi en tiempo real

Caffeine permite encontrar enlaces a contenidos más rápido y poco después de su publicación.

Portaltic / Ep

09 de junio 2010 - 18:10

Madrid/Google ha anunciado el lanzamiento de Caffeine, su nuevo sistema de indexación de la web que proporciona resultados un 70 por ciento más actualizados que los del último índice, según la compañía. Tiene un tamaño de casi 100 millones de gigabytes en una base de datos y añade información nueva a una velocidad de cientos de miles de gigabytes al día.

De esta forma, Google ha reaccionado a la mayor cantidad y celeridad de actualización de páginas web tras el auge de blogs y redes sociales o la cada vez mayor presencia de contenidos multimedia en internet. Tanto si se trata de noticias como de entradas de un blog o de un foro, gracias a Caffeine se pueden encontrar enlaces a contenido relevante más rápidamente y poco después de su publicación.

La compañía explicó en un comunicado que además de la evolución en los contenidos el otro motivo responsable de la creación de Caffeine es el propio comportamiento del usuario. Ahora sus expectativas cuando hace una búsqueda son "más altas y quiere encontrar el contenido relevante más reciente". Asimismo, aquellos que publican ese contenido "esperan que se encuentre justo después de haberlo publicado", apuntó la compañía.

El antiguo índice de Google estaba compuesto por varias secciones, algunas de las cuales se actualizaban con más frecuencia que otras. Una gran parte del índice se actualizaba cada dos semanas. Para actualizar una sección del antiguo índice, Google tenía que analizar toda la web, lo que significaba un retraso considerable entre el momento en que lo encontraba y el momento en que estaba disponible para los usuarios.

Caffeine analiza internet dividiéndola en segmentos (por ejemplo: vídeos, libros, tweets etc.) y permite actualizar el índice de búsqueda de forma "continua y global". Así, a medida que se encuentran nuevas páginas o información actualizada en páginas ya existentes, se pueden añadir estos resultados directamente al índice, explicó la compañía. El resultado es que cuando se hace una búsqueda es posible encontrar la información "más reciente, independientemente de cuándo y dónde se publique".

Los datos de Caffeine

Caffeine permite indexar páginas web a gran escala. De hecho, cada segundo Caffeine procesa cientos de miles de páginas en paralelo. Esto equivaldría a una columna de papel de aproximadamente cinco kilómetros de altura (apilado, indexado y vuelto a apilar cada segundo). Caffeine tiene un tamaño de casi 100 millones de gigabytes de almacenamiento en una base de datos y añade información nueva a una velocidad de cientos de miles de gigabytes al día. Si se quisiera almacenar esta cantidad de información, se necesitarían 625.000 de los iPods con mayor capacidad, y puestos en fila ocuparían más de 64 kilómetros. Por último, Google matizó que Caffeine "se ha diseñado pensando en el futuro" porque nos permitirá construir un motor de búsqueda más "rápido y completo, capaz de gestionar el aumento de la información on line y ofreciendo los resultados más relevantes".

stats