Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que existe online, a lo que se denomina la Web superficial o visible.
Comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta a sus formularios de búsqueda.
Las características principales de los sitios de la Web visible son:
• su información no está contenida en bases de datos
• es de libre acceso
• no requiere la realización de un proceso de registro para acceder
Mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.
WEB PROFUNDA
La Web profunda, es un amplísimo banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito) y entre otros tipos de contenido que no puede recuperarse con los mecanismos de búsqueda comunes.
Sherman y Price (2001) identifican cuatro tipos de contenidos invisibles en la Web:
Michael Bergman, es el más reconocido estudioso de la Web Profunda, quien en su artículo ‘Web Profunda: sacando a la luz un valor escondido’ (2001), acuñó el término haciendo referencia a la expresión ‘Internet invisible’ que había sido usada por Jill Ellsworth ya en 1994, momento en el cual se pronosticaba el boom del .com y el crecimiento exponencial de la web y la consecuencia ampliación del acceso a la información y el conocimiento.
Entre los hallazgos más sorprendentes en relación con la Internet Invisible se cuentan:
• La información pública sobre
la web señala que actualmente (2001) ésta es entre 400 a 550 veces más
grande que lo que el mundo conoce como Internet.
• Sesenta de los mayores sitios
de web profunda contienen colectivamente alrededor de 750 terabytes de
información - suficientes por sí mismos para superar el tamaño de la web
superficial en cuarenta veces su tamaño.
• La web profunda es la categoría de mayor crecimiento en información de la nueva Internet.
• La información alojada en
sitios de web profunda tienden a ser más selectivos, con contenidos más
extensos que los sitios superficiales comunes.
• La relación contenido y calidad de la web profunda es de 1.000 a 2.000 veces mayor que la de la web superficial.
• Los contenidos de la web
profunda son altamente relevantes para todas las necesidades de
información, mercadeo, y dominio de Internet.
• Más de la mitad del contenido de la web profunda reside en bases de datos sobre temas específicos.
• Un total de noventa y cinco
por ciento de la web profunda es de información accesible al público, no
sujeta a cuotas o suscripciones.