"Internet invisible es un nombre inadecuado(...) Debería denominarse, la Web "no indizable"
Lluis Codina
Web superficial o visible es lo que ofrecen los buscadores tradicionales, una pequeña parte de lo que realmente existe. El resto es la Web Profunda o invisible, que se encuentra ubicada en catálogos, revistas digitales, blogs, entradas a diccionarios y contenidos de sitios que piden un login, aun siendo gratuito, y otros tipos de contenido que no salen por la búsqueda tradicional.
WEB SUPERFICIAL
Comprende todos aquéllos sitios donde la información puede ser indexada por los buscadores convencionales. Se caracterizan por:
- Información no contenida en bases de datos.
- Libre acceso.
- Sin necesidad de registro.
- Webs estáticas, paginas y archivos con URL fija y accesible desde otro enlace.
WEB PROFUNDA
la Internet profunda es la que esta compuesta por toda la información y bases de datos a las que los motores de búsqueda y directorios no tienen acceso directo.
No se consigue interrogando a los buscadores convencionales. Es información almacenada en bases de datos.
Parte de esta información es invisible a los robots, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP,...); son páginas que no tienen URL fija y se construyen en el mismo momento (temporales) desapareciendo una vez cerrada la consulta.
CONTENIDOS INVISIBLES
Sherman y Price distinguen cuatro contenidos invisibles:
- WEB OPACA: no están incluidos en los índices de buscadores por uno de estos motivos:
-Extensión de la indización. Por economía no todo es indizado.
-Frecuencia de indización, no tienen tiempo real suficiente.
-Número máximo de resultados visibles, límite entre 200 y 1000.
-URL desconocidas.
- WEB PRIVADA, excluídas deliberadamente por:
-Protección con contraseña.
-Contienen un archivo "robots.txt" que evitan ser indizados.
-Contienen un campo "noindex" para evitar indizar la parte correspondiente al cuerpo de la página.
- WEB PROPIETARIA: necesario registrarse para tener acceso al contenido
- WEB REALMENTE INVISIBLE: son aquellas páginas que no se pueden indizar por limitaciones técnicas de los buscadores, programas ejecutables, y archivos comprimidos, páginas que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionadas, que no puede ser extraída a menos que se realice una petición específica.
- WWW VIRTUAL LIBRARY ,catálogo más antiguo iniciado por Tim Berners-Lee, el creador de la Web.
- Infoplease, de la Enciclopedia Columbia.
- DeepWebTeach. Ciencia, medicina, negocios.
- Tech Xtra. Ingeniería, matemáticas, informática.


Hola Esther, me gustó tu entrada sobre Web Superficial o Profunda. Super que hayas anexado links de referencia. A seguir adelante, felicidades!
ResponderEliminar