lunes, 22 de junio de 2015

Web superficial y Web profunda....

"Internet invisible es un nombre inadecuado(...) Debería denominarse, la Web "no indizable"
Lluis Codina


Web superficial o visible es lo que ofrecen los buscadores tradicionales, una pequeña parte de lo que realmente existe. El resto es la Web Profunda o invisible, que se encuentra ubicada en catálogos, revistas digitales, blogs, entradas a diccionarios y contenidos de sitios que piden un login, aun siendo gratuito, y otros tipos de contenido que no salen por la búsqueda tradicional.






WEB SUPERFICIAL

Comprende todos aquéllos sitios donde la información puede ser indexada por los buscadores convencionales. Se caracterizan por:
  • Información no contenida en bases de datos.
  • Libre acceso.
  • Sin necesidad de registro.
  • Webs estáticas, paginas y archivos con URL fija y accesible desde otro enlace.


WEB PROFUNDA

la Internet profunda es la que esta compuesta por toda la información y bases de datos a las que los motores de búsqueda y directorios no tienen acceso directo.

No se consigue interrogando a los buscadores convencionales. Es información almacenada en bases de datos.
Parte de esta información es invisible a los robots, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP,...); son páginas que no tienen URL fija y se construyen en el mismo momento (temporales) desapareciendo una vez cerrada la consulta.


CONTENIDOS INVISIBLES

Sherman y Price distinguen cuatro contenidos invisibles:
  • WEB OPACA: no están incluidos en los índices de buscadores por uno de estos motivos:
        -Extensión de la indización. Por economía no todo es indizado.
        -Frecuencia de indización, no tienen tiempo real suficiente.
        -Número máximo de resultados visibles, límite entre 200 y 1000.
        -URL desconocidas.
  • WEB PRIVADA, excluídas deliberadamente por:
       -Protección con contraseña.
       -Contienen un archivo "robots.txt" que evitan ser indizados.
       -Contienen un campo "noindex" para evitar indizar la parte correspondiente        al cuerpo de la página.
  • WEB PROPIETARIA: necesario registrarse para tener acceso al contenido
  • WEB REALMENTE INVISIBLE: son aquellas páginas que no se pueden indizar por limitaciones técnicas de los buscadores, programas ejecutables, y archivos comprimidos, páginas que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionadas, que no puede ser extraída a menos que se realice una petición específica.
RECURSOS DE BÚSQUEDA
  • WWW VIRTUAL LIBRARY ,catálogo más antiguo iniciado por Tim Berners-Lee, el creador de la  Web.
  • Infoplease, de la Enciclopedia Columbia.
  • DeepWebTeach. Ciencia, medicina, negocios.
  • Tech Xtra. Ingeniería, matemáticas, informática.



1 comentario:

  1. Hola Esther, me gustó tu entrada sobre Web Superficial o Profunda. Super que hayas anexado links de referencia. A seguir adelante, felicidades!

    ResponderEliminar