YouTube canal de Davinchi el wxp, WXP Productions, Perrodesgraciado177, Davinchi el wxp, Da Vinci el wxp
Davinchi el wxp / YouTube
Davinchi el wxp en Twitter, WXP Productions, Perrodesgraciado177, Davinchi el wxp, Da Vinci el wxp
Davinchi el wxp / Twitter

The Deep Web (La Web Profunda)

Es posible que quienes utilizaron por primera vez el término "navegar" para describir los desplazamientos que uno hace por Internet, no supieran lo exactos que estaban siendo. Uno navega por la superficie, más no por el fondo. Los motores de búsqueda, como Yahoo, Google, Bing, Ask, entre otros, solo barren la superficie de las aguas, y no el oscuro fondo del mar.

 

The Deep Web, La Web Profunda, WXP Productions, Perrodesgraciado177, Davinchi el wxp, Da Vinci el wxp

 

Internet es una entidad compleja, que contiene una gran variedad de información, e incluye una mezcla cambiante de diferentes tipos de archivos y medios de comunicación. Es mucho más que páginas estáticas y webs autónomas. De hecho, la parte de la Web, que no es estática, y que funciona de forma dinámica, es decir: "sobre la marcha," es mucho mayor que los documentos estáticos que muchos asocian con la Web.

 

Pero hay algo que se llama Internet profunda, que multiplica astronómicamente a la ya de por sí astronómica cantidad de páginas a las que se accede mediante los buscadores tradicionales (más de mil millones y en aumento). La Deep Web o Web Profunda se define generalmente como el contenido de la web que no es accesible a través de los motores de búsqueda convencionales.

 

 

The Deep Web (La Web profunda)

 

Anteriormente (1994) denominada como "La Web Invisible" debido a las características de ciertas páginas para ser imposibles de accesar directamente a través del uso motores de búsqueda estándar. La Deep Web fue concedida como un espacio libre para aquellas personas que requerían un grado más alto de privacidad en internet y fue rebautizada con este nombre en enero del 2001.

 

La Web Profunda es un conglomerado de servidores, páginas y material web oculto a la vista del usuario común. Un mundo paralelo al Internet que todos nosotros conocemos, un lugar donde no existen leyes, donde no existen las restricciones y donde cada usuario puede poner su información por más baja, vil o ruin que esta sea.

 

Los motores de búsqueda rastrean la red con programas denominados "arañas", indexando el contenido de las páginas y saltando de una a otra siguiendo los enlaces de hipertexto que contienen. Incluso los buscadores más potentes, como Google, que superan los mil millones de páginas, no indexan más allá del 50% de la Red, según las estimaciones más optimistas.

 

Esto hace que Internet se pueda ilustrar muy bien con la analogía de un iceberg, donde solo una parte del mismo está por encima de la superficie de unas oscuras y muy profundas aguas. Y donde la punta del iceberg que todos vemos y donde comúnmente estamos, no es más que únicamente una insignificante porción de toda la información contenida en Internet.

 

A diferencia de la superficie donde todos buscan ser vistos y donde todo está conectado por unos finos, pero firmes hilos formando una tela de araña digital, en la Web Profunda existen muy pocas conexiones. Pero para entender por qué la web profunda no accede a Google, a Yahoo!, o a Bing, hay que entender primero cómo funcionan los motores de búsqueda. Como sabemos, existe una jerarquía en las respuestas que nos dan a partir de una consulta, por ejemplo, y para seguir en tema, "Titanic".

 

El buscador nos dice que la primera página es "la mejor" y la última "la peor". ¿El criterio? Tiene dos instancias: primero, el mejor sitio es el más reenviado por los sitios interesados en el Titanic. Segundo, esos sitios son los más enlazados por otros portales. Ante la imposibilidad de Google para analizar la calidad del contenido, esta segunda instancia es la más importante: mientras más enlaces conduzcan a un sitio que tienen en alguna parte un link acerca del Titanic, es como los motores de búsqueda obtienen el "mejor sitio" y el "peor sitio", siendo el peor el menos indexado de todos.

 

La Internet profunda es, justamente, una parte de Internet que ha quedado fuera de la telaraña de enlaces creada por los motores de búsqueda. Y aunque existe la posibilidad de que el autor de un sitio penetre al mundo de los buscadores, registrándose manualmente a través de un formulario.

 

Si no lo hace, ese sitio será invisible para los usuarios de Internet que no tengan la dirección o URL exacta. Y no solo eso; el lenguaje primordial de Internet es HTML, con lo que millones de datos en programación, imágenes, audio, vídeo, PDF o archivos comprimidos también quedan fuera Y así es como solo dejan ver a los motores de búsqueda tradicionales, una pequeña parte de todo lo que contiene Internet.

 

Dejando a un lado la analogía del iceberg (que solo sirve para explicar como está repartida la información dentro de Internet) retomemos un poco que pasa con los motores de búsqueda convencionales. 

 

Personalmente, me gusta comparar Internet con la siguiente analogía: Digamos que Google, Yahoo, Bing, Etc... Son enormes buques de pesca que si bien barren una buena parte de la superficie, no son capaces de llegar a las bastas profundidades de los mares digitales de la web.

 

Aquí es donde entran los navegadores como Tor los cuales pasan a ser nuestros submarinos, protegen de los peligros de las profundidades de estas aguas ocultando nuestra IP para que nadie pueda seguir nuestro rastro. Sin embargo, aún acechan otros peligros, no olvidemos a los piratas, Informáticos, Gobiernos 

 

 submarinos (Tor, p2p etc..)

 

Así pues, pasamos a ser una cantidad infinita de submarinos muy cercanos unos con otros, pero separados entre sí. Cada uno se comunica en su interior, pero ninguno se comunica con otro a excepción de ciertos canales en lo más profundo de la Web.

 

 

¿Qué hay en la Deep Web? 

Según un estudio (realizado en el año 2000), por la empresa Bright Planet, la Web Profunda es actualmente de 400 a 550 veces más grande que todo el contenido de la World Wide Web, (conocida también como Surface web o Web Superficial).  La Web Profunda contiene casi 550 mil millones de documentos individuales comparados a los 2500 millones de documentos de la Web Superficial, (esta última estimación fue realizada por Cyveillance).

 

Briht Planet afirma, además, que la web profunda (compuesta en su mayoría de información de acceso público y gratuito), crece a mayor velocidad, que la Web Superficial, ya que, tan solo en el 2001 (donde los sitios personales como blogs y similares no habían explotado del todo) la información que se podía encontrar en la Deep Web era 500 veces mayor que en la superficial, teniendo la primera unos 91.000 Terabytes contra 197 Terabytes en la Surface web.

 

Extrapolando los números de una manera más artesanal (no hay datos concretos actuales al respecto, debido a las propiedades que conforman la Web Profunda), el crecimiento ha sido sin lugar a dudas inmenso, aunque hay que reconocer que en 10 años los sistemas de rastreo y la educación al respecto evolucionaron mucho y gigas y gigas de información de la Deep Web ahora son visibles en la superficie, pero aún queda mucho por descubrir.

 

En cuanto a contenido, la Deep Web está compuesta por todo tipo de información, que al ser tanta y tan variada, la categorización se vuelve imprescindible. Si bien la información en la web profunda es muy abrumadora, no hay que tenerle miedo. En la mayoría de los casos, la información está ahí, y es lo que se decida hacer con ella: producir, almacenar, intercambiar, transferir. Sin embargo, la información puede (no en todos los casos) meternos en serios problemas legales que puede conducir a problemas y penas de prisión.

 

Es así que entre lo que no se ve en la superficie, tendremos archivos que no tengan formatos del tipo HTML o de texto (principal fracaso de los sitios web completamente desarrollados en Flash) así como algunos documentos multimedia que no se indexan. El contenido dinámico es abundante, así como los sitios privados o personales. Sin embargo, no es lo unico que comprende este contenido:

 

  • Catálogos de bibliotecas y bases de datos bibliográficas
  • Bases de datos no bibliográficas
  • Revistas electrónicas, en las que es necesario un registro previo y en las que solo se puede recuperar la información mediante la búsqueda manual en su base de datos
  • Documentos en formatos no indexables, como documentos en pdf, word...
  • Obras de referencia: enciclopedias, diccionarios... en las que es necesario interrogar a la base de datos para acceder al contenido.

 

 

¿Cómo se accede a la Deep Web?

 

Aquí es donde normalmente surge una confusión, pues la Deep Web no se refiere directamente a lo que se conocen como la Darknet o Dark web, pues como hemos visto, solo una parte de su populoso contenido refiere a sitios donde es necesario ingresar de manera anónima. O mejor dicho, conviene ingresar de manera anónima.

 

Pero piensa que no vas a poder manejarte en esta web tan fácil como lo hacías en la Superficie. No hay ningún motor de búsqueda (como Google). En cambio, hay una colección de Wikis y de BBS (Bulletin Board Systems, foros) que agregan links a otras ubicaciones en la Deep Web.

 

(Se recomienda ponerlos en favoritos porque es casi imposible volver a entrar allá).

Si la información ha sido de tu agrado compártela a través tus redes sociales.


Más información en este sitio