¿Has oído hablar alguna vez de la “internet profunda”? También conocido como internet invisible, web profunda o, por su término en inglés, deep web, la internet profunda es esa parte de internet que no está indexada por los buscadores y que es casi imposible rastrear (deliberadamente). Aquí van algunas preguntas y respuestas sobre esta parte tan peligrosa de internet.

¿Cómo es posible que esto exista? Utilizando el método llamado “proxyficación”, es decir, utilizar muchos proxys, no utilizando direcciones de internet sino códigos, utilizando el pseudodominio de nivel superior .onion, etc. Muchas son las técnicas para conseguir burlar a los motores de búsqueda.

¿Por qué los motores de búsqueda no pueden encontrar estas webs? Son muchos los motivos por los que Google, Yahoo, Bing, etc. no pueden llegar a indexar las webs de la internet profunda. Algunos de esos motivos son los siguientes: páginas que están protegidas con contraseñas, documentos que no están en formatos indexables, lugares en los que para acceder a la información hay que interrogar a la base de datos, páginas que el buscador simplemente decidió no indexar por decisión propia, páginas con mucho contenido multimedia y poco texto, archivos en formatos PostScript, Flash, Shockwave, .exe y archivos comprimidos, subdirectorios o bases de datos restringidas, etc.

¿Desde cuándo existe la web profunda? Básicamente desde que existe internet, aunque el término “web invisible” fue utilizado por primera vez en el año 1994 por Jill Ellsworth.

¿Es muy grande esta parte de internet? Grande no, ENORME. Aunque no se tienen datos exactos se calcula que aproximadamente el 95% de internet forma parte de esta web profunda, así que imagínalo…bueno no, porque se sale de nuestros límites de la imaginación. Se estima que en 2010 había 7.500 terabytes de información en ella (en el “internet normal” hay unos 19 terabytes, para que te hagas una idea).

¿En qué se diferencia de las “páginas normales”? Esas páginas normales forman parte del internet superficial y son páginas estáticas, siendo las otras páginas dinámicas. Las webs estáticas no dependen de una base de datos para mostrar su contenido, son archivos HTML que raramente cambian, y los cambios se realizan en el código y se carga en el servidor. Las webs de la internet profunda, en cambio, presentan un formato cifrado especial pero desde el que se puede acceder conociendo la URL exacta.

¿Se está avanzando en este campo? Sí, las “arañas” encargadas de hacer las búsquedas por internet para mostrar los resultados en los buscadores eran incapaces de leer páginas que no estén creadas en HTML, aunque en la actualidad esto ha cambiado. Aun así se estima que sólo el 16% de la web profunda se ha descubierto gracias a este avance.

¿Qué hay en esta cara oculta de internet? No todo el contenido de estas webs es ilegal, también se utiliza para compartir documentos con información confidencial entre gobiernos, por ejemplo. Pero no nos engañemos, la web profunda es un lugar idílico para delincuentes y criminales, de hecho gran parte de lo que se vende son drogas (cannabis, MDMA, LSD, setas, heroína…), productos farmacéuticos ilegales, pasaportes ilegales, servicios de sicarios y desgraciadamente, contenido pedófilo y torturas reales. Es  como una ciudad sin ley.

Navegar por esta parte oscura de internet puede llegar a ser MUY PELIGROSO: infección de tu PC, identificación de tus datos personales por parte de personas despiadadas, seguimiento de tu rastro por servicios de espionaje, etc. Lo mejor que puedes hacer es olvidarte de ella. 

08-07-2015