Revista Comunicación

Google, Yahoo, etc…. “de la Misa el 4%”

Publicado el 11 enero 2014 por Albert Perez Novell

Estamos convencidos que tenemos acceso a toda la información mediante el uso de Google y otros buscadores y no es así, por mucho. Los estudios demuestran que sólo accedemos al 4% de la información disponible en la red.
Buscar en el Internet hoy en día se puede comparar con una red de arrastre a través de la superficie del océano. Mientras que una gran cantidad de información se pierde porque navega en aguas más profundas. 
La razón es simple: la mayoría de la información de la Web está enterrada en sitios muy ocultos, Bases de datos encriptadas, sites muy dificiles de localizar y que los motores de búsqueda estándar nunca encuentran.
Google, Yahoo, etc…. “de la Misa el 4%”. Deep Web
En este post he recopilado lo que se dice por la red sobre este tema:
Según un artículo de Wikipedia“En el año2000se estimabaque el tamaño delInternet Profundoera de 7.500Terabytesde datos en unos 550.000 millones de documentos.Para comparar se estima que en aquella época laInternet superficialocupaba 167 Terabytes y el contenido de laBiblioteca del Congreso de Estados Unidostenía unos 3.000 Terabytes que no eran accesibles por los motores de búsqueda.Estimaciones basadas en laextrapolaciónde un estudio de laUniversidad de California en Berkeleyespecula que actualmente elInternet Profundodebe tener unos 91.000 TeraBytes.Aproximadamente el 96% de toda la información que existe en Internet está sin indexar por ningún buscador. Los algoritmos usado por los buscadores, Google y todos los demás, no son perfectos, además del hecho de que existen bases de datos y páginas dinámicas, que limitan su capacidad de indexación. No pueden indexar toda la información y además es imposible hacerlo. Lo más importante de la Internet Profunda es que en su mayor parte está constituida por bases de datos muy especializadas con contenidos de alta calidad y en muchos casos para acceder a las más  profundas fosas Dark, los navegadores o browsersque usamos (Firefox, Chrome, IE, etc )  no están diseñados para permitir el acceso a este tipo de urls, que suelen contener información financiera o directamente delictiva.Deep Web versus Dark WebBucear en la Web oscura ( Dark Web) es como ir a un inframundo donde encuentrasdocumentos confidenciales (  Wikileaks, documentos de estado, casos de ovnis, experimentación humana, etc) - Mercado negro (armas, drogas, etc) -  Servicios de hacking. - Mucha piratería. - Videos, imagenes y documentos baneados de la web normal.-  Contratación de sicarios, asesinos, espías, etc.-  Tráfico de organos, animales, personas.- Pedofilia, necrofilia , etc .. Pero para esto debes tener toda la intención del mundo en entrar, no es fácil. Para entrar necesitas programas que garantizen tu anonimato proporcionandote una IP falsa como es TOR

VIAJE AL INFIERNO DARK
Existen niveles:

Google, Yahoo, etc…. “de la Misa el 4%”. Deep Web
NIVEL 1. En este nivel encontramos páginas independientes, foros de todo tipo y páginas pornográficas.NIVEL 2. Aquí abundan los buscadores de información independientes como emule o ares además de encontrarnos con contenido visual de moral laxa.NIVEL 3 En el nivel 3 encontramos información y servicios de lo más macabros: prostitución y pornografía infantil, mercado de armas y drogas duras, contratación de asesinos a sueldo, canibalismo, mutilación genital, etc…NIVEL 4. Aquí abundan los hackers informáticos. No me refiero a simples aficionados que se dedican a infectar PC’s, sinó a auténticos piratas informáticos.NIVEL 5. En este nivel se encuentran los secretos militares NIVEL 6. Es un nivel solo apto para los hackers mejor preparados. Aquí se encuentra la DataBase. Es una sección en la que toda la información de DarkWeb deja ser un código binario en 0 y 1Si, en las profundidades de la Dark web se puede encontrar de todo, especialmente el lado más oscuro de la mente humana y perversa, En la Deep Web  hay cosas buenas, como la investigación científica y tecnológica, las bibliotecas digitales, bases de datos, material de las universidades, informes de estudios científicos recientes etcEn la Deep WEB hay de todo, como en botica, pero abundan contenidos de alta calidad, en esta línea adjunto una serie de enlaces muy interesantesEs de destacar el proyecto BrightPlanet que utiliza una tecnología orientada al aprovechamiento de la Web profunda llevando sus resultados a la superficie, así como el Libro Blanco de la Internet Profundapublicado hace años en JEP The Journal off electronic publishing

¿Como bucear en esta Deep Web y no ahogarse? Adjunto una serie de herramientas que ha publicado Ramon Archanco, sobre una Internet no tan visible, aunque no oculta.Recursos científicos de la Internet profunda o Internet invisibleLa web del conocimiento:es una de las mayores bases de datos de citas del mundo con mas de 54 millones de registrosElseiver: es un repositorio con mas de 2000 revistas de medicina y saludScience Direct: más de 2.500 revistas científicas y más de 11.000 librosPubmed:es el motor de búsqueda de medline. Contiene mas de 22 millones de documentos de investigación en biomedicinaIngenta: contiene revistas de mas de 12.000 publicacionesUs PTO: es un buscador de patentes y marcas de Estados Unidos de AméricaEspacenet: es un buscador de patentes de los países EuropeosLatipat: Bajo la plataforma de espacenet agrega resultados de patentes de países de Latinoamérica, España y Portugal
Recursos estadísticos de la Internet profunda o Internet invisibleEurostat: fuente estadística de todos los países europeosUsa.gov: fuente estadística de EEUU.Recursos sobre datos financieros de la Internet profunda o Internet invisibleBureau Van Dijk: bases de datos de los registros mercantiles de paises de la OCDEDuns and Bradstreet: informes financieros de todas las empresas del mundoe-informa y Axesor: datos financieros de empresas españolas y listados de marketing.Recursos de comercio internacional de la Internet profunda o Internet invisibleComtrade: base de datos de la ONU sobre datos de import-export y códigos HSCameradata: base de datos española sobre los daos de importación y exportaciónMarket access database: datos sobre tarifas arancelarias en los distintos países de destino a las exportacionesOrganización mundial de comercio: recoge informaciones legales sobre el comercio internacional.Recursos sobre legislación de la Internet profunda o Internet invisibleEurolex:incluye toda la información legal y disposiciones sobre la legislación y tratados europeosFDA:es la agencia de alimentación de EEUU aqui puedes encontrar todas las regulaciones acerca de pesticidas, conservantes y aditivos autorizados.De hecho siempre aparecen nuevas herramientas odirectorios de acceso a la web profundaque tardan en llegar al dominio público.     Otros recursos de la web invisibleAquí deberíamos hablar de varias herramientas como:Complete planet:Una herramienta que lleva ya muchos años considerándose una de las puertas de acceso principal a la Internet profunda. Este es un directorio con mas de 70.000 bases de datos y recursosInfomine:un recurso de la universidad de california que cuenta con mas de 100.000 enlaces a otras bases de datosScirus:es un metabuscador científico especializado en institutos y universidades de investigación.Gran parte de los recursos auditados de la web profunda provienen de bibliotecas y centros de investigación universitarios y que por lo tanto la información es de gran calidad y valor para la comunidad científica y de investigación.Aunque también, como hemos visto, podemos encontrar recursos valiosos para la empresa. A parte de estos tres recursos puedes echar un vistazo a esta breverecopilación de Ernesto Marrero de puertas de entrada a la Internet profunda.También te recomiendo que utilices OJOSE para lanzar una búsqueda simultanea en varios de estos servicios.


Volver a la Portada de Logo Paperblog