En el transcurso de tu vida seguramente te has encontrado con colecciones muy grandes de datos e información. Por ejemplo una enciclopedia, los tomos que conforman la jurisprudencia legal o cosas por el estilo. Pero ¿Cuáles son las bases de datos más grandes del mundo?

Antes de hablar de las bases de datos, demos un poco de contexto. Especialmente para darnos cuenta de las magnitudes de las que estamos hablando. La siguiente tabla es una aproximación:

bases de datos

World Data Centre for Climate

Es la número uno con una base de 220 terabytes de datos. Se trata del World Data Centre for Climate (WDCC) que en nuestro idioma sería el Centro Mundial de Datos sobre el Clima.

bases de datos

El WDCC, operado por el Instituto Max Planck de Meteorología y German Climate Computing Centre, también es propietario de una supercomputadora cuyo costo es, nada más y nada menos, que € 35.000.000.

Excluyendo los 220 terabytes, que son accesibles a través de la web; el WDCC también tiene 110 terabytes de datos adicionales que se utilizan principalmente para la simulación del clima y 6 petabytes de datos adicionales de que están almacenados en cintas magnéticas para facilitar el acceso.

National Energy Research Scientific computing Center

El National Energy Research Scientific Computing Center (NERSC), con base en Oakland, California, tiene una única clase de base de datos en la que nadie puede pensar. En efecto, se trata de un “mamut” de 2,8 petabytes de información que varía desde investigaciones sobre energía atómica hasta simulaciones de cómo fueron los primeros minutos del universo. El NERSC, cuyos propietarios y operadores son el Laboratorio Nacional Lawrence Berkeley y el Departamento de energía de los Estados Unidos de América, posee la segunda base de datos más grande en el mundo. Su mantenimiento está a cargo de 2.000 científicos de datos.

AT&T

Es una de las más antiguas empresas de telecomunicaciones, con sede estadounidense. La compañía cuenta de que tienen el mayor volumen de datos en una base de datos única.

AT&T también tiene una de las bases de datos más grande con mayor número de filas: alrededor de 1,9 trillones. Se dice que AT&T ha estado grabando los detalles de las personas que llaman mucho antes de que la palabra terabytes existiera.

Google

El gigante de Internet ocupa el 4to lugar en el ránking de grandes bases de datos. Aunque el tamaño exacto de la base de datos de Google es desconocida, se dice que la cuenta de Google de cada búsqueda única que se por día en su base de datos, es de alrededor de 91 millones de búsquedas por día.

Google almacena todas las búsquedas y elabora patrones de búsquedas de modo que el usuario puede dirigirse fácilmente hacia el contenido de su interés. Google también puede recabar información de sus usuarios y los almacena como entradas en su base de datos que, se dice, son más de 33 billones entradas.

Además Google ha ampliado su base de datos con Gmail, con las publicidades Google Adwords y con sus adquisiciones como YouTube.

Sprint

Es uno de los mayores proveedores de telecomunicaciones y con su base de datos inmensa y creciente ocupa el 5to. lugar en el ránking de las 10 más grandes. Con sus servicios móviles brinda cobertura a alrededor de 53 millones de suscriptores.

Sprint ofrece propuestas de líneas de tierras locales y larga distancia. Se dice que los registros de base de datos de Sprint consisten en detalles de más de 365 millones de llamadas por día.
Sprint es también orgulloso propietario de la base de datos con mayor número de inserciones. De acuerdo con informes se trata de más de 2,85 trillones de filas. Durante las horas pico, esta base de datos registra alrededor de 70.000 llamadas por segundo.

LexisNexis

Si la empresa LexisNexis no te es familiar, entonces darás un salto en tu silla cuando te enteres del tamaño de su base de datos. A propósito el origen de esa base es la empresa ChoicePoint que fue comprada por LexisNexis.

Esta extensa base de datos contiene información sobre aproximadamente 250 millones de personas de la población estadounidense. La información varía desde direcciones, números de teléfono, registros de conducir, antecedentes penales e incluso los datos de ADN. Se cree que LexisNexis tiene cerca de 250 terabytes de datos personales.

Youtube

La mayor biblioteca-video en línea YouTube es nuestro candidato número 7 en los 10 mayores bases de datos en todo el mundo.

YouTube cuenta con más de mil millones de usuarios (casi un tercio de las personas conectadas a Internet), que miran cientos de millones de horas de videos en YouTube y generan miles de millones de vistas todos los días. La cantidad de personas que mira YouTube por día aumenta en un 40% por año desde marzo de 2014.

Hasta marzo de 2015, los creadores que grabaron en los Estudios YouTube produjeron más de 10,000 videos, que generaron más de mil millones de vistas y más de setenta millones de horas de reproducción. Se suben a YouTube.

En 2006, es decir hace 10 años, , el Wall Street Journal informó que la base de datos de YouTube cuenta con alrededor de 45 terabytes de datos. Esta cifra no va a sonar como un gran número, pero si tenemos en cuenta en cada minuto se suben más de 100 horas de vídeo, es decir, más de cuatro días de grabaciones de vídeo al minuto, es suficiente para pensar en la base de datos que ahora están teniendo.

Amazon

Con 59 millones de clientes activos y más de 42 terabytes de datos, Amazón es la 8 va. base de datos entre las 10 mayores.

La tienda al por menor más grande del mundo, tiene una enorme colección de datos que incluye información general como el número de teléfono, dirección de recibos , listas de regalo y cualquier tipo de información que el sitio web se puede extraer de sus usuarios, que han iniciado sesión.

Se dice que Amazon tiene una colección masiva de 250.000 libros de texto completo que están disponibles en línea. No es de extrañar sea considerada como la comunidad en línea más grande del mundo ya que los usuarios pueden interactuar y comentar prácticamente en todas las páginas de este website.

Central Intelligence Agency (CIA)

Quién no ha oído hablar de la CIA, la central de inteligencia de los Estados Unidos de América.

Aunque el tamaño exacto de la base de datos aún no se han revelado, se cree que la CIA tiene una enorme base, ya que han estado recolectando información procedente de los sectores privados y públicos.

Partes de esta información está disponible al público a través de la Sala de Lectura Electrónica y del World Fact Book.

El Factbook ofrece información sobre la historia, la gente, gobierno, economía, energía, geografía, comunicaciones, transporte, militares y cuestiones transnacionales para 267 países del mundo.

La Ley de Libertad de Información o FOIA, siglas del inglés Freedom of Information Act items, es la que le da el derecho a acceder a la información del gobierno federal. Se describe a menudo como la ley que mantiene a los ciudadanos en el conocimiento sobre su gobierno. Los informes dicen que cada mes se añaden el 100 documentos FOIA, junto con estadísticas de más de 250 países y de sus entidades. Incluye la información que va desde desarrollos nucleares al tipo de cerveza que se utilizó durante la Guerra de Corea.

Biblioteca del Congreso de los Estados Unidos

Biblioteca del Congreso de Estados Unidos se encuentra en el 10mo. lugar de la lista de las 10 bases de datos más grandes del mundo.

Es una de las mayores bibliotecas del mundo, con más de 158 millones de documentos. La colección de la Biblioteca del Congreso incluye más de 36,8 millones de libros en 470 idiomas, más de 68 millones de manuscritos y la colección más grande de libros raros y valiosos, incluyendo una de las únicas cuatro copias en perfecto estado de la Biblia de Gutenberg, y el borrador de la Declaración de Independencia.

Además, guarda más de un millón de publicaciones del gobierno de los Estados Unidos, un millón de números de periódicos de diferentes partes del mundo, de los últimos tres siglos, 500.000 rollos de microfilm, 6.000 títulos de cómics, la colección más grande de documentos legales, películas, cerca de 5 millones de mapas, partituras, 2,7 millones de grabaciones sonoras, canciones y más de 13,7 millones de grabados y copias fotográficas. El documento más antiguo es una tablilla de piedra del año 2040 a.c.

También alberga obras de arte, dibujos arquitectónicos, y valiosos instrumentos como el Stradivarius Betts y el Stradivarius Cassavetti.

Se dice que la Biblioteca posee textos almacenados en 20 terabytes de datos. Con una tasa de expansión de 10.000 incorporaciones por día, si se colocaran las estanterías de la Biblioteca una junto a otra, ocuparían 853 kilómetros. La Biblioteca del Congreso es el lugar ideal para la información de que no se encuentran en el Internet.

Fuentes: Pandiba, Siliconindia News.

Traducido y adaptado por la División Consultoría de EvaluandoSoftware.com