El Gray Data y la Inteligencia de los Negocios

architecture-trinity

La Business Intelligence (BI) o Inteligencia de los Negocios es hoy día una necesidad en la estrategia, táctica y operativa de las empresas para la correcta toma de decisiones en los niveles de alta gerencia en lo estratégico, para la media gerencia y analistas en lo táctico y para todo tipo de personal en las decisiones operativas.

El concepto de Gray Data se refiere a datos que provienen de distintas fuentes, con diferentes formatos; es un tanto ambiguo y se refiere a una especie de globalización de datos de todo tipo y condición que sean utilizables en algún sentido, pero ya hay quien lo ve como una tendencia futura para el Business Inteligence en las empresas.

Pero si satisfacer esta necesidad es ineludible en la gestión e interpretación de los datos de la empresa, surge ya un nuevo concepto denominado Big Data o conjuntos de datos tan grandes que resulta dificil explotarlos con las herramientas habituales de manejo de bases de datos.

Este concepto abarca no solo los datos de la empresa, ya sean actuales o históricos, sino que comprende todo tipo de datos externos que podamos aplicar a nuestros fines.

Entre ellos están los Open Data, bases de datos libres inmensas tanto en su contenido como en su procedencia y que son susceptibles tanto de ser usadas como completadas y aumentadas. Un ejemplo de estos es la página del gobierno USA de datos públicos libres.

En Europa también existen bases de datos públicas, y curiosamente entre las pioneras algunas iniciativas españolas.

La forma de atacar esta gran cantidad de datos informáticamente es el uso de herramientas y aplicaciones que utilizan algoritmos que tratan los datos de forma paralela como Map Reduce.

Entre los múltiples proyectos que puede tener en marcha un gigante como Microsoft relacionados con Big Data, hay que destacar uno de ellos por su objetivo: compilar una cantidad masiva de datos estructurados que puedan ser utilizados como base de aplicaciones de inteligencia artificial.

Se llama Probase y es, según la definición de Microsoft Research, “un proyecto en marcha que se centra en adquirir conocimiento y servir conocimiento”. Su objetivo principal es “permitir que las máquinas entiendan el comportamiento y la comunicación humana”. Se nutre de una nueva base de datos orientada a grafos llamada Trinity.

En un informe publicado por PricewaterhouseCoopers se comentan algunas de las tecnologías emergentes, de bajo costo, como Hadoop , MongoDB y otras.

1 Comment

  1. Pingback: Custodia Digital Masiva, una de las caras de Big Data. « Todo es electrónico

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>
*
*