Empresa Comstor, unidad de negocio de Westcon-Comstor mayorista de tecnología Cisco, da a conocer los 16 términos más importantes del Big Data que todo profesional de TI, y por qué no, de marketing, debe conocer.
- Algoritmo: Secuencia lógica, finita y con instrucciones que forman una fórmula matemática o estadística para realizar el análisis de datos.
- Analytics: Es la forma de capturar informaciones, procesarlas y analizarlas para que se conviertan en insights.
- BI (Business Inteligence): Es el método que transforma informaciones almacenadas y analizadas en datos que son estratégicos para una empresa y que se convierten en ganancia para el negocio.
- Data Scientist: Es el analista de datos. La persona que capturará los insights, las principales informaciones dentro de un gran volumen de información.
- Small Data: Mucho más pequeño que el Big Data, se refiere al análisis que se hace con pocas fuentes de datos.
- Datos estructurados y no estructurados: Los estructurados tienen una organización lógica, pero con posibilidades pequeñas de extracción de informaciones para el Big Data.
Por otro lado, los no estructurados son desorganizados, como los mensajes en emails y redes sociales, pero permiten una gran posibilidad de extracción de insights comerciales. - Dark Data: Se refiere a datos desconocidos que pueden perderse o almacenarse, sin la posibilidad de accederse o analizarse en caso de que el sistema no esté configurado para eso.
- Data Cleansing: Es el método que mantiene los bancos de datos libres de informaciones inconsistentes o irrelevantes.
- Data Lake: Es un lago de datos en el cual se almacenan informaciones en su estado natural y en gran volumen, es allí donde el Data Scientist debe sumergirse para encontrar sus principales insights.
- Data Mining: Es el proceso previo al Analytics, es la minería de los datos, la forma de descubrir informaciones relevantes.
- Dirty Data: Son los registros que no se han limpiado. Datos que se capturaron, almacenaron y que se usarán, pero que precisan ser primeramente trabajados.
- Fast Data: Los datos rápidos son los que pierden valor a lo largo del tiempo y que, por eso, necesitan ser analizados prácticamente en tiempo real para que generen respuestas estratégicas para las empresas que necesitan dar respuestas y tomar decisiones de forma instantánea.
- Slow Data: Es lo opuesto de Fast Data y hace referencia a las informaciones que se pueden capturar en el Data Lake para un análisis posterior. Esos datos no necesitan un análisis en tiempo real, con tiempo de respuesta menor.
- Medium Data: Término que define una cantidad intermediaria de datos que son necesarios para que se generen análisis e insights. Es un tamaño menor de información que el generado por el Big Data.
- Predictive Analytics: El análisis predictivo es la utilización de datos para predecir tendencias o eventos futuros.
- Sentiment Analysis: El análisis de sentimiento son técnicas usadas para identificar el sentimiento de un individuo sobre determinada cuestión.
Así como estos, hay muchos más términos que surgen a cada momento, muchas veces creados por proveedores de herramientas y analistas de consultorías para intentar ofrecer un nuevo servicio. Generalmente son funciones que ya existen y que quien trabaja con Big Data ya está acostumbrado, pero con un nuevo nombre o definición.
Comentarios