Inicio
 > Informes e investigaciones > Blog de TEC > Los datos masivos requieren medidas masivas

Los datos masivos requieren medidas masivas

Escrito por: Jorge Garcia
Publicado: noviembre 10 2010

Del Arte de la guerra de Sun Tzu:

"En las operaciones de guerra, donde tenemos en un campo mil carruajes rápidos, y otros tantos pesados, y cien mil soldados vestidos de armadura, con suficientes provisiones para llevarlos hasta mil Li, los gastos en el hogar y en el frente, incluyendo el entretenimiento de los invitados, pequeños artículos como pegante y pintura, y las sumas invertidas en los carruajes y las armadura, alcanzarán la suma total de mil onzas de plata al día Tal es el costo de tener una armada de 100.000 hombres."

De la anterior citación es evidente que el costo de la guerra era muy alto incluso en tiempos antiguos. No es una sorpresa que la presente guerra por ganar presencia en el almacenamiento de datos y gestión de información, no es de ninguna forma un asunto barato. En el mundo corporativo, la explosión de la información ha dificultado la recolección, limpieza, almacenamiento y análisis de tales volúmenes de información por parte de las empresas. Ello no solo tiene que ver con la cantidad, pero además con la cantidad de fuentes, los requisitos de calidad y la velocidad con la cual la información es generada.

La cantidad de información que generan las empresas sigue creciendo a un ritmo constante y la complejidad del análisis de la información reside no solo en su volumen, pero también en la forma en la cual debe ser procesado. Los datos pueden procesarse para realizar un informe ejecutivo simple o para realizar minería compleja de datos para detectar fraudes.

Otro factor que magnifica la complejidad es que la cultura de la mayoría de las empresas está cambiando: Los procesos de análisis de datos tradicionales a traspasado las áreas normales de análisis empresarial para llegar a los ejecutivos y a la asamblea de consejeros, así como a las áreas operativas de la organización y la posibilidad de que todos en la organización puedan agregar y promover el análisis de datos.

Hoy en día, muchos usuarios finales están explorando y analizando información sin percatarse de ello. Adicionalmente, esta generación de datos en crecimiento dentro del mundo corporativo, ha llegado a tal punto que, gran parte del análisis tiene lugar al momento de la captura de la información o con un pequeñísimo retraso, ello significa que el análisis en tiempo real ha llegado.

El juego del reposicionamiento

Cuando las empresas se percataron de que sus implementaciones tradicionales para el almacenamiento de datos no eran suficientes para resolver sus problemas de análisis, fijaron su atención hacia soluciones más avanzadas que les pudieran dar la oportunidad de continuar mejorando sus procesos de análisis. En la actualidad, los espacios de almacenamiento de datos y el análisis de "grandes datos" están cambiando su composición, ya que algunas empresas de software en esta área están tratando de reposicionar su presencia en el mercado. Directa o indirectamente, casi todas las principales empresas de software en esta área realizaron costosos ajustes en los últimos dos años, para re-orientar y reforzar sus estrategias de posicionamiento en el mercado del almacenamiento y análisis de grandes cantidades de datos. Un rápido vistazo a los eventos recientes:

EMC y Greenplum

En el área del almacenamiento de datos e inteligencia empresarial (BI, por sus siglas en inglés), la adquisición de Greenplum por parte de la empresa de gestión de información EMC empezó a sonar las campanas de guerra en esta área. Con esta adquisición, EMC desveló una estrategia para asignarse así mismo una buena posición en un mercado maduro, pero aún en crecimiento. Mientras las grandes empresas requieren cada vez más las herramientas para analizar enormes cantidades de datos rápida y precisamente, los proveedores de software advirtieron que esta área del mercado de software aún tiene un fuerte potencial para el desarrollo. EMC está utilizando las bases de datos de Greenplum para posicionarse así mismo dentro del juego del almacenamiento de datos.

SAP y Sybase

Ciertamente, dos cosas importantes cuando SAP decidió adquirir Sybase en una transacción cercana a $5.8 billones de dólares americanos para la movilidad y el poder de análisis. Con esta adquisición, SAP empezó a reforzar su estrategia en cuanto a las tecnologías de análisis en-memoria y soluciones móviles empresariales. Los servidores analíticos de Sybase (Sybase IQ) pueden entregar soluciones de gran velocidad y ayudar a SAP a completar su ciclo de información BI con ventajas competitivas. La movilidad será una parte importante de la próxima generación de aplicaciones analíticas de SAP.

IBM y Neteeza

El 20 de septiembre del presente año, IBM (el gigante azul), anunció que estaba a punto de comprar Netezza, una empresa radicada en Marlborough, Massachusetts. En una transacción en efectivo por 1.7 billones de dólares americanos, IBM realizó un gran paso para establecerse como uno de los grandes jugadores dentro del campo de "grandes datos." Netezza tiene una posición privilegiada en las áreas de almacenamiento y análisis de datos, e IBM será capaz de aprovechar este liderazgo y su asociación pre-existente para lograr una mayor presencia en el mercado. A pesar de las grandes cantidades de dinero involucradas en la transacción, esta fusión le dará la oportunidad a IBM de adquirir indirectamente clientes tan importantes como eHarmony, Neiman Marcus y Time Warner entre otros. Esta fusión nos indica que el mercado de "grandes datos" está bien consolidado como para atraer la atención de casi todos los principales proveedores de software y animarlos a invertir en su desarrollo.

Oracle, the Sun y Exadata

Hasta la fecha, aún estamos viendo los efectos de la adquisición de Sun por Oracle. Además de muchos otros aspectos en esta fusión, aquel relacionado con el almacenamiento de datos, nos llama fácilmente la atención. Con la introducción de su Exadata Database Machine X2-8, Oracle se establece así mismo en la línea de competencia del segmento de "grandes datos." Una de las estrategias de Oracle es la de proveer soluciones de almacenamiento de datos especificas para una industria con su Oracle Exadata intelligent Warehouse solutions y satisfacer requisitos únicos de ciertas industrias. Con funcionalidades como la escalabilidad, la eficiencia energética en el rendimiento, Oracle intenta mantener su ritmo y liderazgo junto con otros proveedores en el mercado. Sin embargo, la pregunta sigue siendo: ¿Estará Oracle planeando la adquisición de un almacén de "grandes datos" en el corto plazo?

Microsoft y SQLServer

Microsoft confía en el lanzamiento de SQLServer 2008 R2 Parallel Data Warehouse, el cual contiene adiciones específicas para las tares del almacenamiento de datos, para ganar presencia en este mercado. Con este lanzamiento, Microsoft pretende entregar un producto con habilidades paralelas masivas (massive parallel capabilities, MPP) y funcionalidad para alta escalabilidad para poder competir en el espacio de análisis de grandes datos. La mayoría de las empresas que están trabajando con SQLServer pueden desplegar esta nueva versión para obtener todas las nuevas funcionalidades y características. Además, en asociación con HP e IBM, SQLServer puede entregarse como una herramienta completa de almacenamiento de datos combinando toda la arquitectura de hardware y software necesaria para lograr un proceso de despliegue rápido. Con el nuevo lanzamiento, Microsoft puede abordar el enorme mercado potencial de las plataformas y bases de datos de Microsoft que ya han sido instalados para poder expandirse en el segmento de los almacenes de datos.

Teradata y SAS

Algo que puede funcionar en el espacio de grandes datos para las empresas de software es crear asociaciones para añadir valor a sus ofertas, en este caso para los gigantes de la información, uno en el espacio del almacén de datos y el otro en el espacio de BI; por medio de la combinación de esfuerzos, para entregar una solución capaz de correr las habilidades analíticas de SAS bajo la forma de procesamiento en paralelo de la infraestructura del almacén de Teradata. Uno de los retos más interesantes con asociaciones como esta, es entregar un producto lo suficientemente integrado para que dicha combinación sea realmente transparente para el usuario final. La combinación de Teradata y SAS pretende proveer una integración real de las habilidades del almacén de datos con la tecnología de vanguardia en las funciones analíticas de BI.

La furia de la guerra recae sobre

Una última reflexión, vale la pena mencionar que la guerra de los grandes datos está lejos de concluir. La gestión de datos para las grandes empresas puede ser muy compleja y puede involucrar un gran número de problemas específicos que este tipo de productos deben solucionar de manera óptima. Las empresas de software intentan satisfacer este tipo de necesidad para poder agregar valor real en el área de la gestión de grandes volúmenes de datos. Este valor se puede reflejar en el rendimiento, facilidad de uso, integración con otras aplicaciones corporativas, así como otros factores importantes. La velocidad del proceso puede ser de gran importancia pero existen otras consideraciones que igualmente pueden ser muy importantes, teniendo en cuenta que la decisión de adquirir un almacén de datos y una base de datos analítica involucra no solo los factores técnicos, pero el cumplimiento con los criterios empresariales.

Además de esta fiebre de gasto, muchas otras cosas está sucediendo en el espacio del almacenamiento de datos, como la adopción de soluciones de bases de datos poco convencionales como Nosql y distributed databases, así como la adopción de tecnologías especiales como in-memory analysis o column oriented databases. Existen otros temas que debemos incluir en futuros escritos relacionados con el universo de los grandes datos. Para las grandes empresas, el análisis de grandes datos es y seguirá siendo una parte esencial de su composición orgánica que les permita mejorar su proceso de toma de decisiones.

Como Sun Tsu pudiese decir en cuanto a las operaciones de guerra en el área del almacenamiento de datos, el gasto de grandes cantidades de dinero está justificado simplemente por el enorme potencial de negocios en l el área, entonces ellos seguirán invirtiendo en "pegante y pintura" y en "carruajes y armaduras" para proveer lo que la industria requiere en términos del análisis y gestión de grandes volúmenes de datos.

 
comments powered by Disqus

Búsquedas recientes:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Others