Accueil
 > Rapports de TEC > Blogue de TEC > SAP HANA-One Technology à surveiller en 2012 (et au-delà)

SAP HANA-One Technology à surveiller en 2012 (et au-delà)

Écrit par : Predrag Jakovljevic
Date de publication : juillet 18 2013

La troisième semaine de Décembre 2011 a été la semaine de mes révélations de toutes sortes dans le domaine des applications d'entreprise. Dans tout ce que la technologie de l'information interminable (IT) parler tout au long de l'année sur le cloud computing, l'analyse, les applications mobiles et sociales, et de mots à la mode en mémoire, deux annonces concrètes lors des événements de fournisseurs à la mi-Décembre faite moi réfléchir. Bien que les deux annonces des vendeurs sont encore un peu de temps loin de l'application commerciale, leur nature visionnaire impressionné l'analyste généralement sceptique en moi (au point d'être accusé de "Boire le Kool-Aid").

En plus de l'annonce de UNIT4 's à venir Analytics App Store (voir le post de blog lié), une autre révélation est venue à environ SAP ' s Influenceurs Sommet 2011 à Boston, où j'ai appris que le très médiatisé SAP HANA offre n'est pas seulement un appareil de serveur lame en mémoire pour l'analyse et les données rapides calculs. En fait, j'ai ressenti une sorte de frustration par les porte-parole de SAP à l'événement parce que la plupart des participants (autres que les «SAP Mentors" privilégiés et éclairé et SAP initiés élite) pensaient encore de HANA comme seul un en mémoire et extrêmement rapide des données croquer appareil. Le simple vitesse de traitement est très bien, mais le point que SAP tente de faire est de créer des applications intelligentes qui «pensent» pour le compte de l'utilisateur, grâce à l'aide de outils tels que la recherche d'entreprise, l'analyse de texte, d'analyse prédictive, le traitement des flux d'événements , etc En d'autres termes, un système de planification des ressources d'entreprise HANA-soutenue (ERP) devrait produire seulement pertinent info (filtrée) pour chaque utilisateur.

En un mot, tout d'abord, SAP HANA permettra aux entreprises d'analyser de grands volumes de données opérationnelles et transactionnelles détaillées en temps réel, à partir de pratiquement n'importe quelle source de données. À long terme, cependant, avec cette plate-forme, SAP va renouveler ses applications existantes et d'offrir une toute nouvelle classe d'applications qui va changer la façon dont les gens pensent, le travail, la planification et l'exploitation.

HANA: Nouvelle architecture de Hasso pour SAP (et au-delà) Eh bien, je ne suis ni un "techno" (toujours été et sera un analyste dite fonctionnelle) ni une commercialisation expert. Pourtant, si le nom d'un produit signifie "High-Performance application analytique», est-il une surprise si les gens ordinaires associent avec des appareils d'analyse à grande vitesse par défaut? En fait, la plupart des premiers produits basés sur HANA disponibles sont des "accélérateurs" soi-disant ou «analyse rapide» pour ceci ou cela. Encore une fois, sauf si vous êtes un initié SAP, pourquoi voudriez-vous pensez de HANA comme étant un «système d'enregistrement et de stockage des données de base" à part entière, c'est à dire, une base de données à des fins générales de l'avenir?

Pour cette raison, j'ai d'abord confondu HANA avec les offres de SAP qui ont été vantés par Hasso Plattner (SAP du célèbre co-fondateur et l'actuel président du conseil de surveillance de SAP AG) il ya quelques années. Je parle ici de SAP BusinessObjects (BO) Explorer et SAP Business Warehouse (BW) Accelerator (voir la série de billet de blog lié à partir de 2009).

Eh bien, maintenant je sais que SAP BO Explorer est un outil de création de InfoCubes , et pour plus de la modélisation et de manipulation (dans le jargon de SAP, un InfoCube est un cube OLAP, ou un ensemble de tables relationnelles disposés selon un schéma en étoile, où une grande table de faits dans le milieu est entouré de plusieurs tables de dimension). SAP BW Accelerator est un serveur lame qui est optimisé pour l'indexation et la recherche rapide. Les deux produits peuvent désormais fonctionner au-dessus de HANA. Confus et assez dépassés?

HANA: A Universal Database (Future)

La différence entre traitement analytique en ligne (OLAP) et traitement transactionnel en ligne (OLTP) est non seulement dans leur utilisation, mais aussi dans la façon dont les données sont organisées. OLAP est approprié pour les types de données non volatiles, à savoir, le reporting et l'analyse historique des données qui sont stockées dans les entrepôts de données (et rafraîchie périodiquement), tandis que OLTP est pour les systèmes hautement volatile (en constante évolution) transactionnels. Bien que les deux OLAP et OLTP peuvent être utilisés universellement, en théorie au moins, il ya des différences apparentes dans leur vitesse de traitement et la proximité en temps réel.

La principale différence est dans l'organisation des données, c'est à dire, des tables de base de données et de leurs relations. En bases de données relationnelles , normalisation se réfère à une seule entité décrivant un seul événement du monde réel, et vice versa. En revanche, l'organisation des données OLAP ne tient pas compte des théories de la normalisation, et les données sont plutôt conservés dans la soi-disant en étoile ou flocon de neige schéma. De cette façon, une central (aka, intérieure ou fait ) table contient les clés primaires pour tous les autres externe ou dimension tables, par lequel une entité peut décrire plusieurs événements du monde réel et / ou des notions.

Techniquement, un analytique View ou cube OLAP est un ensemble de tables physiques interconnectés dans un schéma en étoile. Seul le tableau d'information fournit les informations que l'utilisateur est réellement intéressé po Les faits, aussi appelé mesures, des mesures ou des chiffres clés, sont généralement des chiffres (ou des valeurs numériques) comme «Sales Revenue Net." Les tableaux de dimensions offrent la catégories, des classes ou des attributs par lesquels les faits peuvent être groupées. En d'autres termes, la table de faits fournit le contenu du cube OLAP, à savoir le «quoi» pour regrouper les données, tandis que les tableaux de dimensions indiquent les dimensions du cube, à savoir le «par quoi» pour regrouper les données.

Cubes OLAP dans des applications commerciales organisent habituellement des nombres économiques selon les catégories d'entreprises. Par exemple, un cube peut produire une déclaration factuelle individu que les ventes organisation "X" expédié matériau "Y" pour réceptionnaire "Z" à la valeur "400 EUR." Plus souvent qu'autrement, les états (rapports) sont le long de la lignes de certains résumés (regroupées par, agrégée, moyenne, etc) catégories (par exemple, les ventes de produits laitiers dans la région du Nord pour le dernier trimestre).

Classiques entrepôts de données copier des données dans des cubes OLAP dans un processus en trois étapes appelé extraire, transformer et charger (ETL). copies de données sont matérialisées , c'est à dire, les données sont enregistrées dans des tables physiques dans son état transformé. Cubes OLAP viennent avec un ensemble de transformations efficaces qui simplifient Analytics. Contrairement à une table physique, une vue analytique n'est pas «plat». Données doivent être "aplaties" lors de l'extraction de l'agrégation sur les dimensions du cube de données. En termes de structured query language (SQL), "aplatissement" signifie lire avec un GROUP BY fonctions de la clause et d'agrégation (SUM, AVG, MIN et MAX). Chaque mesure doit être munie d'un type d'agrégation, qui spécifie comment deux lignes de la table de faits seront fusionnés. Types d'agrégation valides sont SUM, AVG, MIN, MAX et.

Apporter OLAP et OLTP Closer Maintenant, SAP n'est pas nécessairement tente de fusionner l'OLAP et OLTP mondes en un seul, et HANA ne va pas y avoir qu'un seul type de base de données, en soi. Microsoft SQL Server , par exemple, peut être configuré comme un OLAP ou base de données OLTP, et par de grandes bases de données relationnelles et les plus traditionnels peut être organisé pour l'un ou l'autre but. Il est assez difficile (et peut-être même inutile) pour unifier OLAP et OLTP mondes via les technologies actuellement disponibles, car chacun a ses propres exigences spécifiques. Facebook utiliserait plusieurs bases de données à des fins différentes: une base de données relationnelle pour l'enregistrement des utilisateurs et des données de stockage, un (et pas seulement SQL) base de données NoSQL pour la manipulation et l'indexation des données non structurées (par exemple, dans la boîte de réception e-mail) , un entrepôt de données OLAP pour l'analyse des logs et des préférences des utilisateurs, etc Les différences sont nuancée et ces nuances présentent l'avantage d'une base de données (approche) sur une autre.

À cette fin, le but de HANA n'est pas nécessairement d'unifier tous ces mondes et des approches disparates, mais plutôt de réduire les différences et gouffre entre eux. Qu'est-ce HANA apporte à la table est la vitesse de combiner des algorithmes prédictifs avec les données encaissés. En outre, HANA une solution de stockage de données orientée colonne, en plus de l'orientation de la ligne standard. Dennis Moore (un ancien employé de longue date de SAP à SAP Labs ) explique l'importance de HANA dans ses Irregulars Enterprise de poste blog. Il affirme que les bases de données relationnelles sont bien adaptés à la manipulation de données structurées où

  1. Le schéma ne change pas,
  2. traitement de texte
  3. n'est pas une exigence importante,
  4. Données
  5. est mesurée en gigaoctets plutôt que pétaoctets,
  6. Traitement
  7. géographique ou chronologique (par exemple, cours d'eau) n'est pas nécessaire, et
  8. Le serveur n'a pas besoin de supporter des requêtes transactionnelles et aide à la décision en même temps.

Un trait essentiel de la plupart des bases de données relationnelles commerciales est leur conformité avec un principe appelé «acide» (atomicité, cohérence, isolation, durabilité), qui garantit essentiellement que les opérations de base de données se produisent de manière fiable. Certains pourraient se référer à cette fonctionnalité comme la persistance des données. le verrouillage de ligne est une pratique courante utilisée pour assurer l'intégrité des transactions et la cohérence de la base de données lors de l'utilisation simultanée par plusieurs utilisateurs. Le verrouillage empêche les utilisateurs de lire les données qui sont modifiées par d'autres utilisateurs, et empêche que plusieurs utilisateurs de modifier les mêmes données en même temps.

Row et Columnar Bases de données: bases de données stockent des données relationnelles traditionnelles basées sur SQL sous forme de lignes, comme c'est souvent le meilleur moyen de rechercher une valeur unique, comme le salaire des employés, des compétences ou âge, pour une valeur clé, telles que l'ID de l'employé. Mais, comme expliqué plus haut, il est difficile de procéder à une analyse et de décision basée sur cette évolution constante des données formatées plats décision. En revanche, les colonnes de données du groupe de bases de données par, eh bien, colonne.

Dans une colonne, d'une manière générale, toutes les données sont du même type. Une base de données en colonnes stocke les données d'un seul type tout à fait, en offrant la possibilité de compression de données importante. Cette compression peut conduire à une diminution des besoins de disque de l'espace, les besoins en mémoire et les temps d'accès. Autres avantages des bases de données en colonnes sont mieux rendre compte du rendement, saisie et traitement de données en parallèle, l'élimination de certains types d'agrégation, etc

SAP HANA, les utilisateurs peuvent décider de configurer chaque table, et plus probablement une gamme de tables, dans une ligne ou une colonne organisation. Si les utilisateurs changent d'avis plus tard, ils peuvent changer l'organisation des données dans un tableau à la volée. Cette opération nécessite littéralement que le tableau est lu, copié sur un autre format de saisie, et l'ancien format est supprimé. Le défaut d'organisation des données HANA sera probablement colonnes.

Apparemment, les origines de HANA remontent à 2005, lorsque SAP a acquis la société coréenne Transact In Memory, Inc. et son P * Temps à une rangée moteur de stockage (voici quelques très information détaillée de produit pour les technophiles). Inutile de dire que SAP a depuis ajouté de nombreuses autres fonctionnalités de cette fondation. Aujourd'hui, exclusive de HANA fonctionnalités SAP TREX moteur de recherche, l'(Multidimensional Expressions) langage MDX pour obtenir des renseignements et des calculs analytiques et multimédia, et le propriétaire SQL Script langue (un multi-plateforme langage SQL pour l'interfaçage de bases de données). En outre, il est un moteur de planification pour effectuer des opérations financières dans la couche de base de données, un stockage sur disque (pour les types de données qui ne nécessitent pas la vitesse en mémoire), SAP LiveCache pour le stockage des objets (pour stocker les fichiers non texte et les données non structurées), un système de vieillissement des données, une couche de persistance de MaxDB (base de données relationnelle exclusive de SAP utilisé pour SAP Business ByDesign ), un méta-données gestionnaire, un gestionnaire de transactions, un moteur de calcul, un moteur d'optimisation, une demande parser, un gestionnaire d'autorisation, et un référentiel de données (système d'enregistrement, si vous voulez). SAP Sybase acheté en 2010 et Sybase a été le pionnier en chef et innovateur dans les bases de données basée sur les colonnes avec Sybase IQ (SGBDR) depuis 1996. Logiquement, HANA a mis en place certaines des technologies d'indexation de Sybase IQ.

Comment fonctionne données en mémoire ma place ici? HANA utilise simultanément les deux en mémoire des technologies de bases de données sur disque et, et a une couche de persistance de données et un système de récupération de données avec gestion des pages et enregistreur (ie, toutes les données doivent nécessairement être gardés en mémoire). Bases de données en mémoire (IMDBs) tirer profit des deux tendances matérielles suivantes:

  1. Une réduction significative du coût de mémoire vive (RAM)
  2. Une augmentation significative de la quantité de mémoire adressable dans les ordinateurs d'aujourd'hui

Moore explique dans son blog ci-dessus, il est donc possible et économiquement réalisable, de mettre tout un contenu de base de données en mémoire, de gestion et de consultation de données rapide. En utilisant colonne ou d'autres méthodes de compression, des ensembles de données encore plus grandes peuvent être chargées entièrement dans la mémoire principale. Avec un accès haute vitesse aux données résidant en mémoire, plus d'utilisateurs peuvent être pris en charge sur une seule machine.

En outre, avec une base de données en mémoire, les deux requêtes transactionnelles et aide à la décision peuvent être pris en charge sur une seule machine, ce qui signifie qu'il ne peut y avoir aucune latence entre les données transactionnelles (OLTP) apparaissant dans le système et que les données soient disponibles aux applications aide à la décision (OLAP). Dans une configuration traditionnelle, où les données résident dans le magasin opérationnel (transactionnel) et est ensuite extraite dans un entrepôt de données pour le reporting et l'analyse, il ya toujours un décalage entre la saisie des données et de sa disponibilité pour l'analyse des données (et donc la «conduite avec une Rétroviseur mantra ").

En revanche, HANA peut produire des rapports et des analyses directement à partir des tables physiques, où les données sont transformées à la volée, c'est à dire, il n'est pas nécessaire pour la matérialisation dite (ETL). Une vue analytique (OLAP cube) dans HANA n'est pas une copie de données transformé, mais plutôt le plan de la façon de transformer les données à la volée. Indexation et de recherche sont beaucoup plus rapides avec des capacités TREX en mémoire et. HANA dispose soi-disant stockage de proximité (SNA ou le stockage intermédiaire) les capacités qui sont intégrés avec une couche data mart (pour la création rapide et re-création de datamarts).

SAP HANA: aujourd'hui et demain
Actuellement, HANA est la manipulation OLAP piles (basé sur les solutions analytiques d'accélérateur généralement disponibles), mais SAP travaille ardemment sur l'activation et tester HANA manipulation des piles OLTP ainsi. Finalement, et nous parlons ici années, le ensemble SAP ERP portée, et même SAP Business Suite se déroulera sur HANA (et d'autres bases de données grand public). Encore plus surprenant pour moi a été l'annonce que la prochaine version de la bas de gamme SAP Business One solution ERP, qui se déroule actuellement sur Microsoft SQL Server, sera sur HANA ainsi (avec une disponibilité prévue à l' fin 2012).

Certains pourraient se demander dans la crainte que les raisons pour lesquelles les entreprises avec 15-20 utilisateurs (l'entreprise typique SAP profil d'utilisateurs a) doivent HANA. Comme indiqué précédemment, SAP estime que ces entreprises devront non seulement HANA pour la business intelligence (BI) / vitesse d'analyse, mais aussi pour une croissance intelligente et rapide des recherches entreprises par les données non structurées. Fondamentalement, SAP a une approche à trois volets pour HANA:

  1. Au pouvoir isolés entrepôts de données (DW) dans de nombreuses entreprises et des ministères, et pas nécessairement SAP BW
  2. Pour les applications accélérateur d'appareils qui gèrent une tâche particulière, tels que les ventes et les opérations de planification (S & OP), les promotions commerciales, la détection des fraudes, la visibilité de la chaîne d'approvisionnement et l'optimisation, la tarification en temps réel et automatisés et un service optimisé à la clientèle, etc, où les données à grande vitesse croquer, analyse, recherche, calculs, etc, sont essentiels
  3. Comme une plateforme d'entreprise de logiciels à usage général de base de données, un « Oracle tueur de base de données» de toutes sortes

Le troisième objectif a déjà été accompli par journée de travail (voir le post de blog connexe). HANA n'est pas vraiment une orientée objet (OO) données en mémoire, contrairement journée de travail, et les deux diffèrent dans leurs approches et les intentions de conception pour l'utilisation de leurs technologies de bases de données. Mais ils partagent de nombreux outils et des approches similaires dans la conception d'applications de prochaine génération et de surmonter les limitations mentionnées ci-dessus des bases de données relationnelles.

SAP a récemment travaillé sur le perfectionnement HANA être ouvert, c'est à dire sans la nécessité de travailler avec les applications de SAP, en soi. Ainsi, le géant veut entrepôts de données d'énergie et des calculs rapides OLAP à partir de n'importe où et à partir de n'importe quelle source de données. Outre les ajouts récents du moteur de recherche d'entreprise TREX, l'analyse de texte de Business Objects , d'analyse prédictive et de traitement des événements complexes (CEP) de Sybase, etc HANA aura nuage - et la mobilité activée. Lors du récent Sommet de l'influenceur, SAP a annoncé le projet rivière Platform-as-a-service (PaaS) offre plan alimenté par HANA (un exploit à long terme, bien sûr) . Voici évaluation approfondie de Gartner sur la stratégie PaaS de SAP.

Conclusion et recommandations: Avec HANA, SAP aura environ cinq bases de données différentes, dont beaucoup sont des bases de données relationnelles traditionnelles, telles que le susmentionné Sybase IQ et MaxDB. Certains experts auraient ri ou dédaigneux ricané quand SAP sérieusement déclaré ses intentions d'être le n ° fournisseur de base de données 2 en 2015, mais SAP paru sérieux. L'entreprise reconnaît même qu'il pourrait cannibaliser ses propres offres relationnelles, mais ce n'est pas une grosse affaire, car la plupart des clients de base de données Sybase (Wall Street sociétés de services financiers) ne pas utiliser le logiciel SAP sur le dessus de Sybase.

Il est probable que HANA va coexister avec les bases de données relationnelles en place dans les environnements SAP. En théorie, les entreprises peuvent même installer deux instances HANA: une pour OLTP et l'autre à des fins OLAP. Il sera très important pour SAP d'épouser un prix attractif et la proposition de valeur pour les clients existants et potentiels à renoncer à la technologie qu'ils ont vécu pendant des décennies. SAP HANA peut payer lui-même les paiements de maintenance de base de données réduites. Ainsi, son plus grand avantage concurrentiel pourrait être en créant une pression sur les prix de bases de données relationnelles pour les instances d'entrepôts de données.

SAP

devraient également clarifier la relation entre HANA et NetWeaver , c'est-à-sera NetWeaver faire partie de la future architecture basée sur HANA (par exemple, un serveur d'application), ou ce qu'il y aura un remplacement de gros et de migration vers une nouvelle plate-forme? Vous pouvez imaginer le désarroi des clients SAP qui ont finalement déménagé à partir de SAP R / 3 aux rejets fondées sur NetWeaver, seulement maintenant envisager un avenir passage à une autre plate-forme.

Initialement, SAP HANA fera probablement ses plus grandes percées comme un "accélérateur" pour SAP BW et pour des applications d'analyse d'appareils spécialisés. SAP n'est pas nécessairement le premier moteur dans le domaine de la base de données en mémoire à la lumière de l'existence de Oracle Exalogic et Exalytics , Oracle TimesTen (utilisé par salesforce.com ) et Microsoft SQL Server nom de code Denali (qui mettra en vedette importantes capacités en mémoire au-dessus de PowerPivot ). Kinaxis et QlikView ont depuis longtemps leurs capacités en mémoire de leurs réponses de la chaîne d'approvisionnement rapide et des produits de BI.

Mais SAP parie sur l'intégration, la certification et des performances optimisées de ses produits pour HANA comme base de données préférée à l'avenir. Ainsi, les indications sont que chaque nouvelle recherche et le développement (R & D) demande à SAP HANA qui n'est pas basée sur doit être approuvé par le conseil d'administration. Nous pouvons être encore loin de voir SAP HANA remplacer Oracle, IBM DB2 , ou Microsoft SQL Server en tant que gestionnaire de données transactionnelles de SAP Business Suite (et Progress OpenEdge en non environnements SAP ERP, si vous voulez), mais ces entreprises doivent se considérer comme prévenu.

Références et lectures supplémentaires

Irréguliers

de l'entreprise. SAP HANA fait des progrès et menace Oracle.
Personnes, processus et technologie. SAP HANA vs Oracle Exalytics - le jeu est en marche.
TEC. Revue de l'année: Top Enterprise Software Nouvelles et tendances pour 2011.
TEC. SAP comme une force du marché de détail:. Fait de plus Than Fiction

 
comments powered by Disqus

Recherches récentes :
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Others

©2014 Technology Evaluation Centers Inc. All rights reserved.