Accueil
 > Rapports de TEC > Blogue de TEC > La veille économique en code source libre : l'évolution t...

La veille économique en code source libre : l'évolution tranquille

Écrit par : Anna Mallikarjunan
Date de publication : juillet 24 2009

Dans la situation économique actuelle, les organisations doivent réévaluer et rationaliser les dépenses associées aux logiciels d'entreprise. Ainsi, l'OSBI (open source business intelligence ou veille économique en code source libre) devient peu à peu une option importante lors du choix de nouvelles implémentations de veille économique. Bien que la plupart des études indiquent que son évolution s'est faite discrète jusqu'à maintenant, l'OSBI croît rapidement. Les solutions d'OSBI complémentent bien les environnements traditionnels de veille économique et s'y intègrent sans difficulté. Tous les éditeurs de veille économique offrent des technologies compétitives et des économies de coûts irréfutables.

Le terme « logiciel libre » laisse croire qu'il signifie « accès gratuit au code source ». Cependant, la portée des logiciels libres s'est étendue considérablement. La licence du code source libre (souvent appelée licence GPL) est assujettie à des lois définies par l'Open Source Initiative (OSI), qui décrète que les logiciels libres ne peuvent pas faire de discrimination envers des groupes ou des technologies et doivent être distribués gratuitement.

De tels logiciels peuvent être modifiés, mais la redistribution des licences modifiées peut être conditionnelle (par exemple, la licence peut nécessiter que les changements apparaissent sous forme de fichiers de correction plutôt que d'être directement ajoutés au code original) afin de protéger l'intégrité du travail original de l'auteur. Le meilleur ensemble de logiciels libres est LAMP, qui regroupe le système d'exploitation Linux, le serveur de protocole HTTP Apache, le système de gestion de bases de données MySQL et les langages de programmation, y compris PHP, Perl et Python.

Le code source libre et la veille économique : le lien qui les unit

Le terme « application libre » décrit les systèmes élaborés à partir de logiciels libres sous la forme de cadres de travail ou de bibliothèques. Bien que les licences GPL n'autorisent pas la revente des logiciels développés à l'aide de logiciels libres, certains mécanismes, tels que les modèles de licence double, sont apparus à la suite de cette interdiction. Ce type de licence permet ainsi aux éditeurs de vendre leur logiciel avec une licence communautaire qui respecte les lois associées à la licence pour le code source libre et qui offre une licence commerciale avec frais. Les éditeurs peuvent exiger des frais pour les services tels que le soutien, la formation, la consultation et les caractéristiques avancées.

Depuis deux ans, les éditeurs de logiciels libres commerciaux travaillent activement afin de se tailler une place à long terme parmi les éditeurs d'applications d'entreprise. En février 2007, l'Open Solutions Alliance (OSA) s'est formée afin de rapprocher les entreprises de logiciels libres commerciaux. La raison principale était d'élargir la portée des applications en code source libre et de favoriser leur interopérabilité. JasperSoft, un pionnier de l'OSBI, fait partie des membres fondateurs de cette alliance. Pentaho, un autre éditeur d'OSBI, s'est démarqué, car il mène et parraine tous ses projets principaux en implémentant les normes de l'industrie du logiciel libre et en établissant des partenariats avec des éditeurs d'entreposage de donnée, tels que InfoBright et ParAccel.

La veille économique fait face à certains des problèmes technologiques les plus complexes parmi toutes les applications logicielles. Ces problèmes concernent la conception de très grandes bases de données, l'intégration complexe de données entre des sources de données multiples et disparates, l'habileté à effectuer des recherches parmi la surabondance de l'information et certaines des exigences de temps d'attente. Même avec les solutions privées, les organisations nécessitent une équipe de professionnels expérimentés, notamment des administrateurs de bases de données, des analystes d'entreprise et des programmeurs afin d'implémenter et de prendre en charge l'entrepôt de données et l'environnement de veille économique.

Les logiciels d'OSBI poussent les logiciels libres un peu plus loin : ils invitent les organisations à utiliser et à modifier le logiciel selon leurs besoins ainsi qu'à partager les résultats avec le reste de la communauté. Il est tout naturel que les technologies associées au code source libre et à la veille économique aient convergé. Un facteur crucial à considérer lors de l'acquisition d'une solution d'OSBI est que les technologies sous-jacentes sont souvent, sinon toujours, du code source libre. Bien que ce ne soit pas obligatoire, il est prudent que les équipes techniques apprennent les compétences nécessaires. Par exemple, la plupart des logiciels d'OSBI sont élaborés selon l'ensemble LAMP. Afin d'adopter et de maintenir les applications, les équipes techniques doivent posséder des compétences en élaboration et en administration avec l'ensemble LAMP.

Pentaho : un exemple typique

Il est possible d'illustrer que l'OSBI peut offrir une solution complète correspondant aux besoins d'une organisation au moyen de la plateforme de Pentaho qui répond aux exigences principales d'intégration des données, de production de rapport et d'analyse.

ETTL avec Kettle

La plateforme de veille économique de Pentaho implémente le métamodèle d'entrepôt commun (Common Warehouse Metamodel ou CWM). Le CWM, qui a été implémenté par des éditeurs privés tels que Informatica, est une caractéristique qui propose l'utilisation du XML metadata interchange (XMI) afin d'échanger les métadonnées de l'entrepôt de données. Les correspondances peuvent être déplacées parmi les outils qui implémentent cette interface. Le système ETL (extraction, transformation et chargement) de Pentaho repose sur son projet nommé Kettle. Kettle signifie « Kettle ETTL Environment », où ETTL est l'acronyme de Pentaho pour « l'extraction, la transformation, le transport et le chargement » de données. Le système ETL supporte : une variété d'étapes (une étape représente la plus petite unité dans une transformation et contient une logique prédéfinie ou personnalisée qui est appliquée à chacune des rangées tandis qu'elle se rend de la source à la cible); des dimensions à évolution lentes (SCD pour slowly changing dimensions); des connexions pour une multitude de sources de données (l'accès aux bases de données privées telles que Microsoft SQL Server et Oracle se fait par Java Database Connectivity (JDBC)) et la capacité d'organiser et d'exécuter des tâches localement ou à distance. Le langage script de Javascript ainsi que du Java pur permet aux développeurs d'ajouter des codes personnalisés à tout moment durant la transformation.

Le volume de données et les exigences de temps d'attente représentent deux problèmes complexes. Afin de prendre en charge des environnements ayant de grands volumes de données, Pentaho possède une solution d'agrégation (une solution qui utilise plus qu'un nœud ou une entité informatique afin d'atteindre une haute performance et disponibilité) qui fonctionne avec la division de la base de données. Au moyen de serveurs-esclaves (un groupe de serveurs qui effectuent certaines tâches particulières grâce aux données envoyées par le serveur principal) pour distribuer le chargement de l'unité centrale (CPU) et de l'entrée et la sortie (I/O), la performance peut être améliorée. Cependant, le changement de capture de données, qui repose sur une technique d'intégration de données qui provoque le transfert de données en cherchant des modifications dans les sources de données, n'est pas supporté. Les modifications dans les sources de données sont détectées en lisant les journaux de transaction; à l'exception des bases de données en code source libre, les lecteurs de journaux de transaction sont rarement à code source libre.

Bien que l'intégration de données de Pentaho n'a pas encore de solution de nettoyage et de qualité de données, l'élaboration d'un serveur de profilage (un serveur qui effectue des tâches de profilage qui permettent de découvrir des aberrations dans les données. Voir, en anglais, Distilling Data: The Importance of Data Quality in Business Intelligence) semble être sur la liste des améliorations imminentes. Lorsque l'éditeur ne supporte pas une fonction particulière, les organisations peuvent chercher des solutions en code source libre complémentaires : le projet DataCleaner d'eobjects.org, par exemple, offre une fonction qui permet de profiler les données et d'en surveiller la qualité. Ces situations démontrent un avantage important associé avec les applications en code source libre : le fait que les logiciels sont développés par la communauté et pour la communauté rend le partage des solutions innovatrices rapide et facile.

Analyse avec Mondrian

La structure des activités d'affaires d'une entreprise est presque toujours multidimensionnelle. Le contenu d'une entreprise est défini en termes de propriétés quantifiables ou mesurables (p. ex. : les ventes, les stocks ou les donations) et d'attributs qualitatifs (p. ex. : étudiants, clients ou produits). Chaque activité d'entreprise peut comprendre une combinaison de ces entités quantitatives et qualitatives. Bien que les systèmes d'entreprise peuvent stocker les nouvelles activités dans un format relationnel, un environnement multidimensionnel très ouvert est nécessaire afin d'analyser l'entreprise dans son entièreté et d'en obtenir un aperçu.

Le traitement analytique en ligne (Online analytical processing ou OLAP), un domaine en pleine croissance en termes de recherche et développement, fait référence à une méthode qui permet de stocker et d'interroger un volume élevé de données réparti sur plusieurs dimensions. Les détails de l'OLAP multidimensionnel (MOLAP) par opposition à l'OLAP relationnel (ROLAP) animent encore les débats. Toutefois, le choix dépend de la nature des données, du temps d'attente et des ressources (matérielles et logicielles). Par exemple, le ROLAP peut représenter une meilleure solution pour les données qui sont axées sur la dimension ou pour les situations où le temps d'attente doit être court ou prêt du temps réel. Par contre, le MOLAP peut mieux répondre aux grands ensembles d'agrégation et aux exigences de temps d'attente plus indulgents. Dans tous les cas, l'adhésion à des principes de conceptions solides est essentielle pour la création d'une solution OLAP réussie.

La réponse de Pentaho à la question de l'analyse multidimensionnelle est le moteur ROLAP nommé Mondrian. Les aspects les plus importants de l'OLAP sont la manière et l'endroit où sont stockées les agrégations. Dans un environnement ROLAP, tel qu'avec Mondrian, les données et les agrégations sont stockées dans une base de données relationnelle. Les agrégats précalculés sont emmagasinés dans des tables de faits de base. De telles structures d'agrégats sont nécessaires afin d'éviter des calculs pour des milliers d'enregistrements de faits à chacune des interrogations. Ces tables ne font pas partie du moteur analytique; elles doivent être élaborées grâce à un processus de type ETL. Pentaho offre un outil nommé Aggregation Designer qui aide à créer et à maintenir des tables d'agrégats. Mondrian inclut une mémoire cache d'agrégats qui sauvegarde les ensembles de résultats multidimensionnels pour des calculs subséquents. L'application complète d'interface de programmation (application programming interface ou API) CacheControl est incluse pour l'accès granulaire à la mémoire cache de Mondrian.

Les organisations peuvent choisir plusieurs approches afin d'offrir un outil client pour l'analyse multidimensionnelle. Un projet de code source libre complémentaire appelé JPivot offre un outil client de tableau croisé dynamique dans Java Server Pages (JSP), afin de naviguer parmi les cubes créés à partir de Mondrian. Mondrian fournit également une interface de multidimensional expressions (MDX). Il est à noter que ce MDX n'est pas tout à fait le même que celui fait par Microsoft. Les développeurs peuvent élaborer des applications internes en utilisant olap4j (ou OLAP pour Java), une caractéristique développée par plusieurs éditeurs de code source libre, y compris Pentaho, JasperSoft et LucidEra.

Et puis tout le reste — Rapports et tableaux de bord

Tous les environnements de veille économique doivent fournir une gamme complète d'outils afin de créer, publier, distribuer et organiser le contenu riche des rapports. Le Classic Engine de Pentaho se base sur la conception de rapports en bandes. Les mises en page en bandes divisent le rapport en sections et le moteur de rapports parcourt les données et les insère dans les bandes prédéfinies. Dans le moteur en bandes classique, les données envoyées au rapport déterminent son apparence. Ce paradigme continue d'être utilisé avec succès par plusieurs outils de production de rapports. Cependant, un nouveau modèle qui gagne en popularité est fondé sur les résultats plutôt que sur les données permettant le traitement du rapport. Le Flow Engine, encore en développement, travaillera sur la définition d'un rapport élaboré en utilisant le modèle DOM; le résultat final sera présenté en combinant la définition et les nouvelles données. Le Report Designer prend en charge plusieurs sources de données, une variété d'options de formatage et la capacité de présenter des rapports multilingues en langage HTML, PDF et Excel, pour ne nommer que ces formats de sortie. Un outil de production de rapports à client léger élaboré grâce à AJAX est également disponible dans la gamme de production de rapports de Pentaho. Les rapports de l'outil ad hoc peuvent être conçus à l'aide de la couche de métadonnées, alors que le Report designer, en plus de la couche de métadonnées, peut se connecter directement aux sources de données.

Les tableaux de bord de Pentaho offrent la capacité de définir les mesures qui sont importantes pour une entreprise et les déployer grâce à une variété de caractéristiques de l'interface utilisateur : des grilles de style tableau, l'intégration avec Google Maps, des rapports avec tabulation en croix et un zoom sur les analyses multidimensionnelles ou les rapports. L'intégration à d'autres contenus web à l'aide de cadres ou de composantes AJAX est également possible. Le Community Dashboard Framework (CDF), conçu par les membres principaux de la communauté de Pentaho, facilite le développement de nouveaux tableaux de bord en déterminant les différentes composantes à l'aide d'une syntaxe directe, sans programmer l'interface. Certaines discussions sur les forums indiquent que Pentaho pourrait ajouter le CDF dans son produit.

En conclusion

Bien que les solutions d'OSBI n'ont pas encore atteint la longévité ou la maturité des solutions de veille économique traditionnelles, l'évolution de la veille économique en code source libre gagne en popularité tandis que sa crédibilité et sa pertinence augmentent. Sans prendre de grands risques, les organisations peuvent découvrir si l'OSBI correspond à leur besoin en élaborant des prototypes d'applications. Les composantes des logiciels d'OSBI peuvent également être intégrées aux implémentations de veille économique existantes afin d'obtenir des fonctions supplémentaires. Ces logiciels possèdent une transparence importante en termes de technologie et de feuille de route de produit. Les collaborations et les partenariats entre les éditeurs de code source libre se forment constamment. Les communautés dédiées à l'utilisateur rendent possibles les avantages liés à l'expérience grâce à plusieurs compagnies et plateformes.

Afin d'en apprendre davantage au sujet des logiciels libres, cliquez sur l'adresse suivante :
http://foss.technologyevaluation.com/

Afin d'en apprendre davantage au sujet des solutions de veille économique, cliquez sur l'adresse suivante :
http://bi.technologyevaluation.com/

 
comments powered by Disqus

Recherches récentes :
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Others

©2014 Technology Evaluation Centers Inc. All rights reserved.