Elle s’articule autour d’une architecture classique de type ETL (SSIS integration services), Stockage relationnel et multidimensionnel (SQL SERVER OLTP et SSAS), et restitution (SSRS reporting services) pour la partie serveur et l’infrastructure SHAREPOINT et EXCEL pour les accès du client.
Cette architecture robuste et économique présente cependant quelques insuffisances constatées par les clients historiques, en particulier avec l’apparition des outils type BI personnelle, qui ne pourront être levées que par une évolution radicale de l’architecture du produit.
Celle-ci est présentée dans le schéma ci-dessous et rompt avec l’architecture actuelle :

Figure 1 Le futur proche de la BI chez MICROSOFT
On note en particulier la refonte de l’outil SSRS au sein du projet « Crescent » , l’apparition du moteur VERTIPAQ et du langage d’interrogation de données DAX associé, aussi bien en relationnel qu’un multidimensionnel et la mise en avant des applications POWERPIVOT.
L’éditeur distingue 2 types de cible clients BI en fonction du contexte :
1. Environnement de forte volumétrie avec des besoins de capacité de stockage élevée ou des besoins d’intégration de type « quasi temps réel » - Besoin d’intégrité fort - Ressources IT adaptée maîtrisant l’OLAP et le langage MDX – clients nombreux avec des exigences précises et peu évolutives et terme de reporting – complexité métier faible à moyenne : domaine de la BI institutionnelle de type groupe. L’architecture préconisée dans ce cas est SQL SERVER 2008 R2 dont SSAS avec l’utilisation du MDX pour la manipulation des données et un accès à SSRS au travers du portail SHAREPOINT 2010 ou EXCEL 2007 a minima.
2. Environnement de volumétrie faible à moyenne – Besoin d’intégration non temps réel – Enrichissement progressif du modèle de données avec préemption de ce modèle par les utilisateurs métiers – ressources IT concentrée sur son cœur de métier à savoir l’administration technique et le suivi des performances – complexité et évolutivité moyenne à forte des domaines métiers – besoin de reporting personnalisé et adapté en plus du reporting institutionnel : domaine de la BI personnelle de type département ou service. L’architecture préconisée sera dans ce cas SQL SERVER 2008 R2 avec l’utilisation du moteur VertiPaq et du langage DAX au travers de POWERPIVOT pour EXCEL 2010 et de POWERPIVOT pour SHAREPOINT 2010, l’IT exerçant la surveillance des performances et l’administration des serveurs.
Version actuelle
Un certain nombre de points ont été relevés sur la version actuelle
Version actuelle
Un certain nombre de points ont été relevés sur la version actuelle
- Manque de cohérence et d’étendue fonctionnelle des modèles sémantique UDM (unified data model modèles OLAP) et SMDL (modèles de rapport) - absence de capillarité de ces modèles sur toute la suite BI, la conséquence étant une administration double voire triple sur l’ensemble de la suite (SSIS, SSAS, SSRS) lors des évolutions du modèle de données.
- Complexité de la mise en œuvre et du maintien en condition opérationnelle de SSAS et manque d’agilité lors de l’enrichissement des modèles multidimensionnels, complexité du langage MDX pour la manipulation des cubes OLAP nécessitant le maintien de ressources IT compétentes,
- Manque de richesse fonctionnelle de l’outil SSRS Reporting Services et performance en retrait par rapport à des solutions de type « In memory »,
- Autonomie des utilisateurs réduites en terme de conception de rapports moyennement complexes à très complexes, l’outil client lourd Report Builder 3.0 étant en dessous d’un outil de type SAP BO XI et assez peu déployé de manière opérationnelle dans les grandes organisations,
- Forte demande des analystes et experts métiers du maintien d’EXCEL comme outil d’interrogation des données mais également de conception et publication de rapports autres que les rapports institutionnels de l’entreprise.
Fort de ces constats, l’éditeur a donc annoncé qu’il souhaite faire évoluer radicalement et rapidement son produit, notamment sous la pression de produits concurrents proposant des solutions plus simples et plus économiques, voire plus performantes (solution du type « In Memory »).
Cette approche, partiellement amorcée par le lancement de l’offre conjointe SQL SERVER 2008 R2, SHAREPOINT 2010 et POWERPIVOT for EXCEL ou SHAREPOINT sera définitivement adoptée sur la version SQL SERVER 2011 code DENALI et présentera une architecture radicalement nouvelle avec notamment l’apparition :
- Du BI Semantic model (BISM) sous Visual Studio 2010 proposé en parallèle du modèle UDM actuel non évolutif. Il s’agit d’un modèle sémantique couvrant cette fois ci toutes les briques des outils et simplifiant avantageusement le développement,
- Du projet CRESCENT refondant profondément l’outil Reporting Services en offrant une richesse fonctionnelle au niveau des meilleurs outils actuels,
- Du langage de manipulation de données DAX (Data Analysis Expression), très proche en terme de syntaxe du langage macro d’EXCEL et en alternative au MDX pour les usages des analystes et experts métiers permettant un transfert progressif de l’administration et l’enrichissement des modèles métiers de l’IT vers les utilisateurs avancés.
Figure 2 Architecture Microsoft BI selon les 3 couches
On distingue donc désormais et de manière séparée :
La couche modèle de données qui est exposé à des applications clientes et qui traite à la fois les données relationnelles comme les données multidimensionnelles
La couche règle métier (business Logic) : la logique métier est définie par les utilisateurs métier en utilisant le modèle DAX (Data Analysis Expression) ou MDX (Multidimensional Expressions). DAX est un langage d'expression basé sur des formules de calcul Excel qui a été introduit par PowerPivot et construit sur des concepts relationnels. Il n'offre pas la puissance et la même souplesse que le MDX, mais il est plus simple à utiliser et nécessite un réglage minimal. Il y aura toujours des applications complexes de BI qui nécessiteront la puissance de calculs du MDX mais l’utilisation du BI Semantic Model s’appuiera préférentiellement sur DAX.
La couche accès aux données qui intègre des données provenant de diverses sources - bases de données relationnelles, applications d'entreprise, des fichiers plats, Data RSS, etc. Il y a deux options pour l'accès aux données : le mode mise en cache et le mode temps réel. Le mode mis en cache extrait les données des sources et les stocke dans la mémoire en colonne dans la zone de stockage mémoire VertiPaq. VertiPaq est une technologie qui utilise des algorithmes de compression performants avec les processeurs multi-thread pour des requêtes sophistiquées et qui est optimisé pour les derniers chipsets multi-core, délivrant ainsi de performances exceptionnelles sans avoir besoin de mettre en œuvre des stratégies élaborées d'indexation, d'agrégats ou de réglage.
Le mode temps réel, d'autre part, est le mode classique qui exécute les traitement des requêtes et d'évaluation des logiques métier jusqu'à la source de données, en exploitant ainsi les capacités du serveur et en évitant le besoin de copier les données dans la zone de stockage mémoire VertiPaq du client. Le choix du meilleur compromis d'utilisation reste du ressort du client.
Il est entendu que dans le cas d’un réseau suffisamment dimensionné et de mémoire disponible importante, le mode mise en cache offre des performances nettement supérieures.
A titre indicatif, les maquettes réalisées offrent des performances plus de 100% supérieures sous POWEPIVOT sous EXCEL par rapport à SSRS sous SQL SERVER 2008 R2 avec des fonctionnalités de filtrage (utilisation des segments, filtres d’en tête de lignes et de colonnes) nettement supérieures.
A titre indicatif, les maquettes réalisées offrent des performances plus de 100% supérieures sous POWEPIVOT sous EXCEL par rapport à SSRS sous SQL SERVER 2008 R2 avec des fonctionnalités de filtrage (utilisation des segments, filtres d’en tête de lignes et de colonnes) nettement supérieures.
Toutefois, cette architecture nécessite par principe une quantité de mémoire vive plus importante, aussi bien sur le serveur que sur le poste client (dans le cas d’utilisation de POWERPIVOT pour EXCEL 2010).

0 commentaires:
Enregistrer un commentaire