IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Microsoft Business Intelligence avec librairies numériques

Logo Visual Numerics


précédentsommairesuivant

I. Introduction

I-A. Audience

Cette publication technique est destinée aux développeurs Microsoft intéressés par l'intégration d'algorithmes de data mining de tierces parties dans les services d'analyse Microsoft SQL Server 2005 Analysis Services (SSAS). Elle fournira un aperçu de haut niveau de l'architecture SSAS et de son environnement de développement plug-in managé, et elle démontrera le développement d'un plug-in pour un algorithme cluster K-means pour une bibliothèque numérique IMSL® C# avec des exemples de codes.

I-B. Arguments

Ces dernières années, les quantités de données disponibles aux organisations et les capacités de stockage de données ont crû exponentiellement. En conséquence, beaucoup d'organisations travaillent à tirer parti de ces données capturées pour prendre de meilleures décisions commerciales et gagner un avantage compétitif. Par les techniques d'analyse de données d'intelligence commerciale (BI), qui vont du data mining classique aux analyses avancées et prédictives, certaines organisations reposent sur l'analyse de données pour leur direction stratégique. Pour soutenir ces efforts, il est demandé aux développeurs de logiciels et aux professionnels des technologies de l'information d'incorporer des méthodes d'analyse de données avancée dans des applications d'analyse de données.

Sur la base de son expérience avec de nombreux clients mettant en ouvre l'analyse avancée, Visual Numerics a identifié un besoin croissant des organisations d'intégrer l'analyse de données à des systèmes existants et des banques de données (ex. entrepôts ou minientrepôts de données). L'intégration améliore significativement la durée d'analyse et réduit la complexité des systèmes en rapprochant l'analyse des données par rapport aux méthodes traditionnelles extraction-analyse-chargement. Microsoft SQL Server est une cible de premier choix pour l'analyse intégrée avec les capacités plug-in de SASS qui permettent de rapprocher les outils analytiques des données, et en définitive de les rapprocher des utilisateurs finaux des données.

Il existe typiquement deux types d'utilisateurs pour les algorithmes intégrés :

  • des développeurs qui utilisent un algorithme pour créer un modèle de data mining, vérifier la précision du modèle et faire des prédictions en utilisant le modèle à l'issue de son entraînement ;
  • des clients qui utilisent le modèle créé par le développeur. Par exemple, l'utilisateur d'un Microsoft Excel 2007 pourrait jouer le rôle d'un client.

Cette publication se focalisera sur l'intégration d'un algorithme Bibliothèque IMSL C# dans un environnement Microsoft BI. Les mêmes techniques peuvent s'appliquer à d'autres algorithmes C# de tierces parties.

Pour plus d'informations sur la Bibliothèque IMSL C#, visitez la page produit Bibliothèque IMSL C#.

I-C. Contexte

Microsoft SQL Server fournit des solutions pour le traitement de transactions en ligne à grande échelle, pour le stockage de données et les applications de e-commerce. Avec des ajouts récents, il peut aussi servir de plateforme BI pour l'intégration et l'analyse de données et pour rapporter des solutions. La figure suivante montre les relations entre les composants du SQL Server 2005. Pour plus d'informations, on se reportera à l'Aperçu du serveur SQL.

Services d'Intégration
Figure 1. Microsoft SQL Server TechCenter et les relations entre ses composants

De plus, SQL Server 2005 fournit un studio de gestion SQL pour gérer des objets bases de données et un studio de développement BI pour développer des solutions BI. Ces outils sont basés sur Microsoft Visual Studio.

Le composant du SQL Server sur lequel on doit se focaliser pour intégrer les routines de la Bibliothèque IMSL C# est « Analysis Services » (services d'analyse). On se reportera à la Figure 2 ci-dessous.

image
Figure 2. Le composant Services d'Analyse du SQL Server

« Analysis Services » est un service Windows qui fournit des fonctionnalités de traitement analytique en ligne (OLAP) et de data mining par une combinaison de serveurs et de technologies client. Par défaut, Microsoft Analysis Services fournit plusieurs algorithmes de data mining, mais permet aussi à des tierces parties d'intégrer de nouveaux algorithmes dans le cadre d'application Analysis Services. Cette extensibilité permet aux classes de la Bibliothèque IMSL C# d'être intégrées à la plateforme BI SQL Server 2005. Pour plus d'informations, on se reportera à la Figure 3 ci-dessous ou reportez-vous à l'article Ajouter des algorithmes de data mining personnalisés au SQL Server 2005.

image
Figure 3. Architecture plug-in de data mining de SSAS 2005

Dans Microsoft Analysis Services, les algorithmes intégrés de data mining utilisent le Modèle Dimensionnel Unifié (UDM) pour accéder aux données. Le principe de l'UDM est de combiner des données de plusieurs sources de données et de les exposer comme des données virtuelles. Il crée une unique version de la vérité pour les données client. La capacité de créer un UDM rapidement dans le cadre d'application Analysis Services permet aux développeurs de se focaliser sur la logique de leur algorithme de data mining. Pour plus d'informations, on se reportera à la Figure 4 ci-dessous sur le Modèle Dimensionnel Unifié.

Outils clientsSources de données

image
Figure 4. Modèle Dimensionnel Unifié

I-D. Architecture plug-in

Le moteur de data mining communique avec les algorithmes plug-in via un jeu d'interfaces COM publiques (Component Object Model). Toutefois, la mise en ouvre de plug-ins managés nécessite d'utiliser l'assemblage DMPluginWrapper. Cet assemblage disponible gratuitement implémente les interfaces COM nécessaires à un plug-in et traduit les appels à l'interface en appels compatibles CLI. La Figure 5 montre comment des appels dans un plug-in managé sont traités dans Analysis Services.

Serveur ASAlgorithme plug-in managéAppel de fonction COMRésultats de fonction COMEncrypte les paramètres dans des types managés à l'appel d'une méthode managéeEncrypte les résultats dans des types non managés puis retourne les résultats au serveur

image
Figure 5. Plug-in managé de communication dans SSAS

précédentsommairesuivant

Copyright © 2008 Visual Numerics. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts. Droits de diffusion permanents accordés à Developpez LLC.