mercredi 3 juin 2009

Qualité de données avec Talend Open Profiler (TOP)

Il ne faut jamais perdre de vue que le succès d'une entreprise dépend largement du niveau de qualité de ses données et ce indépendamment du secteur d'activité et des applications utilisées.

Les données sont la matière première de la décision.

Talend lance donc un outils open source dévaluation de la qualité des données. [Documentation TOP (version anglaise)]

Il s'agit d'un logiciel de profiling qui consiste à évaluer la qualité de données pour limiter les pertes d'efficacité au sein de l'entreprise.
Cet outils pourra être utiliser afin d'analyser la complétude d'une adresse client, fournir des indicateurs pour certains éléments de données et enfin publier ses résultats sous forme de graphiques.

Une étude comparative des outils et technique de data profiling réalisée par la société de conseil Ysance et l'école Polytech' de Nantes qui comparait les solutions : Talend Open Profiler (Talend)/Data Quality for Data Integrator (Oracle)/SQL Server (Microsoft) a montré que les points fort de TOP sont :
  • Téléchargement libre et gratuit ne nécessitant pas d'installation
  • Connexion à la majorité des bases existantes
  • Système de base de métadonnées
  • Fonctionnement en mode non-connecté, récupération et stockage des métadonnées
  • Prise en main simple et intuitive
  • Présence de graphiques
  • Forte documentation et présence d'une communauté intéressante
Aujourd'hui TOP est le 1er outils open source dans le domaine de la gestion de la qualité de données, ce logiciel constitue une alternative aux solutions propriétaires concurrentes (Informatica, Oracle, DataFlux, ...)