L’intelligence d’affaires et l’exploration de données (Data Mining)

C’est maintenant connu, l’intelligence d’affaires (BI), c’est branché et avant-gardiste. Plusieurs entreprises consacrent beaucoup d’énergie à la mise en place et à la maintenance de leurs systèmes d’affaires intelligents, que ce soit au niveau de l’entrepôt de données (Data Warehouse), ou encore d’un centre de rapports opérationnels. C’est un monde avec plein de possibilités, voire un univers avec des ressources infinies. Il ne semble y avoir que des avantages, mais est-ce que le jeu en vaut vraiment la chandelle ? Est-ce rentable et productif d’y mettre autant d’effort, où est-ce un luxe que seules les grandes entreprises peuvent se permettre ? Il n’y a pas de réponse unique, tout comme il n’y a pas deux entreprises avec des besoins identiques, mais je vous dirais qu’avoir une vision mieux éclairée, basée sur différents axes d’affaires définis par le client, au moment où le besoin analytique se fait sentir, apporte de la confiance et de l’assurance dans la prise de décisions à court, moyen et long terme, et ça, c’est très bien!

90% des données numériques dans le monde ont été créées au cours des deux dernières années seulement.

Source: IBM (2013)

Commençons du début, qu’est-ce que l’intelligence d’affaires (Business Intelligence)? Il s’agit d’un ensemble de principes et méthodes pour extraire de l’information et des connaissances utiles à partir des données. Que ce soit pour les prévisions, l’exploration ou l’investigation, l’intérêt reste toujours le même : les données. On peut les extraire et les afficher de différentes façons :

  • Représentations graphiques
  • Rapports sommaires et/ou détaillés
  • Visualisation interactive (i.e. formulaire dynamique)
  • Autres

Parlons maintenant d’un aspect particulièrement actuel et bien répandu : le forage ou l’exploration de données (Data Mining). Souvent utilisée pour explorer, celui-ci consiste à extraire les connaissances à partir des données, beaucoup de données généralement, à l’aide de structures intéressantes, ou des motifs selon des critères fixés au préalable. En trois étapes, cela représente : collecter, analyser et présenter les données au client. Pour ce faire, il y a la compréhension du besoin et la compréhension des données, la préparation de celles-ci et l’application des techniques. Examinons le tableau ci-dessous :

Data minning

« Data mining will become much more important and companies will throw away nothing about their customers because it will be so valuable. If you’re not doing this, you’re out of business »

– Dr. Arno Penzias, lauréat d’un prix Nobel en physique

Chaque étape se divise en sous-étapes, ce qui peut complexifier une solution qui semble simple à la base. Car il y a des défis en « BI » comme dans tout domaine technologique, je pense à l’historique des données et à la façon de les jumeler aux données courantes, aux types de données incompatibles, à l’expertise requise, aux choix technologiques à faire tout en tenant compte des performances. Il n’est pas rare que des systèmes doivent travailler jour et nuit pour préparer les données pour le jour J. D’ailleurs, il est à noter qu’en exploration de données (data mining), le focus de l’utilisateur n’est pas sur la génération de formule, mais sur la performance de l’algorithme par rapport à ses objectifs.

La préparation des données est la partie technique du processus et se fait en quatre étapes : la consolidation, la simplification (clean-up), la transformation et la diminution (reduction). Elle a comme source les données réelles, et comme destination, un système de base de données préparées. Pour la portion technique de l’article, il y a plusieurs types de données à considérer, par exemple les données catégoriques (Nominal et Ordinal) ainsi que numériques (Intervalle et Ratio).

Données catégoriques

  • Proviennent souvent de la conversion d’une variable numérique (nominal)
    • Ex. : conversion de l’âge en groupe d’âge
  • Ajoutent la notion d’ordre entre les valeurs possibles (ordinal)
    • Ex. : indice de solvabilité (bas, moyen, élevé)

Données numériques

  • Variables servant à mesurer une certaine quantité
    • Ex. : âge, nombre d’enfants, revenu familial, etc.

Autres données

  • Images, audio, texte, etc.

Pour conclure ce billet, j’aimerais insister sur le fait que l’exploration de données octroie un avantage concurrentiel particulièrement attrayant. Cette technique, déjà bien implantée dans les industries en forte croissance et dans les domaines d’affaires où les choses vont vite, est dorénavant applicable à la plupart des sphères de l’activité humaine, comme la recherche scientifique et la sécurité publique. Avec ces nouvelles connaissances acquises, les entreprises améliorent et accélèrent la prise de décisions, menant à des solutions d’affaires originales et payantes. Elles procurent un savoir insoupçonné et permettent de prendre des décisions mieux éclairées sur les habitudes des consommateurs, par exemple. L’exploration de données (Data Mining) permet de mieux connaître vos clients, de savoir ce qu’ils veulent réellement, et savoir… c’est pouvoir!

Au cours des prochaines semaines, nous approfondirons davantage les multiples facettes à l’intelligence d’affaires, ainsi que les techniques diverses qui permettent de l’exercer. Je pense entre autres à l’entreposage de données (data warehousing), aux systèmes d’aide décisionnelle, ou encore au centre de rapports opérationnels. Cela me semble être un sujet inépuisable, à mon grand bonheur et, je l’espère, au vôtre également!

D’ici là, je vous remercie de votre attention et je vous souhaite une bonne exploration de données !

Laisser un commentaire