Big data et DWH: ce que permet une bonne gestion des données

Le terme «big data» est sur toutes les lèvres. Les livres foisonnent sur les chances et les risques des big data; mais leur potentiel est incontesté. L’«Eisbrecher» s’est emparé du sujet et montre comment l’OFIT peut développer des solutions adaptées pour ses clients par l’intermédiaire de l’outil Data Warehouse.

Quand on parle de données, c’est un terme universel: big data. Si l’on s’intéresse à de grandes entreprises informatiques, comme Amazon, Google, Apple ou Facebook, les big data entrent rapidement en jeu. On dit souvent qu’ils sont une mine d’or pour les entrepreneurs, mais un danger pour les particuliers. Mais qu’est-ce qui se cache derrière le terme «big data»?

Tout d’abord, le terme «big data» désigne un ensemble de données qui sont trop volumineuses, trop complexes, trop peu structurées et trop rapidement disponibles pour pouvoir être exploitées avec les méthodes traditionnelles de traitement de données. Il est aussi volontiers utilisé comme terme générique pour les technologies et innovations numériques qui influencent notre quotidien et ont conduit à un changement sociétal. Il désigne aussi la procédure consistant à inclure toutes les possibilités de traitement de données. Et aujourd’hui, les données sont partout: au travail, au téléphone, lors d’achats, en voyage, pendant le jogging, sur Internet et lors de la publication de messages sur les réseaux sociaux. De toute évidence, la montagne de données croît de manière extrêmement forte et rapide: en 2017, la taille estimée de l’univers numérique était de 25 zettaoctets (Zo). D’ici 2025, la montagne des données devrait dépasser les 163 Zo, ce qui correspond à la multiplication par dix des volumes de données de 2016. 1 Zo correspond à 1015 mégaoctets (Mo), également écrit 1 000 000 000 000 000 Mo. Les volumes de données qui sont transportés chaque jour entre les départements et les offices au sein de l’administration fédérale ne sont pas moins impressionnants.

Le potentiel des big data est également jugé élevé dans l’administration fédérale. C’est ce qui ressort d’une expertise sur la politique des données de la Confédération commandée par l’Office fédéral de la communication (OFCOM): «Le big data offre de précieux atouts et avantages, comme le gain de nouvelles connaissances et la découverte de nouvelles interactions, la personnalisation d’offres et d’informations, de meilleures prévisions dans des domaines très variées, une plus grande flexibilité des entreprises et des organisations, l’optimisation des processus ainsi que la possibilité de prendre des décisions en se basant davantage sur des faits.»

À l’OFIT, l’unité «Business Intelligence - Data Warehouse - Statistiques» (BDS) est l’interlocuteur principal sur les questions de big data. Peter Mühlemann et son équipe maîtrisent la gestion et l’exploitation de gros volumes de données. «Nous pouvons gérer d’importants volumes de données et avons les outils et le savoir-faire pour les exploiter», indique Peter Mühlemann. Il existe de nombreuses possibilités d’exploiter et de gérer des données. Le défi consiste à s’accorder sur une compréhension commune concernant les données utilisées. «Bien connaître ses propres données est important pour avoir une bonne base de discussion. Plus le client en sait au sujet de ses données, des sources et de l’objectif de l’analyse, plus nous pouvons organiser la collaboration de manière efficace», explique Peter Mühlemann.

Des chiffres actuels et des estimations pertinentes à portée de clic

Résultat: le client dispose d’un Data Warehouse (DWH). En fait, un DWH est une base de données centrale optimisée qui rassemble automatiquement et régulièrement les données provenant de diverses sources, afin de pouvoir ensuite les analyser et les interpréter avec les outils correspondants. L’avantage pour le client? Il peut utiliser ses données pour analyser l’évolution de l’activité et soulager ainsi les systèmes sources. En un clic, il obtient une analyse des données actuelles, sous forme de rapport ou de cockpit. Ces données, dans la mesure où elles sont enregistrées de manière centralisée, peuvent être comparées et comprises à tout moment et montrent la vérité à l’instant T (Single Point of Truth) des données. De nombreux clients ont ainsi la possibilité, pour la première fois, de rassembler de manière simple des données provenant de différentes sources et de tirer de nouvelles conclusions des résultats. Ce faisant, les données montrent la réalité, non seulement les aspects positifs, mais aussi les aspects négatifs. On repère des faits et des évolutions qui n’avaient pas encore pu être identifiés, puisque les données nécessaires à cet effet n’étaient pas disponibles dans la qualité requise. «C’est la raison pour laquelle la mission centrale d’un DWH est celle d’un système de gestion de l’information», précise Peter Mühlemann.

Daten-grafik

La voie vers le DWH

Sans implication et volonté du client, un DWH qui fonctionne bien ne peut que difficilement être mis en œuvre. «Quand un office a des exigences qui plaident en faveur d’un DWH, des processus doivent être définis en parallèle. Si cela n’a pas encore été fait, l’office désigne une ou, de préférence, plusieurs personnes qui sont compétentes pour leurs propres données et ont la compréhension nécessaire des données. La connaissance des propres données est un point éminemment important pour les clients, tant dans la phase initiale que pour l’avenir», explique Peter Mühlemann. L’unité BDS de l’OFIT analyse alors les sources de données existantes avec le client (analyse du système source). Le résultat de cette analyse permet ensuite de savoir comment les données ont été obtenues et quelle est leur qualité. Un rapport fournit la vue d’ensemble nécessaire à cet égard. Ensuite, si l’on sait clairement quelles données existent, l’équipe BDS se tourne vers les groupes de travail pour réaliser plus en profondeur le sens des données. Après l’analyse, un prototype est imaginé sur la base des exigences définies par le client. «Quiconque souhaite un DWH doit effectuer ces travaux préparatoires, tenir compte des coûts associés et veiller à son financement», précise Peter Mühlemann, en ajoutant aussitôt: «Mais le processus dans son ensemble est utile aux deux parties. Le client obtient une compréhension élevée de ses données et peut mieux appréhender les évolutions actuelles et futures. Les données sont la fortune du client. L’OFIT, en tant que fournisseur, comprend ainsi mieux le client, ce qui permet d’éviter des malentendus et de réaliser des économies. En outre, il est aussi utile que les exigences soient toujours élaborées conjointement avec les spécialistes. Grâce à leur prise directe avec les domaines spécialisés, les voies de communication sont très courtes, ce qui permet de réagir rapidement quand des modifications sont nécessaires. «Nous avons très souvent des nouvelles versions, de sorte que les délais de réalisation correspondants au sein du DWH sont très courts», indique Peter Mühlemann. La relation client est ainsi conçue de façon efficace.

Deux idées directrices du Data Warehouse

1. Intégration de données provenant de stocks de données distincts et structurés différemment afin, au sein du Data Warehouse, de disposer d’une vue globale des données sources et donc de permettre des analyses étendues.

2. Séparation des données qui seront utilisées pour l’activité opérationnelle de celles qui seront utilisées dans le Data Warehouse, notamment pour l’établissement de rapports, le soutien à la prise de décisions, l’analyse de l’activité, le controlling et la gestion d’entreprise. 


Contact à l'OFIT:

Peter Mühlemann
Responsable Business-Intelligence - Data Warehouse - Statistiques
Tél.: 058 468 60 08

Texte: Rinaldo Tibolla

 

 

https://www.bit.admin.ch/content/bit/fr/home/documentation/le-magazine-eisbrecher/eisbrecher-archiv/kundenzeitschrift-eisbrecher-ausgabe-71/big-data-und-dwh.html