Æ»¹ûÒùÔº

Qu’est-ce que la DataBank?

La DataBank est le référentiel de données central du Labosphère de données. Les membres du personnel enseignant et de la communauté étudiante de la Faculté de gestion Desautels ainsi que les spécialistes du secteur peuvent la consulter. Elle renferme le savoir collectif du corps professoral de la Faculté et constitue l’épine dorsale de l’exploration et de l’innovation fondées sur les données. Elle permet aux spécialistes de l’analytique d’accéder facilement aux données du Labosphère de données.

Ce que la DataBank vous offre

La DataBank donne accès à des ensembles de données publics et privés dans un éventail de disciplines.

  1. Avantages pour le corps professoral
    La DataBank renferme des ensembles de données dont se servent les professeurs et professeures de la Faculté dans leurs recherches, ainsi que des données supplémentaires utiles dans les études connexes.

  2. Avantages pour les spécialistes des secteurs
    La DataBank offre des ensembles de données uniques d’une grande valeur qui sont tirés de recherches universitaires ou propres aux secteurs. Elle comble ainsi le fossé entre le milieu universitaire et le monde des affaires et favorise une analyse approfondie.

  3. Fonctions supplémentaires pour les entreprises clientes
    La DataBank fournit un environnement d’analyse de données prêtes à l’emploi, aide à relever les défis commerciaux au moyen de la validation de principe, facilite l’itération rapide et permet de valider la faisabilité des solutions.

Résultats préliminairesÌý: analyser des ensembles de données uniques

Consultation de

Ìý
8 professeur(e)s

en gestion des opérations, en marketing, en systèmes d’information et en finance

Choix de

Ìý
34 ensembles de données

dans les secteurs du commerce de détail, du divertissement, des chaînes de blocs, des services sociaux et de la mode

Extraction, transformation et chargement de
4 ensembles de données
  1. Arrestations du service de police de New York
  2. Films et émissions sur Netflix
  3. Tarifs d’Uber
  4. Évaluations d’Amazon (2018)


Création du référentiel

Infrastructure générale

La DataBank regroupe des ensembles de données riches et diversifiés provenant de différentes sources et classés par des analystes.

Les données sont recueillies sous divers formats, y compris sous forme structurée (bases de données CSV, JSON et SQL, interfaces de programmation d’applications et fichiers Parquet) ou non structurée (documents PDF). Elles sont ensuite intégrées dans la DataBank à l’aide des connecteurs du service infonuagique Microsoft Azure Data Factory. Une fois traitées, les données sont stockées dans Azure selon une structure à niveaux multiples en fonction de l’étape de traitement.

Les données de la DataBank sont classées selon trois étapesÌý:


Bronze

Données brutes

Argent

Données soumises au processus d’extraction, de transformation et de chargement des données

Or

Données enrichies grâce à l’apprentissage automatique


La majorité des données de la DataBank sont classées Argent et peuvent être soumises à des analyses descriptives ou en temps réel avec des données classées Bronze. Les ensembles de données qui ont été traités grâce à l’apprentissage automatique à la demande de clients seront classés Or.

Utilisations du référentiel
  1. Les utilisateurs et utilisatrices interagissent avec les ensembles de données stockés au moyen des diverses technologies et interfaces des services Microsoft Azure. Les données sont analysées grâce à Azure Synapse et soumises aux processus d’apprentissage automatique d’Azure Machine Learning ainsi que d’autres outils comme PyTorch, PyCharm, Python et TensorFlow.
  2. Pour l’interrogation et la gestion des données, vous pouvez utiliser des services comme Azure Data Studio et SQL sans serveur. Pour présenter les données, vous pouvez utiliser Azure Static Web Apps et des interfaces de programmation d’applications, notamment avec des applications Web qui utilisent le langage HTML et les feuilles de style en cascade.
  3. Pour la visualisation et l’analyse de données, vous pouvez utiliser Power BI et Tableau. Ils permettent entre autres aux gestionnaires de projets, aux spécialistes des ventes et du marketing, aux développeurs et développeuses, aux experts et expertes en science des données et aux analystes de données d’interpréter et d’utiliser les données efficacement.
  4. Enfin, une interface semblable à celles d’OpenAI et de ChatGPT offre une autre méthode d’interaction. Les utilisateurs et utilisatrices peuvent accéder aux ensembles de données et les interroger sous forme de conversation. Cette méthode est idéale pour les personnes qui possèdent peu de compétences techniques.
ɳپ±±ç³Ü±ð³Ù³Ù±ð²õ:&²Ô²ú²õ±è;

´¡³¦³Ù³Ü²¹±ô¾±³Ùé²õ

ɱ¹Ã©²Ô±ð³¾±ð²Ô³Ù²õ

Il n'y a aucun événement disponible.

Back to top