Exploration des théories de l’analyse des données : EDA, CDA et théorie fondée

L’analyse des données se réfère au processus d’extraction, d’inspection, de nettoyage et de modélisation des données. Elle révèle des informations et des aperçus utiles. Les entreprises font de l’analyse une partie intégrante de leurs opérations quotidiennes. Elles utilisent les conclusions suggérées par les données pour prendre des décisions commerciales éclairées.

Analyse exploratoire des données (EDA)

Cela consiste à rechercher des indices laissant entrevoir une signification plus large. On utilise des représentations visuelles pour dégager des modèles à partir des données. Il s’agit des tendances, de résultats inattendus et de déviations selon le modèle. Le résultat aidera à établir les bonnes questions à poser. Il détermine les domaines de données méritant d’être explorées plus avant. L’EDA s’appuie sur des techniques pour arriver à “Quoi d’autre ?” Un parcours typique comprend :

  • Établir une structure de données, des variables-clés et des intervalles de confiance et des marges d’erreur
  • Rechercher d’erreurs, de données manquantes et d’anomalies
  • Vérifier les hypothèses et les tester
  • Estimer les paramètres
  • Déterminer la meilleure façon d’expliquer les données avec les moins de variables prédictives possibles

Cette dernière étape est importante, et c’est là que la CDA entre en jeu.

Analyse des données de confirmation (CDA)

Elle ressemble à la phase de découverte d’un procès. L’inspecteur formule ses propres hypothèses sur la base des informations. Mais il ne pourra rien faire s’il ne peut pas prouver que chaque élément de preuve est exact. Les données fonctionnent à peu près de la même manière.

Pour que les ensembles de données soient précis, chaque élément d’information doit être exact. La CDA se concentre sur l’utilisation d’outils statistiques traditionnels, comme la confiance, l’inférence et la signification. Elles évaluent les données et remettent en question les hypothèses. Elles recherchent les mauvaises données et les réponses que présentent les anomalies. Tout écart par rapport à la norme peut ne pas être qu’une coïncidence.

Pour réussir, la CDA s’appuie sur l’analyse de régression, l’analyse de variation, le test d’hypothèses et l’élaboration d’estimations. Ce dernier doit respecter un certain niveau d’exactitude.

Théorie de l’analyse fondée

La théorie fondée sur les faits est une approche plus excentrique de l’analyse des données. Elle implique la collecte et l’analyse d’informations simultanément. Avec cette approche, les analystes peuvent révéler des informations au fur et à mesure qu’ils recueillent plus de données. Cependant, les données sont analysées quand l’exploration des données commence et se poursuit jusqu’à la fin de la recherche. Une fois que les mineurs de données estiment avoir recueilli suffisamment de preuves, ils passeront à l’étape suivante. C’est la construction d’un rapport ou d’un tableau de bord.

La deuxième étape est l’analyse exhaustive, l’indexation et l’exploration du texte pour en déterminer la pertinence. Ces sujets sont étiquetés selon leur pertinence. Finalement, des concepts ou des tendances sont révélés. Ils commencent à expliquer les singularités ressortant de l’étude.