Générateur de données

Générer des données synthétiques

Markdown

Générateur de données

Aperçu

Le Générateur de données dans my8data permet de créer des données de test synthétiques à des fins de formation, de démonstration et de test. Au lieu d'utiliser des données de mesure réelles, vous pouvez utiliser le générateur de données pour créer délibérément des ensembles de données présentant des propriétés statistiques spécifiques.

Aperçu du générateur de données

Domaines d'application

Domaine d'application Description
Formation et entraînement Créez des données d'entraînement avec des propriétés connues pour s'exercer à l'interprétation de MFU, SPC et de la capabilité des processus
Démonstration Montrez aux clients ou collègues les fonctionnalités de my8data avec des données réalistes mais anonymisées
Test de module Vérifiez le fonctionnement correct des modules d'analyse avec des données dont les résultats attendus sont connus
Comparaison de méthodes Comparez différentes procédures statistiques sur la base d'ensembles de données identiques
Analyse de sensibilité Examinez comment les modifications des paramètres (p. ex. dispersion, moyenne) affectent les indicateurs de capabilité des processus

Info : Les données générées sont créées avec un générateur de nombres aléatoires et conviennent aux analyses statistiques. Elles ne représentent pas des valeurs de mesure réelles et ne doivent pas être utilisées pour les décisions de qualité en production.

Démarrage rapide

Générez un ensemble de données de test en quelques étapes :

  1. Ouvrez le Générateur de données dans le menu principal
  2. Sélectionnez le type de distribution souhaité (p. ex. distribution normale)
  3. Définissez les paramètres (moyenne, écart-type, taille d'échantillon)
  4. Cliquez sur Générer
  5. Transférez les données générées directement dans un module d'analyse ou exportez-les

Conseil : Pour tester l'impact de différents scénarios, générez plusieurs ensembles de données avec des paramètres différents. Par exemple, vous pouvez simuler un processus capable (Cpk >= 1,67) et un processus non capable (Cpk < 1,00) et comparer les résultats.


Paramètres et configuration

Types de distribution

Le générateur de données supporte différents types de distribution pour simuler diverses situations de processus :

Type de distribution Description Application typique
Distribution normale Forme de cloche symétrique ; la plus fréquente en pratique Cas standard pour la plupart des processus de fabrication
Distribution uniforme Toutes les valeurs dans la plage sont également probables Simulation d'un processus sans tendance centrale claire
Distribution log-normale Asymétrique à droite ; uniquement valeurs positives Rugosité, tailles de particules, durées d'arrêt
Distribution de Weibull Forme flexible ; peut être asymétrique ou symétrique Analyses de durée de vie, fiabilité

Types de distribution

Paramètres configurables

Distribution normale

Paramètre Description Valeur exemple Influence
Moyenne (μ) Centre de la distribution 10,00 Décale l'ensemble de la distribution vers la gauche ou la droite
Écart-type (σ) Largeur de la distribution 0,02 Les valeurs plus grandes créent une dispersion plus large
Taille d'échantillon (n) Nombre de valeurs à générer 100 Plus de valeurs augmentent la puissance statistique

Distribution uniforme

Paramètre Description Valeur exemple
Minimum Limite inférieure de la plage de valeurs 9,90
Maximum Limite supérieure de la plage de valeurs 10,10
Taille d'échantillon (n) Nombre de valeurs à générer 100

Distribution log-normale

Paramètre Description Valeur exemple
μ (log) Moyenne de la caractéristique logarithmée 2,30
σ (log) Écart-type de la caractéristique logarithmée 0,10
Taille d'échantillon (n) Nombre de valeurs à générer 100

Distribution de Weibull

Paramètre Description Valeur exemple
Paramètre de forme (k) Détermine la forme de la distribution 3,5
Paramètre d'échelle (λ) Durée de vie caractéristique / mise à l'échelle 10,00
Taille d'échantillon (n) Nombre de valeurs à générer 100

Info : Pour la distribution de Weibull, un paramètre de forme k < 1 génère une distribution décroissante (défaillances précoces), k = 1 correspond à une distribution exponentielle (défaillances aléatoires), et k > 3 donne une distribution approximativement en forme de cloche (défaillances par fatigue).

Options avancées

En plus des paramètres de base, vous pouvez effectuer les paramètres avancés suivants :

Option Description Valeur par défaut
Graine (Seed) Valeur initiale du générateur de nombres aléatoires ; permet des résultats reproductibles Aléatoire
Décimales Nombre de chiffres après la virgule 3
Ajouter des valeurs aberrantes Ajoute intentionnellement des valeurs aberrantes à l'ensemble de données Désactivé
Nombre de valeurs aberrantes Nombre de valeurs aberrantes à insérer 0
Plage de valeurs aberrantes Plage dans laquelle se situent les valeurs aberrantes ±4σ à ±6σ

Conseil : Utilisez la fonction Seed si vous avez besoin de résultats reproductibles. Avec la même graine et les mêmes paramètres, vous obtenez toujours l'ensemble de données identique. Cela est particulièrement utile pour les formations où tous les participants doivent travailler avec les mêmes données.

Exemples pratiques

Exemple 1 : Simuler un processus capable

Objectif : Générer un ensemble de données avec Cpk >= 1,67

Paramètre Valeur Justification
Distribution Distribution normale Cas standard
Moyenne 10,000 Centré sur la valeur nominale
Écart-type 0,010 Faible dispersion
Taille d'échantillon 100 Suffisant pour le calcul de Ppk
LSU 10,050 Plage de tolérance = 0,100 mm
LSL 9,950

Résultat attendu : Cp ≈ Cpk ≈ 1,67 (plage de tolérance 0,100 / 6 * 0,010 = 1,67)

Exemple 2 : Simuler un processus décentré

Objectif : Générer un ensemble de données avec Cp bon, mais Cpk faible

Paramètre Valeur Justification
Distribution Distribution normale Cas standard
Moyenne 10,025 Intentionnellement décalée par rapport à la valeur nominale
Écart-type 0,010 Même dispersion que l'exemple 1
Taille d'échantillon 100
LSU 10,050
LSL 9,950

Résultat attendu : Cp ≈ 1,67, mais Cpk ≈ 0,83 (processus à faible dispersion, mais décentré)

Attention : Les données générées synthétiquement suivent exactement la distribution choisie. Les données de processus réels s'écartent souvent des distributions idéales en pratique. Les résultats obtenus avec des données générées sont donc souvent « plus propres » que les analyses réelles.

Jetzt selbst ausprobieren

Créez vos propres analyses MSA, SPC et de capabilité avec my8data — la plateforme web pour la gestion de la qualité.

S'inscrire maintenant