Générateur de données

Aperçu

Le Générateur de données dans my8data permet de créer des données de test synthétiques à des fins de formation, de démonstration et de test. Au lieu d'utiliser des données de mesure réelles, vous pouvez utiliser le générateur de données pour créer délibérément des ensembles de données présentant des propriétés statistiques spécifiques.

Domaines d'application

Domaine d'application	Description
Formation et entraînement	Créez des données d'entraînement avec des propriétés connues pour s'exercer à l'interprétation de MFU, SPC et de la capabilité des processus
Démonstration	Montrez aux clients ou collègues les fonctionnalités de my8data avec des données réalistes mais anonymisées
Test de module	Vérifiez le fonctionnement correct des modules d'analyse avec des données dont les résultats attendus sont connus
Comparaison de méthodes	Comparez différentes procédures statistiques sur la base d'ensembles de données identiques
Analyse de sensibilité	Examinez comment les modifications des paramètres (p. ex. dispersion, moyenne) affectent les indicateurs de capabilité des processus

Info : Les données générées sont créées avec un générateur de nombres aléatoires et conviennent aux analyses statistiques. Elles ne représentent pas des valeurs de mesure réelles et ne doivent pas être utilisées pour les décisions de qualité en production.

Démarrage rapide

Générez un ensemble de données de test en quelques étapes :

Ouvrez le Générateur de données dans le menu principal
Sélectionnez le type de distribution souhaité (p. ex. distribution normale)
Définissez les paramètres (moyenne, écart-type, taille d'échantillon)
Cliquez sur Générer
Transférez les données générées directement dans un module d'analyse ou exportez-les

Conseil : Pour tester l'impact de différents scénarios, générez plusieurs ensembles de données avec des paramètres différents. Par exemple, vous pouvez simuler un processus capable (Cpk >= 1,67) et un processus non capable (Cpk < 1,00) et comparer les résultats.

Paramètres et configuration

Types de distribution

Le générateur de données supporte différents types de distribution pour simuler diverses situations de processus :

Type de distribution	Description	Application typique
Distribution normale	Forme de cloche symétrique ; la plus fréquente en pratique	Cas standard pour la plupart des processus de fabrication
Distribution uniforme	Toutes les valeurs dans la plage sont également probables	Simulation d'un processus sans tendance centrale claire
Distribution log-normale	Asymétrique à droite ; uniquement valeurs positives	Rugosité, tailles de particules, durées d'arrêt
Distribution de Weibull	Forme flexible ; peut être asymétrique ou symétrique	Analyses de durée de vie, fiabilité

Paramètres configurables

Distribution normale

Paramètre	Description	Valeur exemple	Influence
Moyenne (μ)	Centre de la distribution	10,00	Décale l'ensemble de la distribution vers la gauche ou la droite
Écart-type (σ)	Largeur de la distribution	0,02	Les valeurs plus grandes créent une dispersion plus large
Taille d'échantillon (n)	Nombre de valeurs à générer	100	Plus de valeurs augmentent la puissance statistique

Distribution uniforme

Paramètre	Description	Valeur exemple
Minimum	Limite inférieure de la plage de valeurs	9,90
Maximum	Limite supérieure de la plage de valeurs	10,10
Taille d'échantillon (n)	Nombre de valeurs à générer	100

Distribution log-normale

Paramètre	Description	Valeur exemple
μ (log)	Moyenne de la caractéristique logarithmée	2,30
σ (log)	Écart-type de la caractéristique logarithmée	0,10
Taille d'échantillon (n)	Nombre de valeurs à générer	100

Distribution de Weibull

Paramètre	Description	Valeur exemple
Paramètre de forme (k)	Détermine la forme de la distribution	3,5
Paramètre d'échelle (λ)	Durée de vie caractéristique / mise à l'échelle	10,00
Taille d'échantillon (n)	Nombre de valeurs à générer	100

Info : Pour la distribution de Weibull, un paramètre de forme k < 1 génère une distribution décroissante (défaillances précoces), k = 1 correspond à une distribution exponentielle (défaillances aléatoires), et k > 3 donne une distribution approximativement en forme de cloche (défaillances par fatigue).

Options avancées

En plus des paramètres de base, vous pouvez effectuer les paramètres avancés suivants :

Option	Description	Valeur par défaut
Graine (Seed)	Valeur initiale du générateur de nombres aléatoires ; permet des résultats reproductibles	Aléatoire
Décimales	Nombre de chiffres après la virgule	3
Ajouter des valeurs aberrantes	Ajoute intentionnellement des valeurs aberrantes à l'ensemble de données	Désactivé
Nombre de valeurs aberrantes	Nombre de valeurs aberrantes à insérer	0
Plage de valeurs aberrantes	Plage dans laquelle se situent les valeurs aberrantes	±4σ à ±6σ

Conseil : Utilisez la fonction Seed si vous avez besoin de résultats reproductibles. Avec la même graine et les mêmes paramètres, vous obtenez toujours l'ensemble de données identique. Cela est particulièrement utile pour les formations où tous les participants doivent travailler avec les mêmes données.

Exemples pratiques

Exemple 1 : Simuler un processus capable

Objectif : Générer un ensemble de données avec Cpk >= 1,67

Paramètre	Valeur	Justification
Distribution	Distribution normale	Cas standard
Moyenne	10,000	Centré sur la valeur nominale
Écart-type	0,010	Faible dispersion
Taille d'échantillon	100	Suffisant pour le calcul de Ppk
LSU	10,050	Plage de tolérance = 0,100 mm
LSL	9,950

Résultat attendu : Cp ≈ Cpk ≈ 1,67 (plage de tolérance 0,100 / 6 * 0,010 = 1,67)

Exemple 2 : Simuler un processus décentré

Objectif : Générer un ensemble de données avec Cp bon, mais Cpk faible

Paramètre	Valeur	Justification
Distribution	Distribution normale	Cas standard
Moyenne	10,025	Intentionnellement décalée par rapport à la valeur nominale
Écart-type	0,010	Même dispersion que l'exemple 1
Taille d'échantillon	100
LSU	10,050
LSL	9,950

Résultat attendu : Cp ≈ 1,67, mais Cpk ≈ 0,83 (processus à faible dispersion, mais décentré)

Attention : Les données générées synthétiquement suivent exactement la distribution choisie. Les données de processus réels s'écartent souvent des distributions idéales en pratique. Les résultats obtenus avec des données générées sont donc souvent « plus propres » que les analyses réelles.

Générateur de données

Générateur de données

Aperçu

Domaines d'application

Démarrage rapide

Paramètres et configuration

Types de distribution

Paramètres configurables

Distribution normale

Distribution uniforme

Distribution log-normale

Distribution de Weibull

Options avancées

Exemples pratiques

Exemple 1 : Simuler un processus capable

Exemple 2 : Simuler un processus décentré

Essayer par vous-même