my8data

Datengenerator

Synthetische Daten erzeugen

Datengenerator

Übersicht

Der Datengenerator in my8data ermöglicht das Erstellen von synthetischen Testdaten für Schulungs-, Demonstrations- und Testzwecke. Anstatt reale Messdaten verwenden zu müssen, können Sie mit dem Datengenerator gezielt Datensätze erzeugen, die bestimmte statistische Eigenschaften aufweisen.

Datengenerator Übersicht

Einsatzgebiete

Einsatzgebiet Beschreibung
Schulung und Training Erstellen Sie Übungsdaten mit bekannten Eigenschaften, um die Interpretation von MFU, SPC und Prozessfähigkeit zu trainieren
Demonstration Zeigen Sie Kunden oder Kollegen die Funktionen von my8data mit realistischen, aber anonymisierten Daten
Modultest Überprüfen Sie die korrekte Funktion der Analysemodule mit Daten, deren erwartete Ergebnisse bekannt sind
Methodenvergleich Vergleichen Sie verschiedene statistische Verfahren anhand identischer Datensätze
Sensitivitätsanalyse Untersuchen Sie, wie sich Änderungen an Parametern (z. B. Streuung, Mittelwert) auf die Prozessfähigkeitskennwerte auswirken

Info: Die generierten Daten werden mit einem Zufallsgenerator erzeugt und sind für statistische Analysen geeignet. Sie stellen keine realen Messwerte dar und sollten nicht für produktive Qualitätsentscheidungen verwendet werden.

Schnelleinstieg

So erzeugen Sie in wenigen Schritten einen Testdatensatz:

  1. Öffnen Sie den Datengenerator im Hauptmenü
  2. Wählen Sie den gewünschten Verteilungstyp (z. B. Normalverteilung)
  3. Legen Sie die Parameter fest (Mittelwert, Standardabweichung, Stichprobengröße)
  4. Klicken Sie auf Generieren
  5. Übernehmen Sie die erzeugten Daten direkt in ein Analysemodul oder exportieren Sie sie

Tipp: Um die Auswirkung verschiedener Szenarien zu testen, erzeugen Sie mehrere Datensätze mit unterschiedlichen Parametern. Beispielsweise können Sie einen fähigen Prozess (Cpk >= 1,67) und einen nicht fähigen Prozess (Cpk < 1,00) simulieren und die Ergebnisse vergleichen.


Parameter und Konfiguration

Verteilungstypen

Der Datengenerator unterstützt verschiedene Verteilungstypen, um unterschiedliche Prozesssituationen zu simulieren:

Verteilungstyp Beschreibung Typische Anwendung
Normalverteilung Symmetrische Glockenform; am häufigsten in der Praxis Standardfall für die meisten Fertigungsprozesse
Gleichverteilung Alle Werte im Bereich gleich wahrscheinlich Simulation eines Prozesses ohne klare zentrale Tendenz
Log-Normalverteilung Rechtsschief; nur positive Werte Rauheit, Partikelgrößen, Ausfallzeiten
Weibull-Verteilung Flexible Form; kann schief oder symmetrisch sein Lebensdaueranalysen, Zuverlässigkeit

Verteilungstypen

Konfigurierbare Parameter

Normalverteilung

Parameter Beschreibung Beispielwert Einfluss
Mittelwert (μ) Zentrum der Verteilung 10,00 Verschiebt die gesamte Verteilung nach links oder rechts
Standardabweichung (σ) Breite der Verteilung 0,02 Größere Werte erzeugen breitere Streuung
Stichprobengröße (n) Anzahl der zu erzeugenden Werte 100 Mehr Werte erhöhen die statistische Aussagekraft

Gleichverteilung

Parameter Beschreibung Beispielwert
Minimum Untere Grenze des Wertebereichs 9,90
Maximum Obere Grenze des Wertebereichs 10,10
Stichprobengröße (n) Anzahl der zu erzeugenden Werte 100

Log-Normalverteilung

Parameter Beschreibung Beispielwert
μ (log) Mittelwert des logarithmierten Merkmals 2,30
σ (log) Standardabweichung des logarithmierten Merkmals 0,10
Stichprobengröße (n) Anzahl der zu erzeugenden Werte 100

Weibull-Verteilung

Parameter Beschreibung Beispielwert
Formparameter (k) Bestimmt die Form der Verteilung 3,5
Skalenparameter (λ) Charakteristische Lebensdauer / Skalierung 10,00
Stichprobengröße (n) Anzahl der zu erzeugenden Werte 100

Info: Bei der Weibull-Verteilung erzeugt ein Formparameter k < 1 eine fallende Verteilung (Frühausfälle), k = 1 entspricht einer Exponentialverteilung (zufällige Ausfälle), und k > 3 ergibt eine annähernd glockenförmige Verteilung (Ermüdungsausfälle).

Erweiterte Optionen

Zusätzlich zu den Grundparametern können Sie folgende erweiterte Einstellungen vornehmen:

Option Beschreibung Standardwert
Startwert (Seed) Startwert für den Zufallsgenerator; ermöglicht reproduzierbare Ergebnisse Zufällig
Dezimalstellen Anzahl der Nachkommastellen 3
Ausreißer hinzufügen Fügt dem Datensatz gezielt Ausreißer hinzu Deaktiviert
Anzahl Ausreißer Wie viele Ausreißer eingefügt werden sollen 0
Ausreißer-Bereich In welchem Bereich die Ausreißer liegen ±4σ bis ±6σ

Tipp: Verwenden Sie die Seed-Funktion, wenn Sie reproduzierbare Ergebnisse benötigen. Mit demselben Seed und denselben Parametern erhalten Sie immer den identischen Datensatz. Das ist besonders nützlich für Schulungen, bei denen alle Teilnehmer mit denselben Daten arbeiten sollen.

Praxisbeispiele

Beispiel 1: Fähiger Prozess simulieren

Ziel: Datensatz mit Cpk >= 1,67 erzeugen

Parameter Wert Begründung
Verteilung Normalverteilung Standardfall
Mittelwert 10,000 Auf Sollwert zentriert
Standardabweichung 0,010 Geringe Streuung
Stichprobengröße 100 Ausreichend für Ppk-Berechnung
OSG 10,050 Toleranzbreite = 0,100 mm
USG 9,950

Erwartetes Ergebnis: Cp ≈ Cpk ≈ 1,67 (Toleranzbreite 0,100 / 6 * 0,010 = 1,67)

Beispiel 2: Dezentrierter Prozess simulieren

Ziel: Datensatz mit Cp gut, aber Cpk schlecht

Parameter Wert Begründung
Verteilung Normalverteilung Standardfall
Mittelwert 10,025 Absichtlich neben Sollwert
Standardabweichung 0,010 Gleiche Streuung wie Beispiel 1
Stichprobengröße 100
OSG 10,050
USG 9,950

Erwartetes Ergebnis: Cp ≈ 1,67, aber Cpk ≈ 0,83 (Prozess streut schmal, ist aber dezentriert)

Warnung: Synthetisch erzeugte Daten folgen exakt der gewählten Verteilung. Reale Prozessdaten weichen in der Praxis häufig von idealen Verteilungen ab. Die mit generierten Daten erzielten Ergebnisse sind daher oft "sauberer" als reale Analysen.

Jetzt selbst ausprobieren

Erstellen Sie Ihre eigenen MSA-, SPC- und Fähigkeitsanalysen mit my8data — der webbasierten Plattform für Qualitätsmanagement.

Jetzt registrieren