Wie können wir Ihnen behilflich sein?

Verteilungen

Was ist eine Verteilung?

Eine Verteilung beschreibt, wie unterschiedliche Werte in einer Menge von Daten oder Ereignissen auftreten. Sie zeigt, welche Werte häufiger oder seltener sind und kann in Form von Funktionen, Grafiken oder Tabellen dargestellt werden. Verteilungen helfen, Daten zu verstehen und Muster zu erkennen. Verteilungen können somit helfen, Muster in Daten zu erkennen.

 

Warum wird es in der Analyse der Herzfrequenzvariabilität verwendet?

Die grafische Darstellung der Verteilung eines bestimmten Parameters kann helfen Ausreißer sowie Anomalien im gesamten Datensatz darzustellen. 

Verschiedene Formen von Verteilungen in der HRV können Informationen über das autonome Nervensystem und den Gesundheitszustand einer Person liefern. Eine normal verteilte HRV kann auf ein gesundes Gleichgewicht im autonomen Nervensystem hindeuten, während unregelmäßige oder asymmetrische Verteilungen auf potenzielle Probleme im Herz-Kreislauf-System hinweisen könnten.

Durch die Analyse von HRV-Verteilungen können Muster und Abweichungen erkannt werden, die wichtige Einblicke in die Funktionsweise des Herz-Kreislauf-Systems und den allgemeinen Gesundheitszustand bieten können.

 

Wie sieht eine Verteilung aus?

Eine Verteilung wird normalerweise grafisch als Diagramm oder Kurve dargestellt. Die genaue Form einer Verteilung kann je nach den zugrunde liegenden Daten unterschiedlich sein. Hier sind einige gängige Arten von Verteilungen und wie sie aussehen können:

  1. Normalverteilung (Gaußsche Verteilung): Diese Verteilung hat eine glockenförmige Kurve. Die meisten Werte befinden sich nahe dem Durchschnitt, und die Wahrscheinlichkeit nimmt mit zunehmendem Abstand vom Durchschnitt ab.

  2. Gleichverteilung: In dieser Verteilung sind alle Werte innerhalb eines bestimmten Intervalls gleich wahrscheinlich. Eine Gleichverteilung könnte als flache horizontale Linie dargestellt werden.

  3. Exponentielle Verteilung: Diese Verteilung zeigt abnehmende Wahrscheinlichkeit mit steigender Zeit oder Entfernung. Die Kurve beginnt hoch und fällt dann allmählich ab.

  4. Poisson-Verteilung: Diese Verteilung beschreibt seltene Ereignisse in einem bestimmten Zeitraum oder Raum. Die Kurve ist oft asymmetrisch und hat eine Spitze bei niedrigen Werten.

  5. Schiefheit und Kurtosis: Diese Eigenschaften beschreiben, wie stark eine Verteilung von der Normalverteilung abweicht. Eine Verteilung kann schief sein (eine Seite ist länger als die andere) oder eine hohe/geringe Kurtosis haben (spitz/flach).

Die genaue Form hängt von den Daten und dem zugrunde liegenden Prozess ab. Statistische Software kann verwendet werden, um Verteilungen basierend auf echten Daten zu generieren und zu visualisieren. Nachfolgend wird eine Verteilungen dargestellt, welche aus SaniQ exportiert wurde. Dieses Diagramm zeigt, dass sich die meisten Messungen der Herzfrequenz im Bereich zwischen 50 und 90 Schlägen pro Minute befinden. Es finden sich einzelne Ausreißer bei Herzfrequenzen im Bereich zwischen 110 und 150 Schlägen pro Minute. Messwerte unter 45 Schlägen pro Minute sind in dem Datensatz nicht vorhanden. Ebenfalls sehen wir die Grenzen (2σ) in der Darstellung ab wann Ausreißer festzustellen sind.

 

Was sind Ausreißer (Outlier)?

Outliers (Ausreißer) sind Werte in einer Verteilung, die signifikant von den anderen Werten abweichen. Sie liegen weit entfernt von den meisten anderen Datenpunkten und können die statistische Analyse und Interpretation beeinflussen. Ausreißer können auf Fehler bei der Datenerhebung hinweisen, aber sie könnten auch auf tatsächliche Besonderheiten oder ungewöhnliche Ereignisse hinweisen.

In vielen Fällen können Ausreißer den Durchschnitt (Mittelwert) und andere Kennzahlen einer Verteilung stark beeinflussen. Daher ist es wichtig, Ausreißer zu identifizieren und zu entscheiden, ob sie auf Fehler oder auf tatsächliche Besonderheiten im Datensatz zurückzuführen sind. Es gibt verschiedene Methoden, um Ausreißer zu erkennen und zu behandeln, einschließlich visueller Überprüfung, statistischer Tests und Anwendung von Schwellenwerten.

Hinweis: In SaniQ werden die Grenzen der Ausreißer auf 2σ festgelegt. 

 

Was ist der Kernel Density Estimator (KDE)?

Der Kernel Density Estimator (KDE) ist eine statistische Methode zur Schätzung der Wahrscheinlichkeitsdichte einer Verteilung basierend auf einer Menge von Datenpunkten. Der KDE ist besonders nützlich, um eine glatte, geschätzte Wahrscheinlichkeitsdichtefunktion zu erstellen, die es ermöglicht, die Form und Struktur einer Verteilung zu visualisieren.

Der Kerngedanke hinter dem KDE besteht darin, um jeden Datenpunkt herum einen sogenannten "Kern" (Kernel) zu platzieren. Dieser Kern ist normalerweise eine einfache Wahrscheinlichkeitsverteilungsfunktion, wie z. B. eine Gaußsche Glockenkurve. Diese Kerne werden dann skaliert und summiert, um eine Schätzung der gesamten Verteilung zu erhalten. Die Breite des Kerns beeinflusst die Glätte der geschätzten Dichtefunktion: ein schmalerer Kern führt zu mehr Details und Rauschen, während ein breiterer Kern zu einer glatteren Kurve führt.

Der KDE ist besonders hilfreich, um die Form einer Verteilung zu verstehen, insbesondere wenn die Datenpunkte nicht in Form einer bekannten statistischen Verteilung vorliegen. Er wird oft für die Visualisierung und Analyse von Daten in Bereichen wie der explorativen Datenanalyse, der Anpassung von Wahrscheinlichkeitsdichtefunktionen und der Erkennung von Mustern und Ausreißern verwendet.