Standardabweichungsrechner
Fügen Sie eine Liste von Zahlen ein, und der Rechner gibt den Mittelwert, die Varianz, die Standardabweichung (sowohl Stichprobe s mit n−1 Nenner als auch Population σ mit n Nenner), den Variationskoeffizienten und z-Scores für jeden Wert zurück. Nützlich, wenn Sie wissen möchten, wie verteilt Ihre Daten um den Durchschnitt sind — ein wichtiger diagnostischer Schritt vor der Durchführung eines parametrischen Tests.
Wie die Standardabweichung berechnet wird
-
1
Fügen Sie Ihre Zahlen ein
Getrennt durch Kommas, Leerzeichen oder Zeilenumbrüche. Nicht-numerische Einträge werden übersprungen.
-
2
Mittelwert x-bar wird berechnet
Summe geteilt durch Anzahl.
-
3
Quadratische Abweichungen werden summiert
sum((x − x-bar)²).
-
4
Teilen und Wurzel ziehen
Stichprobe: durch (n−1) teilen, √ ziehen. Population: durch n teilen, √ ziehen.
Stichprobe vs. Population — wann welches verwenden
| Verwenden Sie Population (n Nenner) | Verwenden Sie Stichprobe (n−1 Nenner) |
|---|---|
| Sie haben die gesamte Population | Sie haben eine Stichprobe aus einer größeren Population |
| Vollständige Volkszählung der Mitarbeiter | 20 Kunden aus Tausenden befragt |
| Alle 10 Würfe eines Würfels in einer bestimmten Sitzung | Messungen von einer Produktionslinie |
Der n−1 Nenner (Bessels Korrektur) liefert einen unverzerrten Schätzer der Populationsvarianz aus Stichprobendaten. Mit n als Nenner unterschätzen Sie systematisch die wahre Populationsvarianz. Bei großen n schrumpft der Unterschied, aber er ist bei kleinen Stichprobengrößen wichtig.
Intuition zur Standardabweichung
Wenn eine Menge einen Mittelwert von 100 und eine SD von 15 hat, dann (unter der Annahme einer grob normalen Verteilung):
- 68% der Werte liegen zwischen 85-115 (1 SD)
- 95% zwischen 70-130 (2 SD)
- 99.7% zwischen 55-145 (3 SD)
Das ist die 68-95-99.7 Regel, auch als empirische Regel bekannt. IQ-Werte, menschliche Höhen und viele natürliche Messungen folgen ihr eng.
Variationskoeffizient
CV = SD / Mittelwert. Ein dimensionsloses Maß für die Streuung — nützlich beim Vergleich der Variabilität über Datensätze mit unterschiedlichen Mittelwerten. Ein CV von 0.1 (10%) bedeutet, dass die SD etwa 10% des Mittelwerts beträgt. Nicht sinnvoll für Daten, die null überschreiten können.
Z-Scores
Für jeden Wert x: z = (x − Mittelwert) / SD. Sagt Ihnen, wie viele SD über oder unter dem Mittelwert dieser Wert liegt. |z| > 2 wird oft als auffällig markiert; |z| > 3 ist in normalen Daten ziemlich selten.
Häufige Fehler
- Verwendung der Population, wenn Sie die Stichprobe verwenden sollten. Unterschätzt die Variabilität in einem Stichprobendatensatz.
- Mischen von Mittelwert und SD aus verschiedenen Einheiten. Überprüfen Sie immer die Skala.
- Anwendung von Normalverteilungsregeln auf nicht-normale Daten. Schiefe oder multimodale Daten brechen die 68-95-99.7 Heuristik. Zeichnen Sie zuerst ein Histogramm.
- Ignorieren von Ausreißern. Ein extremer Wert kann Ihre SD verdreifachen. Robuste Alternativen (median absolute deviation, interquartilsrange) existieren für schwerfällige Daten.
Häufig gestellte Fragen
Excel hat zwei Funktionen: STDEV (Stichprobe, n−1 Nenner) und STDEVP (Population, n Nenner). Stellen Sie sicher, dass Sie die verwenden, die zu der Stichproben- oder Populationsannahme passt, die Sie möchten.
Ja — SD hat dieselben Einheiten wie Ihre Messungen (cm, Dollar, Sekunden). Die Varianz ist in quadrierten Einheiten, weshalb die SD lesbarer ist.
Die Stichproben-SD ist definiert für n >= 2. Unter etwa n=30 sollten Sie in Betracht ziehen, Konfidenzintervalle um die SD zu berichten oder eine robuste Alternative zu verwenden.
SD ist weiterhin definiert. Für einen Anteil p, SD = sqrt(p × (1−p)). Eine Stichprobe mit 60% Einsen hat SD = sqrt(0.6 × 0.4) ~= 0.49, unabhängig von der Anzahl der Beobachtungen.