TU Wien:Statistik und Wahrscheinlichkeitstheorie VO (Viertl)/Ausarbeitung WS06
Vielen Dank an den Kollegen, der nicht genannt werden möchte und mir diese Ausarbeitung per Mail geschickt hat! Bitte sich daran zu beteiligen! --Markus Nemetz 12:10, 13. Okt 2006 (CEST)
Einleitung[Bearbeiten | Quelltext bearbeiten]
Offizielle Statistik | |
Angewandte Statistik | + |
Theoretische Statistik | = Stochastik |
Wahrscheinlichkeitstheorie |
Wozu Statistik und Wahrscheinlichkeitsrechnung?
"Quantitative Erfassung von Massenphänomenen und Beschreibung von nichtdeterministischen Vorgängen"
Historisches und Grundsätzliches[Bearbeiten | Quelltext bearbeiten]
Statistische Ergebungen: seit ca. 4500 Jahren
Ägypten, China (Militär, Steuer)
seit 550 v. Chr. regelmäßiger "Zensus" im Römischen Reich
1754 erste Volkszählung in NÖ (inkl. Wien)
Universitätsstatistik: seit dem 17. Jhdt. Lehre von den Staatsmerkwürdigkeiten
Name Statistik: ital. statista = Staatsmann
Information zu Bevölkerung, Wirtschaft u.s.w.
Wahrscheinlichkeitsrechnung: Im 16. Jhdt.
- Beschreibung von Glücksspielen
- Beschreibung von Ungewissheit
verschiedene Wahrscheinlichkeits-Begriffe:
- objektivistisch
- subjektivistisch
- axiomatisch
Stochastik: | στoχαστικός |
στoχαξεσθαι |
Kausalität: deterministisch, stochastisch, fuzzy
Begleitende Beispiele:
B1: Statistische Qualitätskontrolle
- N...Losumfang, A...Anzahl schlechter Stücke, n...Stichprobenumfang, a...Anzahl schlechter Stücke in der Stichprobe
- Problem: Rückschluss auf A
B2: Lebensdauer eines Produktes
B3: Wartezeit bei einer Bedienstelle
B4: Messung von Distanzen
B5: Bremsweg, Kovariable Geschwindigkeit
TODO Kausalitätsgraph
Beschreibende Statistik[Bearbeiten | Quelltext bearbeiten]
Merkmale und Häufigkeiten
Diskrete Merkmale[Bearbeiten | Quelltext bearbeiten]
höchstens abzählbar viele mögliche Werte, die sich nicht häufen
Artmerkmale[Bearbeiten | Quelltext bearbeiten]
A1, A2, ..., A, verschiedene mögliche Werte
n Beobachtungen
Hn(Aj) = Anzahl der Beobachtungen mit Wert Aj
Hn(Aj) absolute Häufigkeit von Aj
hn(Aj) :=
Darstellung von Häufigkeitsverteilungen:
- Strichlisten
- Balkendiagramme
- Kreisdiagramme
TODO Häufigkeitstabelle
Balkendiagramm: Höhen der Balken proportional zu den Häufigkeiten TODO Balkendiagramm
Kreisdiagramm: Sektorenflächen proportional zu den Häufigkeiten TODO Kreisdiagramm
Ordnungsmerkmale (größer-Beziehung)[Bearbeiten | Quelltext bearbeiten]
- oft durch Zahlen dargestellt
z1, z2, ..., zm verschiedene mögliche Werte
Für n Beobachtungen
hn(zj) für j = 1(1)m
Darstellung der Häufigkeitsverteilung
- Stabdiagramm
- Summenkurve
Sind die Merkmalsausprägungen Zahlen, z1, z2, ..., zm, so stellt man die Häufigkeiten in FOrm eines Stabdiagrammes dar. TODO Stabdiagramm
Manchmal werden Summenhäufigkeiten
, i = 1(1)m
gewünscht und als reelle Funktion dargestellt:
TODO Summenkurve
Kontinuierliche Merkmale[Bearbeiten | Quelltext bearbeiten]
können alle Zahlen aus einem Intervall annehmen
Für n Beobachtungen x1, x2, ..., xn
Darstellung der Häufigkeitsverteilung als Empirische Verteilungsfunktion Fn*(.)
Fn*(x) := hn((-∞, x]) für jedes
Ordnungsstatistik x(1)≤x(2)≤...≤x(n)
TODO Diagramm 2.10
TODO Diagramm 2.11
TODO Diagramm 2.12
Für größere n bildet man Klassen
TODO Formatierung
relative Häufigkeiten der Klassen
Darstellung:
- Histogramm
- Summenpolygon Sn(x)
Theoretisches Modell:
- Wahrscheinlichkeitsdichte
- Verteilungsfunktion
TODO Kontinuierliche Merkmale
TODO Diagramm 2.15
TODO Typen von Histogrammen (Verteilungen)
Lageparameter[Bearbeiten | Quelltext bearbeiten]
numerische Daten x1, x2, ..., xn
Mittelwert[Bearbeiten | Quelltext bearbeiten]
TODO Formel
Für klassierte Daten mit m Klassen und Klassenhäufigkeiten Hn(Kj) sowie Klassenmitten zj, j = 1(1):
TODO Formel
TODO QUEST wo bleibt b)???
Empirische Fraktile[Bearbeiten | Quelltext bearbeiten]
Für p ∈ (0, 1) jener Wert xp, für den das Summenpolygon den Funktionswert p hat
Sn(xp) = p
Bemerkung: Für theoretische Verteilungen mittels der sogenannten Verteilungsfunktion
Modalwert (= empirischer Modus)[Bearbeiten | Quelltext bearbeiten]
Jener Merkmalwert, der am häufigsten auftritt
TODO Diagramm 2.15
Streuungsparameter[Bearbeiten | Quelltext bearbeiten]
Daten x1, x2, ..., xn
Spannweite[Bearbeiten | Quelltext bearbeiten]
= x(n) - x(1) = TODO Formel
Quartilabstand[Bearbeiten | Quelltext bearbeiten]
= x0,75 - x0,25
Mittlere absolute Abweichung[Bearbeiten | Quelltext bearbeiten]
x TODO unterwellt Median MAD = TODO Formel mean absolute deviation
Mittlere quadratische Abweichung (empirische Varianz)[Bearbeiten | Quelltext bearbeiten]
TODO Formel
Empirische Streuung[Bearbeiten | Quelltext bearbeiten]
TODO Formel
Empirischer Varianzkoeffizient[Bearbeiten | Quelltext bearbeiten]
TODO Formel
Dimensionsloses Streumaß
Bsp.: Variabilität der Preise in verschiedenen Ländern
Ziel der schließenden Statistik ist es, den empirisch gegebenen Verteilungen (Histogrammen) theoretische Verteilungen (Wahrscheinlichkeitsdichten) anzupassen, die erstere "gut" beschreiben.
TODO Diagramm
Bemerkung: Die theoretischen Verteilungen braucht man für Vergleiche und Prognosen.
Wahrscheinlichkeitsbegriffe[Bearbeiten | Quelltext bearbeiten]
- Statistischer Versuch
- Wiederholbare Handlung mit mehr oder weniger ungewissem Ausgang
- Wahrscheinlichkeiten
- Zahlen, die den Grad des Vertrauens in Ereignisse angeben
- Ereignis
- Eine Menge von möglichen Versuchsausgängen
- M...Merkmalraum
- Menge der möglichen Versuchsausgänge
Klassische Wahrscheinlichkeitsdefinition[Bearbeiten | Quelltext bearbeiten]
m mögliche verschiedene Versuchsausgänge
M = {a1, a2, ..., am}
Ereignis A = {ai1, ..., aim}, ij ∈ {1, ..., m}
- A enthält g Elemente
W(A) ... Wahrscheinlichkeit von A W(A) := TODO Formel g/m Anwendung: B1 (SQK)
Geometrische Wahrscheinlichkeiten[Bearbeiten | Quelltext bearbeiten]
Merkmalraum ∞, M ⊆TODO Formel mit I(M) < ∞
alle Teilräume von M mit gleichem Inhalt sind gleich wahrscheinlich
Für A ⊆ M definiert man W(A) := TODO Formal I(A)/I(M)
Bemerkung:
- k = 1 Länge
- k = 2 Fläche
- k = 3 Volumen
Bsp.: Zufällige Ankunft in [a, b]
Teilintervall [a1, b1] ⊂ [a, b]
Bsp.: Rendezvous-Problem
2 Ankünfte in [a, b], unabhängig
TODO Graph
Grenzwert von Häufigkeiten[Bearbeiten | Quelltext bearbeiten]
Konvergenzverhalten von hn(A) für n → ∞
Empirisches Gesetz der großen Zahlen
TODO hn(A) PFEIL p = W(A), A fest
Es gilt 0 ≤ hn(A) ≤ 1 ∀ Ereignisse A
A ∧ B unmöglich ⇒ hn(A ∨ B) = hn(A) + hn(B)
Bemerkung: Theorie der Kollektive
TODO Digramm Ereignis A ≙ gerade Augenzahl
Axiomatische Wahrscheinlichkeiten[Bearbeiten | Quelltext bearbeiten]
TODO AA, EE, o und e durch spez. Zeichen ersetzen!
Ereignissystem AA orthokomplementärer Verband, σ-vollständig
- o
- unmögliches Ereignis
- e
- sicheres Ereignis
- A⊥
- das zu A komplementäre Ereignis
A ∧ A⊥ = o und A ∨ A⊥ = e
A1, A2, A3, ... Folge mit Ak ∈ AA ⇒
TODO Formel fertigstellen
Wahrscheinlichkeitsverteilung W auf AA
W: AA → [0, 1] mit W(o) = 0 und W(e) = 1
Für jede Folge A1, A2, A3, ... von einander paarweise ausschließenden Ereignissen gilt
TODO Formel
Bemerkung: Endliche Additivität folgt daraus W(A⊥) = 1 - W(A)
Subjektive Wahrscheinlichkeiten[Bearbeiten | Quelltext bearbeiten]
Bewertungen der Unsicherheit bedingt durch den Wissensstand H: W(A|H) ∈ TODO R
Ereignisse: A, B; es muss gelten:
- 0 ≤ W(A|H) ≤ 1
- Falls A und B einander ausschließen gilt W(A∨B|H) = W(A|H) + W(B|H)
- Falls neue Information verfügbar: A eingetreten W(A∧B|H) = W(B|A∧H) × W(A|H)
Unscharfe Wahrscheinlichkeiten[Bearbeiten | Quelltext bearbeiten]
Wahrscheinlichkeiten sind unscharfe Zahlen (vgl. S. 9), die gewisse Bedingungen erfüllen