TU Wien:Statistik und Wahrscheinlichkeitstheorie VO (Viertl)/Ausarbeitung WS06

Aus VoWi
Zur Navigation springen Zur Suche springen

Vielen Dank an den Kollegen, der nicht genannt werden möchte und mir diese Ausarbeitung per Mail geschickt hat! Bitte sich daran zu beteiligen! --Markus Nemetz 12:10, 13. Okt 2006 (CEST)

Einleitung[Bearbeiten | Quelltext bearbeiten]

Offizielle Statistik
Angewandte Statistik +
Theoretische Statistik = Stochastik
Wahrscheinlichkeitstheorie

Wozu Statistik und Wahrscheinlichkeitsrechnung?
"Quantitative Erfassung von Massenphänomenen und Beschreibung von nichtdeterministischen Vorgängen"

Historisches und Grundsätzliches[Bearbeiten | Quelltext bearbeiten]

Statistische Ergebungen: seit ca. 4500 Jahren
Ägypten, China (Militär, Steuer)
seit 550 v. Chr. regelmäßiger "Zensus" im Römischen Reich
1754 erste Volkszählung in NÖ (inkl. Wien)

Universitätsstatistik: seit dem 17. Jhdt. Lehre von den Staatsmerkwürdigkeiten
Name Statistik: ital. statista = Staatsmann
Information zu Bevölkerung, Wirtschaft u.s.w.

Wahrscheinlichkeitsrechnung: Im 16. Jhdt.

Beschreibung von Glücksspielen
Beschreibung von Ungewissheit

verschiedene Wahrscheinlichkeits-Begriffe:

  • objektivistisch
  • subjektivistisch
  • axiomatisch
Stochastik: στoχαστικός
στoχαξεσθαι

Kausalität: deterministisch, stochastisch, fuzzy

Begleitende Beispiele:
B1: Statistische Qualitätskontrolle

N...Losumfang, A...Anzahl schlechter Stücke, n...Stichprobenumfang, a...Anzahl schlechter Stücke in der Stichprobe
Problem: Rückschluss auf A

B2: Lebensdauer eines Produktes
B3: Wartezeit bei einer Bedienstelle
B4: Messung von Distanzen
B5: Bremsweg, Kovariable Geschwindigkeit

TODO Kausalitätsgraph

Beschreibende Statistik[Bearbeiten | Quelltext bearbeiten]

Merkmale und Häufigkeiten

Diskrete Merkmale[Bearbeiten | Quelltext bearbeiten]

höchstens abzählbar viele mögliche Werte, die sich nicht häufen

Artmerkmale[Bearbeiten | Quelltext bearbeiten]

A1, A2, ..., A, verschiedene mögliche Werte
n Beobachtungen
Hn(Aj) = Anzahl der Beobachtungen mit Wert Aj

Hn(Aj) absolute Häufigkeit von Aj
hn(Aj) :=

Darstellung von Häufigkeitsverteilungen:

  • Strichlisten
  • Balkendiagramme
  • Kreisdiagramme

TODO Häufigkeitstabelle

Balkendiagramm: Höhen der Balken proportional zu den Häufigkeiten TODO Balkendiagramm

Kreisdiagramm: Sektorenflächen proportional zu den Häufigkeiten TODO Kreisdiagramm

Ordnungsmerkmale (größer-Beziehung)[Bearbeiten | Quelltext bearbeiten]
oft durch Zahlen dargestellt

z1, z2, ..., zm verschiedene mögliche Werte
Für n Beobachtungen
hn(zj) für j = 1(1)m

Darstellung der Häufigkeitsverteilung

  • Stabdiagramm
  • Summenkurve

Sind die Merkmalsausprägungen Zahlen, z1, z2, ..., zm, so stellt man die Häufigkeiten in FOrm eines Stabdiagrammes dar. TODO Stabdiagramm

Manchmal werden Summenhäufigkeiten
, i = 1(1)m
gewünscht und als reelle Funktion dargestellt:
TODO Summenkurve

Kontinuierliche Merkmale[Bearbeiten | Quelltext bearbeiten]

können alle Zahlen aus einem Intervall annehmen
Für n Beobachtungen x1, x2, ..., xn
Darstellung der Häufigkeitsverteilung als Empirische Verteilungsfunktion Fn*(.)
Fn*(x) := hn((-∞, x]) für jedes


Ordnungsstatistik x(1)≤x(2)≤...≤x(n) TODO Diagramm 2.10
TODO Diagramm 2.11
TODO Diagramm 2.12
Für größere n bildet man Klassen
TODO Formatierung
relative Häufigkeiten der Klassen
Darstellung:

  • Histogramm
  • Summenpolygon Sn(x)

Theoretisches Modell:

  • Wahrscheinlichkeitsdichte
  • Verteilungsfunktion

TODO Kontinuierliche Merkmale
TODO Diagramm 2.15
TODO Typen von Histogrammen (Verteilungen)

Lageparameter[Bearbeiten | Quelltext bearbeiten]

numerische Daten x1, x2, ..., xn

Mittelwert[Bearbeiten | Quelltext bearbeiten]

TODO Formel
Für klassierte Daten mit m Klassen und Klassenhäufigkeiten Hn(Kj) sowie Klassenmitten zj, j = 1(1):
TODO Formel
TODO QUEST wo bleibt b)???

Empirische Fraktile[Bearbeiten | Quelltext bearbeiten]

Für p ∈ (0, 1) jener Wert xp, für den das Summenpolygon den Funktionswert p hat
Sn(xp) = p
Bemerkung: Für theoretische Verteilungen mittels der sogenannten Verteilungsfunktion

Modalwert (= empirischer Modus)[Bearbeiten | Quelltext bearbeiten]

Jener Merkmalwert, der am häufigsten auftritt
TODO Diagramm 2.15

Streuungsparameter[Bearbeiten | Quelltext bearbeiten]

Daten x1, x2, ..., xn

Spannweite[Bearbeiten | Quelltext bearbeiten]

= x(n) - x(1) = TODO Formel

Quartilabstand[Bearbeiten | Quelltext bearbeiten]

= x0,75 - x0,25

Mittlere absolute Abweichung[Bearbeiten | Quelltext bearbeiten]

x TODO unterwellt Median MAD = TODO Formel mean absolute deviation

Mittlere quadratische Abweichung (empirische Varianz)[Bearbeiten | Quelltext bearbeiten]

TODO Formel

Empirische Streuung[Bearbeiten | Quelltext bearbeiten]

TODO Formel

Empirischer Varianzkoeffizient[Bearbeiten | Quelltext bearbeiten]

TODO Formel
Dimensionsloses Streumaß
Bsp.: Variabilität der Preise in verschiedenen Ländern

Ziel der schließenden Statistik ist es, den empirisch gegebenen Verteilungen (Histogrammen) theoretische Verteilungen (Wahrscheinlichkeitsdichten) anzupassen, die erstere "gut" beschreiben. TODO Diagramm
Bemerkung: Die theoretischen Verteilungen braucht man für Vergleiche und Prognosen.

Wahrscheinlichkeitsbegriffe[Bearbeiten | Quelltext bearbeiten]

Statistischer Versuch
Wiederholbare Handlung mit mehr oder weniger ungewissem Ausgang
Wahrscheinlichkeiten
Zahlen, die den Grad des Vertrauens in Ereignisse angeben
Ereignis
Eine Menge von möglichen Versuchsausgängen
M...Merkmalraum
Menge der möglichen Versuchsausgänge

Klassische Wahrscheinlichkeitsdefinition[Bearbeiten | Quelltext bearbeiten]

m mögliche verschiedene Versuchsausgänge
M = {a1, a2, ..., am}
Ereignis A = {ai1, ..., aim}, ij ∈ {1, ..., m}

A enthält g Elemente

W(A) ... Wahrscheinlichkeit von A W(A) := TODO Formel g/m Anwendung: B1 (SQK)

Geometrische Wahrscheinlichkeiten[Bearbeiten | Quelltext bearbeiten]

Merkmalraum ∞, M ⊆TODO Formel mit I(M) < ∞
alle Teilräume von M mit gleichem Inhalt sind gleich wahrscheinlich
Für A ⊆ M definiert man W(A) := TODO Formal I(A)/I(M)
Bemerkung:

k = 1 Länge
k = 2 Fläche
k = 3 Volumen

Bsp.: Zufällige Ankunft in [a, b]
Teilintervall [a1, b1] ⊂ [a, b]

Bsp.: Rendezvous-Problem
2 Ankünfte in [a, b], unabhängig
TODO Graph

Grenzwert von Häufigkeiten[Bearbeiten | Quelltext bearbeiten]

Konvergenzverhalten von hn(A) für n → ∞
Empirisches Gesetz der großen Zahlen
TODO hn(A) PFEIL p = W(A), A fest
Es gilt 0 ≤ hn(A) ≤ 1 ∀ Ereignisse A
A ∧ B unmöglich ⇒ hn(A ∨ B) = hn(A) + hn(B)
Bemerkung: Theorie der Kollektive
TODO Digramm Ereignis A ≙ gerade Augenzahl

Axiomatische Wahrscheinlichkeiten[Bearbeiten | Quelltext bearbeiten]

TODO AA, EE, o und e durch spez. Zeichen ersetzen!
Ereignissystem AA orthokomplementärer Verband, σ-vollständig

o
unmögliches Ereignis
e
sicheres Ereignis
A
das zu A komplementäre Ereignis

A ∧ A = o und A ∨ A = e
A1, A2, A3, ... Folge mit Ak ∈ AA ⇒ TODO Formel fertigstellen

Wahrscheinlichkeitsverteilung W auf AA
W: AA → [0, 1] mit W(o) = 0 und W(e) = 1
Für jede Folge A1, A2, A3, ... von einander paarweise ausschließenden Ereignissen gilt TODO Formel

Bemerkung: Endliche Additivität folgt daraus W(A) = 1 - W(A)

Subjektive Wahrscheinlichkeiten[Bearbeiten | Quelltext bearbeiten]

Bewertungen der Unsicherheit bedingt durch den Wissensstand H: W(A|H) ∈ TODO R
Ereignisse: A, B; es muss gelten:

  1. 0 ≤ W(A|H) ≤ 1
  2. Falls A und B einander ausschließen gilt W(A∨B|H) = W(A|H) + W(B|H)
  3. Falls neue Information verfügbar: A eingetreten W(A∧B|H) = W(B|A∧H) × W(A|H)

Unscharfe Wahrscheinlichkeiten[Bearbeiten | Quelltext bearbeiten]

Wahrscheinlichkeiten sind unscharfe Zahlen (vgl. S. 9), die gewisse Bedingungen erfüllen