TU Wien:Statistik und Wahrscheinlichkeitstheorie UE (Gurker)/Übungen WS11/Beispiel 1.23

Aus VoWi
Zur Navigation springen Zur Suche springen

[Runs] Betrachten Sie eine Binärfolge bestehend aus N Elementen, m der einen und n der anderen Art (m + n = N). Ein Run ist eine Teilfolge aus identischen Elementen, begrenzt auf beiden Seiten von einem Element der anderen Art (oder vom Anfang/Ende der Folge). Beispielsweise gibt es in der Folge der Länge N = 20 (m = 11, n = 9): 0 1 1 0 0 1 1 0 1 1 1 0 0 0 0 0 1 1 0 0 insgesamt neun Runs, fünf 0–Runs und vier 1–Runs.

(a) Ist R die Gesamtzahl der Runs in einer zufällig angeordneten Binärfolge der Länge N, mit m Elementen der einen und n Elementen der anderen Art, so bestimme man die Wahrscheinlichkeit, daß (1) R = 2k (d.h., eine gerade Zahl) und daß (2) R = 2k + 1 (d.h., eine ungerade Zahl) ist. (Hinweis: Lösung u.a. auf Wikipedia, Stichwort ’Run– Test’; vgl. zum Verständnis der Lösung Aufgabe 1.16.)

(b) Bestimmen Sie speziell die Verteilung der Zahl der Runs für m = 2 und n = 5. Welche Anzahl ist am wahrscheinlichsten?


a)[Bearbeiten | Quelltext bearbeiten]

Lösung siehe Wikipedia. Achtung! Die "2k+1-Formel" ist möglicherweise Fehlerhaft. Die gelieferten Ergebnisse dieser Formel waren schlichtweg falsch. Habe' bereits eine möglicherweise korregierte Version der Formel vorgeschlagen.

Übrigens reicht es auch einfach sich das erste und letzte Element anzusehen um die Wahrscheinlichkeit zu bestimmen. Wenn erstes = letztes element dann ist die Anzahl der Runs auf jeden Fall ungerade und umgekehrt. Bsp für m=2 n=5 N = m+n = 7. Formel scheint doch korrekt zu sein, allerdings ist zu beachten, dass k bei den Ungeraden für die "einzelnen Gruppen" und bei den Geraden bereits für die "Aufspaltungen steht".

P(ungerade) = m/N * (m-1) / (N-1) + n/N * (n-1)/(N-1) also => 5/7 *4/6 + 2/7*1/6 = 11/21 superphil0


Ich fand diese Erklärung sehr hilfreich: Pennsylvania State University

b)[Bearbeiten | Quelltext bearbeiten]

Mit ein bisschen Überlegen zeigt sich, dass bei m=2 und n=5 nur 2er-, 3er-, 4er- und 5er-Runs geben kann.

2er-Runs: 0er und 1er werden nicht aufgeteilt: Folge an 0ern und dann 1er, oder umgekehrt. (2 Mögl.)

z.B. 0011111

3er-Runs: Entweder die zwei 0er werden aufgeteilt und die fünf 1er "hineingesteckt", oder die zwei 0er finden sich geschlossen von 1ern umgeben. (5 Mögl.)

z.B. 0111110 oder 1110011

4er-Runs: Ein Block mit einem einzelnen 0er umgeben von 1ern, und jeweils noch eine 0 davor oder danach. (8 Mögl.)

z.b. 0101111, 1011110 (man beachte die Position der ersten und letzten 0) oder 0110111

5er-Runs: 0en und 1er sind "aufgeteilt", die 0er sind nie geschlossen und immer von 1ern umgeben. (6 Mögl.)

z.b. 1010111 oder 1011101


Die Anzahl der Möglichkeiten dieser Runs kann man sich entweder selbst logisch durchdenken, oder einfach die Werte stupide durch die Wikipedia-Formeln jagen. Für den 3er-Run z.B. würde das ganze so Aussehen:

Die endgültigen Ergebnisse sind dann:

Lösung von AllesBeimAlten, herst.