Bei dieser Namensähnlichkeit, muss man fast so ein Banner machen :)

TU Wien:Statistik und Wahrscheinlichkeitstheorie UE (Bura)/Übungen 2019W/7.2

Aus VoWi
Zur Navigation springen Zur Suche springen
Absurdität des Testens

Es sei die gleiche Situation wie in der vorherigen Aufgabe ”t-Test (mit R)” gegeben, nur dass zusätzlich noch dreimal so viele Probanden gespielt haben. Die gesamten Daten sind in der Datei dist_more.Rdata abgelegt.

(a) Führen Sie den t-Test durch. Wie entscheiden Sie hier?
(b) Stellen sie die Daten aus dist.Rdata sowie dist_more.Rdata in zwei Histogrammen untereinander dar (par(mfrow=c(2,1))). Markieren Sie je den Mittelwert und den Standardfehler des Mittelwerts, sowie den Wert 550 Meter.
(c) Diskutieren Sie, was Ihre Grafik in Hinblick auf die Ausgänge der Tests aussagt.

Lösungsvorschlag[Bearbeiten | Quelltext bearbeiten]

a.

Anstelle die Daten zweimal zu laden habe ich in Vorbereitung zu meiner Lösung von b. die dist_more data in einen Data Frame gespeichert.

load(file = "dist_more.RData")
df_distanz_more <- data.frame(distanz)


Nun zur Eigentlichen Aufgabe, dem t.test() von dist_more.rData.

t.test(df_distanz_more$distanz, y=NULL, alternative="two.sided", mu=550, var.equal = F, paired = F, conf.level = 0.95)

In diesem Fall die Nullhypothese abzulehnen da der p-Wert < als alpha ist.


b.

Wie bei a. lade ich auch hier die data von dist.rData in einen Data Frame.

# creating Data Frame with distance data
load(file = "dist.RData")
df_distanz <- data.frame(distanz)


Nun berechne ich mir die zusätzlichen variablen, mean und sem und speichere diese im jeweiligen Data Frame.

# calculating mean
df_distanz$mean <- mean(df_distanz$distanz)
df_distanz_more$mean <- mean(df_distanz_more$distanz)

# calculating Standard error of mean (SEM)
S <- sqrt((1 / (length(df_distanz$distanz) - 1)) * sum((df_distanz$distanz - mean(df_distanz$distanz))^2))
df_distanz$sem<- S / sqrt(length(df_distanz$distanz))

S <- sqrt((1 / (length(df_distanz_more$distanz) - 1)) * sum((df_distanz_more$distanz - mean(df_distanz_more$distanz))^2))
df_distanz_more$sem<- S / sqrt(length(df_distanz_more$distanz))


Nun da alle gefragten variablen gespeichert sind können die Histogramme gezeichnet werden. Die Linien werden mittels abline() gezeichnet, wobei v = für eine vertikale Linie steht, col = für die Farbe und lwd = für die line width.

# set Plot rows = 2, columns = 1
par(mfrow=c(2,1))

# Plotting
hist(df_distanz$distanz, main = "dist.rData", xlab = "Distanz")
abline(v = 550, col = "blue", lwd = 2)
abline(v = df_distanz$mean, col = "green", lwd = 2)
abline(v = df_distanz$sem, col = "red", lwd = 2)
abline(v = df_distanz$mean - df_distanz$sem, col = "red", lwd = 2)
abline(v = df_distanz$mean + df_distanz$sem, col = "red", lwd = 2)
legend("topright", c("550", "Mean", "StdErr"), col=c("blue", "green", "red"), lwd=2)


hist(df_distanz_more$distanz, main = "dist_more.rData", xlab = "Distanz")
abline(v = 550, col = "blue", lwd = 2)
abline(v = df_distanz_more$mean, col = "green", lwd = 2)
abline(v = df_distanz_more$sem, col = "red", lwd = 2)
abline(v = df_distanz_more$mean - df_distanz_more$sem, col = "red", lwd = 2)
abline(v = df_distanz_more$mean + df_distanz_more$sem, col = "red", lwd = 2)
legend("topright", c("550", "Mean", "StdErr"), col=c("blue", "green", "red"), lwd=2)


c.

ToDo