TU Wien:Statistik und Wahrscheinlichkeitstheorie UE (Bura)/Übungen 2019W/7.2
- Absurdität des Testens
Es sei die gleiche Situation wie in der vorherigen Aufgabe ”t-Test (mit R)” gegeben, nur
dass zusätzlich noch dreimal so viele Probanden gespielt haben. Die gesamten Daten sind in
der Datei dist_more.Rdata
abgelegt.
- (a) Führen Sie den t-Test durch. Wie entscheiden Sie hier?
- (b) Stellen sie die Daten aus
dist.Rdata
sowiedist_more.Rdata
in zwei Histogrammen untereinander dar (par(mfrow=c(2,1))
). Markieren Sie je den Mittelwert und den Standardfehler des Mittelwerts, sowie den Wert 550 Meter. - (c) Diskutieren Sie, was Ihre Grafik in Hinblick auf die Ausgänge der Tests aussagt.
Lösungsvorschlag[Bearbeiten | Quelltext bearbeiten]
a.
Anstelle die Daten zweimal zu laden habe ich in Vorbereitung zu meiner Lösung von b. die dist_more data in einen Data Frame gespeichert.
load(file = "dist_more.RData")
df_distanz_more <- data.frame(distanz)
Nun zur Eigentlichen Aufgabe, dem t.test() von dist_more.rData.
t.test(df_distanz_more$distanz, y=NULL, alternative="two.sided", mu=550, var.equal = F, paired = F, conf.level = 0.95)
In diesem Fall die Nullhypothese abzulehnen da der p-Wert < als alpha ist.
b.
Wie bei a. lade ich auch hier die data von dist.rData in einen Data Frame.
# creating Data Frame with distance data
load(file = "dist.RData")
df_distanz <- data.frame(distanz)
Nun berechne ich mir die zusätzlichen variablen, mean und sem und speichere diese im jeweiligen Data Frame.
# calculating mean
df_distanz$mean <- mean(df_distanz$distanz)
df_distanz_more$mean <- mean(df_distanz_more$distanz)
# calculating Standard error of mean (SEM)
S <- sqrt((1 / (length(df_distanz$distanz) - 1)) * sum((df_distanz$distanz - mean(df_distanz$distanz))^2))
df_distanz$sem<- S / sqrt(length(df_distanz$distanz))
S <- sqrt((1 / (length(df_distanz_more$distanz) - 1)) * sum((df_distanz_more$distanz - mean(df_distanz_more$distanz))^2))
df_distanz_more$sem<- S / sqrt(length(df_distanz_more$distanz))
Nun da alle gefragten variablen gespeichert sind können die Histogramme gezeichnet werden.
Die Linien werden mittels abline()
gezeichnet, wobei v =
für eine vertikale Linie steht, col =
für die Farbe und lwd =
für die line width.
# set Plot rows = 2, columns = 1
par(mfrow=c(2,1))
# Plotting
hist(df_distanz$distanz, main = "dist.rData", xlab = "Distanz")
abline(v = 550, col = "blue", lwd = 2)
abline(v = df_distanz$mean, col = "green", lwd = 2)
abline(v = df_distanz$sem, col = "red", lwd = 2)
abline(v = df_distanz$mean - df_distanz$sem, col = "red", lwd = 2)
abline(v = df_distanz$mean + df_distanz$sem, col = "red", lwd = 2)
legend("topright", c("550", "Mean", "StdErr"), col=c("blue", "green", "red"), lwd=2)
hist(df_distanz_more$distanz, main = "dist_more.rData", xlab = "Distanz")
abline(v = 550, col = "blue", lwd = 2)
abline(v = df_distanz_more$mean, col = "green", lwd = 2)
abline(v = df_distanz_more$sem, col = "red", lwd = 2)
abline(v = df_distanz_more$mean - df_distanz_more$sem, col = "red", lwd = 2)
abline(v = df_distanz_more$mean + df_distanz_more$sem, col = "red", lwd = 2)
legend("topright", c("550", "Mean", "StdErr"), col=c("blue", "green", "red"), lwd=2)
c.
ToDo