My Notes

統計学とかR(R言語)とかPython3の覚え書きとか走り書きとか。 座右の銘にしたい: All work and no play makes Jack a dull boy.

一標本t検定 R(R言語)のt.test()を使用して

Rコード

#
# 一標本t検定 t.test()
#




#
# 参考にするデータや帰無仮説の立て方や計算式は、『パソコンで簡単! すぐできる生物統計 統計学の考え方から統計ソフトSPSSの使い方まで』第3章 p.50~52
#
# 用語について
# この書籍では、標本の平均値を"平均値"、母集団の平均値を"期待値"としている。
#




#
# 問い
# 標本のアフリカ雄ゾウは、アフリカゾウの母集団の体重の平均値4.50トンとは違う平均体重だろうか
#




#
# 帰無仮説
# "その集団の平均値(標本の平均値)が、期待値(母集団の平均値)と違わない"とする。
# 具体的には、"雄ゾウの平均体重は4.50トンである"とする。
#




# 使用するデータ 単位はトン
雄ゾウ <- data.frame(体重 = c(4.6, 5.0, 4.7, 4.3, 4.6,
                           4.9, 4.5, 4.6, 4.8, 4.5,
                           5.2, 4.5, 4.9, 4.6, 4.7,
                           4.8))


雄ゾウ




summary(雄ゾウ)




# 文字化けするなら。
par(family = "Osaka")
# 箱ヒゲ図
boxplot(雄ゾウ$体重)
# 散布図
plot(雄ゾウ$体重)
# ヒストグラム
x <- hist(雄ゾウ$体重, right = FALSE, col = "steelblue")
x




#
# 検定統計量の算定
# 計算式 t = (標本平均値 - 期待値) / 平均値の標準誤差 = (xbar - E) / SEbar
t <- (4.70 - 4.50) / 0.0563
t
round(t, 2)

# R(R言語)で用意されている関数 t.test()
t.test(雄ゾウ$体重, mu = 4.50)
# t値
# t = 3.5541
#
# p値
# p-value = 0.002885
# p < 0.05なら帰無仮説は棄却される。p > 0.05なら帰無仮説は棄却されない。
# 0.002885という値なので、期待値(母集団の平均値)と
# 平均値(標本の平均値)とは、おそらく異なるだろうということがわかる。
# 標本をもとにすると、期待値(母集団の平均値)はおそらく4.50にはならない。
# 帰無仮説は棄却。
# (逆に、p値が0.85とかなら、帰無仮説は棄却されない)。
#
# 95%信頼区間
# 95 percent confidence interval:
#  4.580057 4.819943
# であるので、期待値(母集団の平均値)の4.50はそもそも含まれていない。
# round(4.580057, 2)
# [1] 4.58
#
# 対立仮説
# 帰無仮説が棄却されたなら、対立仮説が採用される。
# 例えば、t.test()が出した対立仮説は、
# alternative hypothesis: true mean is not equal to 4.5
#

R Console

> #
> # 一標本t検定 t.test()
> #
> 
> 
> 
> 
> #
> # 参考にするデータや帰無仮説の立て方や計算式は、『パソコンで簡単! すぐできる生物統計 統計学の考え方から統計ソフトSPSSの使い方まで』第3章 p.50~52
> #
> # 用語について
> # この書籍では、標本の平均値を"平均値"、母集団の平均値を"期待値"としている。
> #
> 
> 
> 
> 
> #
> # 問い
> # 標本のアフリカ雄ゾウは、アフリカゾウの母集団の体重の平均値4.50トンとは違う平均体重だろうか
> #
> 
> 
> 
> 
> #
> # 帰無仮説
> # "その集団の平均値(標本の平均値)が、期待値(母集団の平均値)と違わない"とする。
> # 具体的には、"雄ゾウの平均体重は4.50トンである"とする。
> #
> 
> 
> 
> 
> # 使用するデータ 単位はトン
> 雄ゾウ <- data.frame(体重 = c(4.6, 5.0, 4.7, 4.3, 4.6,
+                            4.9, 4.5, 4.6, 4.8, 4.5,
+                            5.2, 4.5, 4.9, 4.6, 4.7,
+                            4.8))
> 
> 
> 雄ゾウ
   体重
1   4.6
2   5.0
3   4.7
4   4.3
5   4.6
6   4.9
7   4.5
8   4.6
9   4.8
10  4.5
11  5.2
12  4.5
13  4.9
14  4.6
15  4.7
16  4.8
> 
> 
> 
> 
> summary(雄ゾウ)
      体重      
 Min.   :4.300  
 1st Qu.:4.575  
 Median :4.650  
 Mean   :4.700  
 3rd Qu.:4.825  
 Max.   :5.200  
> 
> 
> 
> 
> # 文字化けするなら。
> par(family = "Osaka")
> # 箱ヒゲ図
> boxplot(雄ゾウ$体重)
> # 散布図
> plot(雄ゾウ$体重)
> # ヒストグラム
> x <- hist(雄ゾウ$体重, right = FALSE, col = "steelblue")
> x
$breaks
[1] 4.2 4.4 4.6 4.8 5.0 5.2

$counts
[1] 1 3 6 4 2

$density
[1] 0.3125 0.9375 1.8750 1.2500 0.6250

$mids
[1] 4.3 4.5 4.7 4.9 5.1

$xname
[1] "雄ゾウ$体重"

$equidist
[1] TRUE

attr(,"class")
[1] "histogram"
> 
> 
> 
> 
> #
> # 検定統計量の算定
> # 計算式 t = (標本平均値 - 期待値) / 平均値の標準誤差 = (xbar - E) / SEbar
> t <- (4.70 - 4.50) / 0.0563
> t
[1] 3.552398
> round(t, 2)
[1] 3.55
> 
> # R(R言語)で用意されている関数 t.test()
> t.test(雄ゾウ$体重, mu = 4.50)

    One Sample t-test

data:  雄ゾウ$体重
t = 3.5541, df = 15, p-value = 0.002885
alternative hypothesis: true mean is not equal to 4.5
95 percent confidence interval:
 4.580057 4.819943
sample estimates:
mean of x 
      4.7 

> # t値
> # t = 3.5541
> #
> # p値
> # p-value = 0.002885
> # p < 0.05なら帰無仮説は棄却される。p > 0.05なら帰無仮説は棄却されない。
> # 0.002885という値なので、期待値(母集団の平均値)と
> # 平均値(標本の平均値)とは、おそらく異なるだろうということがわかる。
> # 標本をもとにすると、期待値(母集団の平均値)はおそらく4.50にはならない。
> # 帰無仮説は棄却。
> # (逆に、p値が0.85とかなら、帰無仮説は棄却されない)。
> #
> # 95%信頼区間
> # 95 percent confidence interval:
> #  4.580057 4.819943
> # であるので、期待値(母集団の平均値)の4.50はそもそも含まれていない。
> # round(4.580057, 2)
> # [1] 4.58
> #
> # 対立仮説
> # 帰無仮説が棄却されたなら、対立仮説が採用される。
> # 例えば、t.test()が出した対立仮説は、
> # alternative hypothesis: true mean is not equal to 4.5
> #

箱ヒゲ図、散布図、ヒストグラムスクリーンショット

f:id:my_notes:20170619100446p:plain

f:id:my_notes:20170619100501p:plain

f:id:my_notes:20170619100521p:plain

参考文献

パソコンで簡単!すぐできる生物統計―統計学の考え方から統計ソフトSPSSの使い方まで

パソコンで簡単!すぐできる生物統計―統計学の考え方から統計ソフトSPSSの使い方まで

Rクックブック

Rクックブック

関連記事

my-notes.hatenablog.com