My Notes

統計学とかR(R言語)とかPython3の覚え書きとか走り書きとか。 座右の銘にしたい: All work and no play makes Jack a dull boy.

いろんなデータの分布をR(R言語)で可視化 ヒストグラムと密度推定曲線と散布図 日本の主な河川

Rコード

# 分布 ヒストグラムと密度推定曲線と散布図
# 使用するデータは、『データブック・オブ・ザ・ワールド 日本各国要覧と最新統計 2016 Vol.28』
# p.6


# 日本の主な河川(の長さ。流域面積ではない)
# 日本の主な河川の名称は、この目的上、必要ないので省略


# 文字化けする場合
par(family = "Osaka")


日本の主な河川 <- data.frame(長さ = c(322, 268, 367, 249, 227,
                                    156, 75, 210, 229, 256,
                                    239, 213, 133, 136, 128,
                                    194, 194, 150, 173, 116,
                                    143, 120, 111, 102, 153,
                                    154, 183, 196, 107, 133,
                                    142, 120, 146, 115, 117,
                                    106, 142, 136, 103, 126,
                                    137, 124))

日本の主な河川


length(日本の主な河川$長さ)


summary(日本の主な河川$長さ)


max(日本の主な河川$長さ) - min(日本の主な河川$長さ)


x <- hist(日本の主な河川$長さ, col = "steelblue", right = FALSE, main = "日本の主な河川$長さ 単位 : km")
x


# 密度推定曲線
plot(density(日本の主な河川$長さ), col = "red", lwd = 2)


plot(日本の主な河川$長さ, ylab = "日本の主な河川$長さ 単位 : km")

R Console

> # 分布 ヒストグラムと密度推定曲線と散布図
> # 使用するデータは、『データブック・オブ・ザ・ワールド 日本各国要覧と最新統計 2016 Vol.28』
> # p.6
> 
> 
> # 日本の主な河川(の長さ。流域面積ではない)
> # 日本の主な河川の名称は、この目的上、必要ないので省略
> 
> 
> # 文字化けする場合
> par(family = "Osaka")
> 
> 
> 日本の主な河川 <- data.frame(長さ = c(322, 268, 367, 249, 227,
+                                     156, 75, 210, 229, 256,
+                                     239, 213, 133, 136, 128,
+                                     194, 194, 150, 173, 116,
+                                     143, 120, 111, 102, 153,
+                                     154, 183, 196, 107, 133,
+                                     142, 120, 146, 115, 117,
+                                     106, 142, 136, 103, 126,
+                                     137, 124))
> 
> 日本の主な河川
   長さ
1   322
2   268
3   367
4   249
5   227
6   156
7    75
8   210
9   229
10  256
11  239
12  213
13  133
14  136
15  128
16  194
17  194
18  150
19  173
20  116
21  143
22  120
23  111
24  102
25  153
26  154
27  183
28  196
29  107
30  133
31  142
32  120
33  146
34  115
35  117
36  106
37  142
38  136
39  103
40  126
41  137
42  124
> 
> 
> length(日本の主な河川$長さ)
[1] 42
> 
> 
> summary(日本の主な河川$長さ)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   75.0   121.0   142.5   165.5   195.5   367.0 
> 
> 
> max(日本の主な河川$長さ) - min(日本の主な河川$長さ)
[1] 292
> 
> 
> x <- hist(日本の主な河川$長さ, col = "steelblue", right = FALSE, main = "日本の主な河川$長さ 単位 : km")
> x
$breaks
[1]  50 100 150 200 250 300 350 400

$counts
[1]  1 22  9  6  2  1  1

$density
[1] 0.0004761905 0.0104761905 0.0042857143 0.0028571429 0.0009523810 0.0004761905 0.0004761905

$mids
[1]  75 125 175 225 275 325 375

$xname
[1] "日本の主な河川$長さ"

$equidist
[1] TRUE

attr(,"class")
[1] "histogram"
> 
> 
> # 密度推定曲線
> plot(density(日本の主な河川$長さ), col = "red", lwd = 2)
> 
> 
> plot(日本の主な河川$長さ, ylab = "日本の主な河川$長さ 単位 : km")

ヒストグラムスクリーンショット

f:id:my_notes:20170614181355p:plain

密度推定曲線のスクリーンショット

f:id:my_notes:20170614181432p:plain

散布図のスクリーンショット

f:id:my_notes:20170614181501p:plain

参考文献

データブック オブ・ザ・ワールド―世界各国要覧と最新統計〈2016 Vol.28〉

データブック オブ・ザ・ワールド―世界各国要覧と最新統計〈2016 Vol.28〉