いろんなデータの分布をR(R言語)で可視化 ヒストグラムと密度推定曲線と散布図 世界の主な河川

Rコード

# 分布 ヒストグラムと密度推定曲線と散布図
# 使用するデータは、『データブック・オブ・ザ・ワールド 世界各国要覧と最新統計 2016 Vol.28』
# p.6


# 世界の主な河川(の長さ。流域面積ではない)
# 世界の主な河川の名称は、この目的上、必要ないので省略


# 文字化けする場合
par(family = "Osaka")


世界の主な河川 <- data.frame(長さ = c(6380, 5464, 4425, 3180, 3078,
                                    2989, 2840, 2816, 2800, 2650,
                                    2540, 2510, 2197, 2030, 1992,
                                    6695, 4667, 4184, 2736, 2100,
                                    5568, 5550, 4416, 4400, 3688,
                                    2850, 2428, 2285, 2129, 1233,
                                    5969, 3765, 2348, 4241, 3185,
                                    3058, 3057, 2570, 2333, 6516,
                                    4500, 3380, 3283, 2900, 2738,
                                    2627, 2550, 3672))

世界の主な河川


length(世界の主な河川$長さ)


summary(世界の主な河川$長さ)


max(世界の主な河川$長さ) - min(世界の主な河川$長さ)


x <- hist(世界の主な河川$長さ, col = "steelblue", right = FALSE, main = "世界の主な河川$長さ 単位 : km")
x


# 密度推定曲線
plot(density(世界の主な河川$長さ), col = "red", lwd = 2)


plot(世界の主な河川$長さ, ylab = "世界の主な河川$長さ 単位 : km")

R Console

> # 分布 ヒストグラムと密度推定曲線と散布図
> # 使用するデータは、『データブック・オブ・ザ・ワールド 世界各国要覧と最新統計 2016 Vol.28』
> # p.6
> 
> 
> # 世界の主な河川(の長さ。流域面積ではない)
> # 世界の主な河川の名称は、この目的上、必要ないので省略
> 
> 
> # 文字化けする場合
> par(family = "Osaka")
> 
> 
> 世界の主な河川 <- data.frame(長さ = c(6380, 5464, 4425, 3180, 3078,
+                                     2989, 2840, 2816, 2800, 2650,
+                                     2540, 2510, 2197, 2030, 1992,
+                                     6695, 4667, 4184, 2736, 2100,
+                                     5568, 5550, 4416, 4400, 3688,
+                                     2850, 2428, 2285, 2129, 1233,
+                                     5969, 3765, 2348, 4241, 3185,
+                                     3058, 3057, 2570, 2333, 6516,
+                                     4500, 3380, 3283, 2900, 2738,
+                                     2627, 2550, 3672))
> 
> 世界の主な河川
   長さ
1  6380
2  5464
3  4425
4  3180
5  3078
6  2989
7  2840
8  2816
9  2800
10 2650
11 2540
12 2510
13 2197
14 2030
15 1992
16 6695
17 4667
18 4184
19 2736
20 2100
21 5568
22 5550
23 4416
24 4400
25 3688
26 2850
27 2428
28 2285
29 2129
30 1233
31 5969
32 3765
33 2348
34 4241
35 3185
36 3058
37 3057
38 2570
39 2333
40 6516
41 4500
42 3380
43 3283
44 2900
45 2738
46 2627
47 2550
48 3672
> 
> 
> length(世界の主な河川$長さ)
[1] 48
> 
> 
> summary(世界の主な河川$長さ)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   1233    2548    3023    3448    4281    6695 
> 
> 
> max(世界の主な河川$長さ) - min(世界の主な河川$長さ)
[1] 5462
> 
> 
> x <- hist(世界の主な河川$長さ, col = "steelblue", right = FALSE, main = "世界の主な河川$長さ 単位 : km")
> x
$breaks
[1] 1000 2000 3000 4000 5000 6000 7000

$counts
[1]  2 22 10  7  4  3

$density
[1] 4.166667e-05 4.583333e-04 2.083333e-04 1.458333e-04 8.333333e-05 6.250000e-05

$mids
[1] 1500 2500 3500 4500 5500 6500

$xname
[1] "世界の主な河川$長さ"

$equidist
[1] TRUE

attr(,"class")
[1] "histogram"
> 
> 
> # 密度推定曲線
> plot(density(世界の主な河川$長さ), col = "red", lwd = 2)
> 
> 
> plot(世界の主な河川$長さ, ylab = "世界の主な河川$長さ 単位 : km")

ヒストグラムスクリーンショット

f:id:my_notes:20170612213844p:plain

密度推定曲線のスクリーンショット

f:id:my_notes:20170612213923p:plain

散布図のスクリーンショット

f:id:my_notes:20170612213950p:plain

参考文献

データブック オブ・ザ・ワールド―世界各国要覧と最新統計〈2016 Vol.28〉

データブック オブ・ザ・ワールド―世界各国要覧と最新統計〈2016 Vol.28〉