こういうことが言いたいだけなんじゃねぇの?

他の部分に対する突っ込みはよくわからないが、とりあえずここはこうだろうと。

↑この本を買ったのだが、95ページ周辺にむちゃくちゃな事が書いてあって萎えた。

統計学では「仮説検定」という手法があります。
しかし、仮説検定は(中略)、人数が(サンプルサイズ)が多い場合には、ほとんどの結果が「統計的に有意な差がある」という結果になります。

差がわずかしかない二つの集団を比べる場合は、そんなことはない。

本当?"標準偏差1"という値に比べて十分に小さい"0.1"という間隔を持つ2つの正規分布からなるサンプル(10^i個; i∈{1,2,3,4,5,6,7})に対して、各々、平均値の差を見る検定であるt検定をかけたところ、

library(magrittr)
r <- list()
for(i in 1:7){
  set.seed(100)
  r[[length(r)+1]] <- t.test(rnorm(10^i, mean=0.1), rnorm(10^i),var.equal=T)   
}
sapply(r, function(z)z$p.value) %>% plot(1:7, ., type="b", ylab="p-value", xlab="number of sample(10^i)")


となって、サンプル数がでかくなると、p値が小さくなる傾向が見て取れる、従って書籍の言うように「サンプル数が大きくなると統計的に有意であると判断する確率が高まる傾向がありそうだ」といっていいように思えるんだが。

あと、みんなmagrittrパッケージ使ったらいいと思う。