很多人以为统计分析是高深莫测的事,其实用R语言做假设检验,就像用手机拍照一样简单。只要你装好了R和RStudio,接下来几步就能跑出结果。
安装R和RStudio
先去R官网下载对应系统的版本,装好后再去RStudio官网下载IDE。这俩搭配起来写代码不头疼,还能随时看数据、画图。
准备数据
假设你在公司做客服,想看看新培训方案有没有降低客户投诉时间。你收集了10个员工培训前后的处理时长(单位:分钟):
before <- c(12, 15, 14, 10, 13, 16, 11, 14, 12, 15)
after <- c(9, 10, 11, 8, 9, 12, 7, 10, 9, 11)
这些数字可以直接输入R,不用导Excel,小数据这么干最快。
配对t检验:看变化是否显著
因为是同一组人前后对比,用配对t检验最合适。输入这一行:
t.test(before, after, paired = TRUE)
R立马返回结果,重点看p-value。如果小于0.05,说明新培训确实有效,不是碰巧。
单样本t检验:对比固定值
比如你知道行业平均处理时长是10分钟,你想看你团队是不是优于平均水平。你的数据是:
my_team <- c(8, 9, 7, 10, 8, 6, 9)
跑下面这句:
t.test(my_team, mu = 10)
mu就是你要比的那个数。p-value小,就说明你团队真干得比行业强。
两独立样本t检验:两组人对比
两个门店搞促销,你想看哪边销售额提升更明显。数据长这样:
store_a <- c(120, 130, 110, 125, 115)
store_b <- c(100, 105, 95, 110, 102)
用独立样本t检验:
t.test(store_a, store_b)
R默认用Welch校正,不用管方差齐不齐,省事又靠谱。
别被输出吓到
R输出一堆英文,其实关键就几个:t值、df(自由度)、p-value。p-value小于0.05,基本就可以说“有显著差异”。别管什么置信区间、估计值,刚开始会看p就行。
多练几次,你会发现R语言做假设检验,根本不用背公式,敲几行代码,答案自动蹦出来。跟装机一样,步骤对了,一键启动。