专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
玉树芝兰  ·  买了 Raycast AI ... ·  昨天  
51好读  ›  专栏  ›  大数据文摘

考察数据科学家和分析师的41个统计学问题

大数据文摘  · 公众号  · 大数据  · 2017-06-09 12:50

正文

请到「今天看啥」查看全文


正如我们所看到的正偏态分布的曲线,众数


7)以下哪一项是下图分布的中位数的可能值?

A)32

B)26

C)17

D)40


答案:(B)

为了回答这个问题,我们需要了解中位数的基本定义。 中位数是其前后值大约一半的值。 小于25的数值是(36 + 54 + 69 = 159),大于30的值的数量是(55 + 43 + 25 + 22 + 17 = 162)。 所以中位数应该在25到30之间。因此26是中位数的可能值。


8)计算样本标准差时,下列哪项陈述对于贝塞尔校正(Bessel’s correction)是正确的?

1. 不论对样本数据执行任何操作,都要使用贝塞尔校正。

2. 当我们尝试用样本估计总体的标准差时,使用贝塞尔校正。

3. 贝塞尔校正减少了标准差的偏差。

A)只有2

B)只有3

C)2和3

D)1和3


答案:(C)

与我们不应该总是做贝塞尔校正这个普遍观点相反。 当我们用样本的标准差来估算总体的标准差时,基本上是要做贝塞尔校正的。贝塞尔校正可以修正样本的标准差使其更接近总体的情况。


9)如果公式中的分母使用(n-1)计算数据集的方差,则下列哪个选项正确?

A)数据集是一个样本

B)数据集是一个总体

C)数据集可以是样本或总体

D)数据集来自人口普查

E)以上都不正确


答案:(A)

如果公式中的方差分母使用了n-1,则表示该集合是样本。 我们一般用离差的平方和除以n-1计算平均值,来估算总体的偏差。

当我们使用总体数据时,可以直接将离差的平方和除以n而不是n-1。


10)[对错判断]标准差可以为负值。

A)正确

B)错误


答案:(B)

以下是标准差的公式:

由于标准差是经过平方,累加,然后再开方,因此标准差不可能是负的。


11)标准差对异常值是否稳健?

A)是

B)否


答案:(B)

按照上面的标准差公式,可以发现过高或过低的值会增加标准差,尽管标准差与平均值非常不同。 因此,异常值将影响标准差。


12)对于下面的正态分布,以下哪个选项成立?

σ1,σ2和σ3分别表示曲线1,2和3的标准差。

A)σ1>σ2>σ3

B)σ1

C)σ1=σ2=σ3

D)以上皆否


答案:(B)

从正态分布的定义来看,我们知道所有这3种形状的曲线下的面积为1。 曲线3更平坦,因而更分散(大多数值在40-160之间),因此它的标准差最大。 类似地,曲线1的范围非常窄,并且所有值都在80-120的小范围内。 因此,曲线1的标准差最小。


13)在98%的置信区间,双尾检验Z的临界值是多少?

A)+/- 2.33

B)+/- 1.96

C)+/- 1.64

D)+/- 2.55


答案:(A)

我们需要查看Z值表来回答这个问题。 对于双尾检验和98%置信区间,我们应该检查Z值之前的面积为0.99,因为平均值的左侧和右侧分别是1%。 因此,我们应该检查区域 > 0.99的Z值。 该值为+/- 2.33。


14)[对错判断]标准正态分布的曲线是对称的,对称轴为0,曲线下面的面积为1。

A)正确

B)错误


答案:(A)

由正态分布曲线的定义得知,曲线下面的面积为1,对称轴为零, 平均值、中位数和众数都等于0。平均值左侧的面积等于平均值右侧的面积。 因此它是对称的。


问题背景15-17

研究表明,在学习时听音乐可以提高记忆力。 为了证明这一点,研究人员获得了36名大学生的样本,给他们做了一个标准记忆测试,同时听一些背景音乐。 在正常情况下(没有音乐),测试得到的平均分为25,标准偏差为6。实验后样本(有音乐)的平均分为28。


15)这种情况下的零假设是什么?

A)学习时听音乐不会影响记忆力。

B)学习时听音乐可能会使记忆力退化。

C)在学习中听音乐可能会提高记忆力。

D)在学习期间听音乐不会提高记忆力,还可能会使记忆力变得更糟。


答案:(D)

零假设通常是假设声明,测量现象彼此之间没有关系。 这里的零假设是听音乐和记忆力的提高之间没有关系。


16)什么是第一类错误?

A)学习时听音乐可以提高记忆力,且该结论正确。

B)学习时听音乐可以提高记忆力,但实际上记忆力并没有提高。

C)学习时听音乐不会提高记忆力,但实际上记忆力提高了。


答案:(B)

第一类错误意味着当假设的结论实际上为真时,我们却拒绝了零假设。 这里的零假设是音乐不会提高记忆力。 第一类错误是我们拒绝了零假设,也就是说结论显示音乐提高了记忆力,但实际上它并没有提高记忆力。


17)执行Z检验后,我们可以得出什么结论?

A)听音乐不会提高记忆力。

B)听音乐会显著提高记忆力。

C)信息不足以作任何结论。

D)以上都不对


答案:(B)

我们在给定的情况下进行Z检验。 我们知道零假设是听音乐不会提高记忆力。

备择假设是听音乐确实提高了记忆力。

在这种情况下,标准误差即:

来自这个总体的样本的平均值为28的Z值得分为:

从Z值表中可以看出,α= 0.05(单尾)的Z临界值为1.65。







请到「今天看啥」查看全文