统计指南，什么是P值？_统计与绘图_实用技巧

什么是P值？

假设您从两个用不同药物治疗的动物样本中收集了数据。您已测量每种动物血浆中的一种酶，且测量方法不同。您想知道这种差异是否是由于药物的作用 - 这两种群体是否有不同的方法。

观察不同样本方法并不足以说服您得出群体有不同的方法的结论。有可能群体具有相同的平均值（即药物对您正在测量的酶无影响），且您观察到的样本平均值之间的差异只会偶然发生。您永远无法确定您观察到的差异是否反映了真正的差异，或只是在随机抽样过程中出现。您所能做的就是计算概率。

第一步是注明零假设。事实上，治疗并不影响您测量的结果（因此，所有差异均因随机抽样所致）。

P值是一个概率值，范围为0 - 1，可回答该问题（可能您从未想过要问）：

在这种规模的试验中，如果群体真的具有相同的平均值，则观察到样本平均值之间的差异至少与实际观察到的差异一样大的概率是多少？

对P值的最常见错误解读

许多人误解了P值的含义。让我们假设您比较了两个平均值，得到等于0.03的P值。

该P值的正确定义：

观察到的差异与您所观察到的差异一样大的几率为3%，即使两个群体平均值相同（零假设为真）。

或者，

从相同群体中随机抽样会导致比您在97%的实验中观察到的差异更小，比您在3%的实验中观察到的差异更大。

错误：

您所观察到的差异反映出群体之间的真实差异的几率为97%，差异偶然发生的几率为3%。

对P值的更多错误解读

谬论：p值是由于抽样误差而造成结果的概率

假设零假设为真，则计算P值。换言之，P值的计算是基于由于抽样误差而造成差异的假设。因此，P值无法表示由于抽样误差而造成结果的概率。

谬论：P值是零假设为真的概率

没有。假设零假设为真，则计算P值，因此P值不可能是真的值。

谬论：1 - P是替代假设为真的概率

如果P值为0.03，则很容易想到：如果差异只有3%的概率由随机因素造成，则差异肯定有97%的概率由真实因素造成。但这是一种错误的想法！

您可以说，如果零假设为真，则97%的实验会导致比您观察到的差异更小的差异，3%的实验会导致与您观察到的差异一样大的差异或比您观察到的差异更大的差异。

P值的计算基于零假设正确的假设。P值无法表明该假设是否正确。P值表明，如果零假设为真，则很少能观察到与您观察到的差异一样大的差异或比您观察到的差异更大的差异。

科学家必须回答的问题是，结果是否不太可能导致放弃零假设。

谬论：1 - P是重复实验后结果保持不变的概率

如果P值为0.03，则很容易认为这意味着有97%的几率能在重复实验中得到“相似”的结果。并非如此。

谬论：高P值证明零假设为真。

否。高P值意味着，如果零假设为真，则在本实验中观察到的治疗效果便不足为奇了。但这并不能证明零假设为真。

谬论：P值是拒绝零假设的概率

在一个特定实验的P值小于显著性水平α（您（应该）将α作为实验设计的一部分）时，您会拒绝零假设（并认为结果具有统计学显著性）。所以如果零假设为真，则α是拒绝零假设的概率。

P值和α不一样。P值是从每次比较中计算得出，并且是对证据强度的一种度量。将显著性水平α设置为实验设计的一部分。

科研星球