We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
<段落_1> <原始版> 将信心置于置信区间的谬误 </原始版> <版本1> 置信区间的误解 </版本1> <版本2> 关于置信区间的常见误解 </版本2> <版本3> 论置信区间的普遍误解 </版本3> <最终版> 关于置信区间的普遍误解 </最终版> </段落_1>
<段落_2> <原始版> 摘要: </原始版> <版本1> 摘要: </版本1> <版本2> 摘要: </版本2> <版本3> 概要: </版本3> <最终版> 摘要: </最终版> </段落_2>
<段落_3> <原始版> 区间估计——对包含抽样不确定性的参数进行估计的一种方法——长期以来被吹捧为统计分析的关键组成部分。有几种类型的区间估计,但最受欢迎的是置信区间(CIs):在重复抽样中,平均包含真实参数值的区间。置信区间的宽度被认为是估计的精度的指标;置信区间被认为是指导哪些参数值是合理或合理的指南;区间的置信系数(例如,95%)被认为是指示真实参数是否包含在区间内的合理性的指标。我们在许多实例中展示,置信区间不一定具有这些属性,并且可能导致不合理或任意的推断。因此,我们警告不要仅仅依赖于置信区间理论来证明区间估计,并建议使用其他区间估计理论。 </原始版> <版本1> 区间估计作为一种评估含抽样不确定性参数的方法,长期被誉为统计分析的核心。众多区间估计方法中,置信区间(CIs)最为流行:即在重复抽样中能够平均覆盖真实参数值的区间。置信区间的宽度常被视为估计精度的标志;人们认为置信区间能指引何种参数值是可接受的;而区间的置信水平(如95%)则被看作是参数真实包含于区间内可能性的指标。然而,我们通过多个案例展示,置信区间并非总具备这些特性,且有时可能导致不合理或武断的推断。因此,我们建议不应仅依赖置信区间理论进行区间估计,而应考虑其他区间估计方法。 </版本1> <版本2> 区间估计,即在包含抽样不确定性的情境下对参数进行估计,长久以来一直是统计分析的核心。其中,置信区间(CIs)作为一种流行的区间估计方法,其含义是在重复抽样的情况下,能够平均涵盖真实参数值的区间。通常,置信区间的宽度被视为估计精度的指标,置信区间本身被认为是判定哪些参数值是合理的指南,而区间的置信系数(例如,95%)则被视为真实参数是否包含在区间内的合理性指标。本文通过多个实例展示,置信区间并非总是具备这些特性,并且可能导致不合理或随意的推断。因此,我们建议不应单纯依赖置信区间理论来证明区间估计的合理性,并推荐使用其他区间估计理论。 </版本2> <版本3> 长期以来,区间估计——一种涵盖抽样不确定性的参数估计方法——一直被誉为统计分析的核心要素。其中最为人熟知的便是置信区间(CIs):在反复抽样过程中,平均而言能包含真实参数值的估计区间。人们普遍认为,置信区间的宽度反映了估计的精确程度,置信区间本身则指示了哪些参数值较为合理,而区间的置信水平(如95%)则被视为真实参数落在该区间内可能性的度量。然而,我们在多个案例中展示了置信区间并非总是具备这些属性,有时甚至会引导出不合逻辑或任意的推断。因此,我们建议不应仅仅依赖于置信区间理论来进行区间估计,并提倡考虑其他估计理论。 </版本3> <最终版> 区间估计是评估抽样不确定性参数的核心方法之一,置信区间(CIs)作为其中最为流行的方式,在重复抽样中可以平均覆盖真实参数值。一般认为,置信区间的宽度反映了估计的精确度,它本身可指引何种参数值是可接受的,而置信水平(如95%)则被看作参数真实包含于区间内可能性的度量。然而,我们的案例研究显示,置信区间并不总是具备这些特性,有时甚至会导致不合理或武断的推断。因此,我们建议不应仅依赖置信区间理论进行区间估计,而应考虑其他方法。 </最终版> </段落_3>
<段落_4> <原始版> 关键词: 贝叶斯推理与参数估计,贝叶斯统计学,统计推断,统计 </原始版> <版本1> 关键词: 贝叶斯推理与参数估计,贝叶斯统计,统计推断,统计学 </版本1> <版本2> 关键词: 贝叶斯推理与参数估计,贝叶斯统计,统计推断 </版本2> <版本3> 关键词: 贝叶斯推断与参数估计,贝叶斯统计学,统计推理,统计学 </版本3> <最终版> 关键词: 贝叶斯推理与参数估计,贝叶斯统计,统计推断,统计学 </最终版> </段落_4>
<段落_5> <原始版> "你一直在使用那个词。我不认为它意味着你认为它意味着的那样。" </原始版> <版本1> “你总在用那个词。我觉得它并不是你所想的那个意思。” </版本1> <版本2> “你一直在使用那个词,我不认为它意味着你以为的那样。” </版本2> <版本3> "你一直在用那个词。我不认为它的含义是你所理解的那样。" </版本3> <最终版> “你一直在用那个词。我不认为它意味着你所以为的那样。” </最终版> </段落_5>
<段落_6> <原始版> Inigo Montoya,《公主新娘》(1987年) </原始版> <版本1> 伊尼戈·蒙托亚,《公主新娘》(1987年) </版本1> <版本2> Inigo Montoya,《公主新娘》(1987年) </版本2> <版本3> 伊尼戈·蒙托亚,《公主新娘》(1987年) </版本3> <最终版> 伊尼戈·蒙托亚,《公主新娘》(1987年) </最终版> </段落_6>
<段落_7> <原始版> 过去一个世纪中,统计学的发展见证了旨在允许从数据中进行推断的方法的蓬勃发展。这些方法在其哲学基础、它们应该解决的问题以及它们在实践中的使用频率方面存在广泛的差异。一个受欢迎且广泛推广的方法类别是区间估计。对区间估计存在各种不同的方法,其哲学基础和计算方式各异,但总体上都被认为是对参数的估计,通过给出参数的一系列值而不是单一值来考虑测量或抽样不确定性。 </原始版> <版本1> 在过去的一个世纪里,统计学的发展见证了旨在从数据中进行推断的各种方法的兴起。这些方法在其哲学基础、解决问题的方式以及实际应用的频率上存在显著差异。其中一个受欢迎且广泛使用的方法类别是区间估计。区间估计的方法众多,它们在哲学基础和计算方法上各不相同,但通常都旨在通过提供一系列可能的参数值而非单一值来反映测量或抽样的不确定性。 </版本1> <版本2> 在过去一个世纪中,统计学的发展推动了各种旨在从数据中提取推论的方法。这些方法在哲学基础、解决问题的方式以及实际应用频率上差异显著。其中,区间估计作为一种流行的方法类别,包括多种不同的方法,它们在哲学基础和计算方式上各有不同,但普遍被视为通过给出一系列参数值而不是单一值来考虑测量或抽样不确定性的参数估计方法。 </版本2> <版本3> 在过去的一个世纪中,统计学领域不断发展壮大,众多方法应运而生,旨在从数据中作出推断。这些方法在其哲学基础、解决问题的方式以及实际应用的频率等方面存在着显著差异。其中一个备受推崇且广泛应用的方法便是区间估计。尽管区间估计的方法多种多样,且在哲学基础和计算方法上各不相同,但它们共同的目标都是提供对参数的估计,通过给出一系列可能的参数值而不是单一的值来反映测量或抽样的不确定性。 </版本3> <最终版> 在过去一个世纪中,统计学的发展见证了各种从数据中提取推论的方法的兴起。这些方法在哲学基础、问题解决方式以及实际应用的频率上有显著差异。其中,区间估计作为一种流行方法,提供了多种不同哲学和计算方法的选择,普遍旨在通过提供一系列可能的参数值来反映测量或抽样的不确定性,而非单一值。 </最终版> </段落_7>
<段落_8> <原始版> 在许多种区间估计方法中,最受欢迎的是置信区间(CI)。几乎所有初级统计教材都介绍了置信区间;它们受到许多知名期刊的方法论指南的推荐或要求(例如,Psychonomics Society,2012年;Wilkinson和Statistical Inference工作组,1999年);并且它们构成了方法改革提出的方案的基础(Cumming,2014年;Loftus,1996年)。在当前方法改革的氛围中,对置信区间理论允许的推断类型以及不允许的推断类型有着明确的理解,对于决定未来如何进行科学是至关重要的。 </原始版> <版本1> 置信区间(CI)是众多区间估计方法中最受欢迎的一种。几乎所有初级统计教材都会介绍置信区间;它们被许多知名期刊的方法论指南推荐或要求(如Psychonomics Society, 2012;Wilkinson和Statistical Inference工作组, 1999);并且成为了方法改革提议的基石(如Cumming, 2014;Loftus, 1996)。在当前的方法改革氛围中,正确理解置信区间理论允许和不允许的推断类型对于决定未来科学发展方向至关重要。 </版本1> <版本2> 置信区间(CI)是众多区间估计方法中最为常用的一种。大多数初级统计教材都会介绍置信区间,很多著名期刊的方法论指南也推荐或要求使用置信区间(例如,Psychonomics Society,2012年;Wilkinson和Statistical Inference工作组,1999年),并且它们是当前方法改革提议的基础(Cumming,2014年;Loftus,1996年)。在当前的方法改革氛围中,正确理解置信区间理论允许的和不允许的推断类型对于未来科学研究的决策至关重要。 </版本2> <版本3> 在众多区间估计方法中,置信区间(CI)尤为受到欢迎。几乎所有基础统计教材都会介绍置信区间;它们被多个知名期刊的方法论指南推荐或要求,如Psychonomics Society(2012年)和Wilkinson与Statistical Inference工作组(1999年);置信区间更是许多方法改革方案的核心(例如,Cumming于2014年和Loftus于1996年提出的)。在当前的方法改革氛围中,准确理解置信区间理论允许和不允许的推断类型对于决定未来科学研究的走向至关重要。 </版本3> <最终版> 置信区间(CI)是众多区间估计方法中最受欢迎的一种。几乎所有初级统计教材都会介绍置信区间;它们被许多知名期刊的方法论指南推荐或要求(如Psychonomics Society, 2012;Wilkinson和Statistical Inference工作组, 1999);并且成为了方法改革提议的基石(如Cumming, 2014;Loftus, 1996)。在当前的方法改革氛围中,正确理解置信区间理论允许和不允许的推断类型对于决定未来科学发展方向至关重要。 </最终版> </段落_8>
<段落_9> <原始版> 在这篇论文中,我们认为对置信区间(CIs)的提倡是基于对CI理论的一种民间理解,而非一种有原则的理解。我们概述了支持民间CI理论的三种谬论,并将其置于CI理论的哲学和历史背景中。通过一个从统计文献中改编的易懂的例子,我们展示了CI理论与民间CI理论的差异。最后,我们在ANOVA和回归分析中提倡并广泛使用的一个CI的上下文中展示了对置信的谬误,并讨论了CI理论与民间CI理论不匹配的含义。 </原始版> <版本1> 本文认为,对置信区间(CIs)的推崇基于对CI理论的一种民间理解,而非原则性理解。我们总结了支持民间CI理论的三大谬误,并将其放置在CI理论的哲学和历史背景中进行探讨。通过一个改编自统计文献的简明例子,我们展示了CI理论与民间CI理论之间的差异。最后,我们在ANOVA和回归分析中广泛使用的置信区间的上下文中展示了关于置信的谬误,并讨论了CI理论与民间CI理论不一致的意义。 </版本1> <版本2> 本文认为,对置信区间(CIs)的支持基于对CI理论的一种民间理解,而不是基于原则的理解。我们概述了支持民间CI理论的三种谬论,并将其放在CI理论的哲学和历史背景中进行探讨。通过一个改编自统计文献的易懂实例,我们展示了CI理论与民间CI理论的区别。最后,我们在ANOVA和回归分析中常用的一个CI示例中展示了对置信的误解,并讨论了CI理论与民间CI理论不一致的含义。 </版本2> <版本3> 在本文中,我们认为对置信区间(CIs)的支持建立在一种民间理解而非原则性理解的基础上。我们将概述支持这种民间CI理论的三大谬误,并将其放在CI理论的哲学和历史背景下进行考察。通过一个改编自统计学文献的简明例子,我们揭示了CI理论与民间CI理论之间的差异。最后,我们将在ANOVA和回归分析中广泛使用的一个CI案例中展示对置信的误解,并讨论CI理论与民间CI理论不一致所带来的后果。 </版本3> <最终版> 本文认为,对置信区间(CIs)的支持基于对CI理论的一种民间理解,而非原则性理解。我们总结了支持民间CI理论的三大谬误,并将其放置在CI理论的哲学和历史背景中进行探讨。通过一个改编自统计文献的简明例子,我们展示了CI理论与民间CI理论之间的差异。最后,我们在ANOVA和回归分析中广泛使用的置信区间的上下文中展示了关于置信的谬误,并讨论了CI理论与民间CI理论不一致的意义。 </最终版> </段落_9>
<段落_10> <原始版> 我们的主要观点是:不应该像现代支持者建议的那样使用置信区间,因为这种用法在置信区间理论中并没有得到证明。现代支持者认为置信区间具有的好处是在置信区间理论之外的考虑因素;因此,如果按照CI支持者建议的方式使用,CI可能会提供严重误导的推断。对于许多CI,支持者实际上并没有探讨CI是否支持合理的推断。因此,我们认为在最好的情况下,对CI理论的引用是多余的,因为可以在CI理论之外证明推断的合理性,在最坏的情况下是不明智的,因为这样的引用是站不住脚的。 </原始版> <版本1> 我们的主要观点是:置信区间不应该像现代倡导者所建议的那样被使用,因为这种用法在置信区间理论中并未得到证实。支持者所声称的置信区间的优势实际上是在CI理论之外的考量;因此,按照CI倡导者的建议使用时,CI可能会导致严重误导的推断。许多支持者实际上并未探究CI是否支持合理的推断。因此,我们认为在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外证明;在最坏的情况下,这样的引用是不明智的,因为它缺乏根据。 </版本1> <版本2> 我们的主要观点是:置信区间不应像现代支持者所建议的那样使用,因为这种用法并未在置信区间理论中得到证明。现代支持者声称的置信区间的好处,其实是基于置信区间理论之外的考虑。因此,如果按照支持者的建议使用,CI可能会提供误导性的推断。对于许多CI,支持者并未探讨其是否支持合理的推断。因此,我们认为,在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外得到证明;在最坏的情况下,这种引用是不明智的,因为它是站不住脚的。 </版本2> <版本3> 我们主张的观点是:应当避免像现代支持者所提倡的那样使用置信区间,因为这种用法并没有在置信区间理论中得到证实。现代支持者宣扬的置信区间所具备的好处实际上是基于置信区间理论之外的考虑因素;因此,按照CI支持者的建议使用置信区间可能导致误导性极强的推断。对于许多CI来说,支持者并未真正探究这些CI是否支持合理的推断。因此,我们认为,在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外得到证明;在最坏的情况下,这样的引用则是不明智的,因为它们缺乏根据。 </版本3> <最终版> 我们的观点是:置信区间不应像现代支持者所建议的那样被使用,因为这种用法并未在置信区间理论中得到证实。支持者声称的置信区间的优势实际上是在CI理论之外的考虑;因此,按照CI倡导者的建议使用时,CI可能会导致误导性的推断。许多支持者实际上并未探究CI是否支持合理的推断。因此,我们认为在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外证明;在最坏的情况下,这样的引用是不明智的,因为它缺乏根据。 </最终版> </段落_10>
<段落_11> <原始版>
</原始版> <版本1>
</版本1> <版本2>
</版本2> <版本3>
</版本3> <最终版>
</最终版> </段落_11>
<段落_12> <原始版> 在科学实践中,经常有必要估计一些感兴趣的数量,并表达对这一估计的不确定性。如果我们的目标是估计正态总体的真实均值,我们可能会选择样本均值 x¯ 作为估计值。非正式地说,我们期望 x¯ 接近,但接近程度取决于样本大小和样本中观察到的变异性。为了表达估计的不确定性,通常使用置信区间。 </原始版> <版本1> 在科学研究实践中,经常需要估计某些感兴趣的量,并表达对这一估计的不确定性。如果目标是估计正态总体的真实均值μ,我们可能会选择样本均值 x̄ 作为估计。通俗地说,我们期望 x̄ 与μ接近,但接近程度依赖于样本大小和样本中观察到的变异性。为了表达估计的不确定性,通常会使用置信区间。 </版本1> <版本2> 在科学实践中,经常需要估计某些感兴趣的量,并表达对这一估计的不确定性。例如,若目标是估计正态总体的真实均值μ,我们可能选择样本均值 x̄ 作为估计值。通常我们期望 x̄ 接近μ,但接近程度取决于样本大小和样本中观察到的变异性。为了表达估计的不确定性,我们通常采用置信区间。 </版本2> <版本3> 在科学研究的实践中,我们经常需要估计某些感兴趣的量,并表达对这一估计的不确定性。例如,如果我们的目标是估计正态总体的真实均值μ,我们可能会选择样本均值 x̄ 作为估计值。一般而言,我们期望 x̄ 能接近μ,但这种接近程度取决于样本的大小和样本中观
察到的变异性。为了表达这种估计的不确定性,常用的方法是采用置信区间。 </版本3> <最终版> 在科学研究中,我们经常需要估计感兴趣的量,并表达这些估计的不确定性。例如,若目标是估计正态总体的真实均值μ,我们可能会选择样本均值 x̄ 作为估计值。通常,我们期望 x̄ 接近μ,但这种接近程度依赖于样本大小和样本中的变异性。为了表达这种估计的
不确定性,置信区间是常用的方法。 </最终版> </段落_12>
<段落_13> <原始版> 关于置信区间的所有人都同意的一点是基本定义:对于一个参数(我们通用地称为,可能表示总体均值、中位数、方差、概率或任何其他未知数量),置信区间是由一个过程生成的区间,在重复抽样中,这个过程有固定的概率包含参数。如果该过程生成包含的区间的概率为0.5,则是一个50%的置信区间;同样,对于95%的置信区间,概率为0.95。 </原始版> <版本1> 关于置信区间,大家一致认可的基本定义是:对于一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率或其他未知量),置信区间是由一个过程生成
的区间,在重复抽样中,该过程有一定的固定概率包含参数。例如,生成包含θ的区间概率为0.5的过程,产生的就是50%的置信区间;对于95%的置信区间,这个概率为0.95。 </版本1> <版本2> 关于置信区间的一个共识是其基本定义:对于一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率或其他未知量),置信区间是由一个过程生成的区间,在重复抽样
中,该过程有固定概率包含参数。例如,若该过程生成包含θ的区间的概率为0.5,则是一个50%的置信区间;对于95%的置信区间,概率为0.95。 </版本2> <版本3> 置信区间的一个普遍认可的基本定义是:对于一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率或其他未知量),置信区间是一个由特定过程生成的区间,在反复抽样中,这个过程有固定概率包含该参数。例如,如果一个过程生成包含θ的区间的概率为0.5,那么这就是一个50%的置信区间;对于95%的置信区间,这个概率则为0.95。 </版本3> <最终版> 对于置信区间,普遍接受的定义是:对一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率等未知量),置信区间是由一个过程生成的区间,在重复抽样中,该过程有固定概率包含参数。例如,产生包含θ的区间概率为0.5的过程,生成的就是50%的置信区间;对于95%的置信区间,这个概率为0.95。 </最终版> </段落_13>
<段落_14> <原始版> 定义** 1 **(置信区间) _参数 θ 的 X% 置信区间是由一个过程生成的区间( L , U ),在重复抽样中,该过程有 X% 的概率包含 θ 的真值,对于 θ 的所有可能值都成立( Neyman , 1937 )。 </原始版> <版本1> 定义 1 (置信区间):参数θ的X%置信区间是由一个过程生成的区间(L,U),在重复抽样中,该过程有X%的概率包含θ的真值,这一点对θ的所有可能值都适用(Neyman, 1937)。 </版本1> <版本2> 定义1(置信区间):参数θ的X%置信区间是由一个过程生成的区间(L,U),在重复抽样中,该过程有X%的概率包含θ的真值,且这对θ的所有可能值都成立(Neyman,1937)。 </版本2> <版本3> 定义1(置信区间) _参数 θ 的 X% 置信区间是一个区间( L , U ),由一个在重复抽样中有 X% 概率包含 θ 真值的过程生成,这一概率对于 θ 的所有可能值都适用( Neyman , 1937 )。 </版本3> <最终版> 定义1(置信区间):参数θ的X%置信区间是一个区间(L,U),由一个在重复抽样中有X%概率包含θ真值的过程生成,且这一概率适用于θ的所有可能值(Neyman, 1937)。 </最终版> </段落_14>
<段落_15> <原始版>
</最终版> </段落_15>
<段落_16> <原始版> 置信区间的置信系数来源于生成它的过程。因此,区分过程(CP)和置信区间是有帮助的:X%置信过程是在重复样本中生成覆盖θ的过程,而置信区间是由这样的过程生成的特定区间。置信过程是一个随机过程;而置信区间是被观察并固定的。 </原始版> <版本1> 置信区间的置信系数源于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是指在重复样本中生成包含θ的过程,而置信区间则是由这样的过程产生的具体区间。置信过程是随机的;而置信区间则是被观察并固定下来的。 </版本1> <版本2> 置信区间的置信系数源于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是在重复样本中生成包含θ的区间的过程,而置信区间是由此过程生成的具体区间。置信过程是随机的,而置信区间是被观察并确定的。 </版本2> <版本3> 置信区间的置信系数源于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是一个在重复样本中生成涵盖θ的区间的过程,而置信区间则是由该过程生成的特定区间。置信过程是随机的;置信区间则是观察到的且固定不变的。 </版本3> <最终版> 置信区间的置信系数来自于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是一个在重复样本中生成包含θ的区间的过程,而置信区间是由此过程生成的具体区间。置信过程是随机的,而置信区间则是被观察并固定下来的。 </最终版> </段落_16>
<段落_17> <原始版> 如何解释置信过程似乎很清晰:它是生成区间,这些区间将在样本的固定比例中包含真值的任何过程。然而,当我们从数据中计算出一个具体的区间并必须对其进行解释时,我们面临困难。如何从我们对置信过程属性的了解转移到对某个观察到的置信区间的解释,这并不明显。 </原始版> <版本1> 置信过程的解释看似清晰:它指的是生成区间的任何过程,这些区间在样本的一定比例中包含真值。然而,当我们从数据中计算出一个具体的区间并需要对其进行解释时,就遇到了困难。如何将我们对置信过程属性的理解转化为对某个具体观察到的置信区间的解释,并非易事。 </版本1> <版本2> 解释置信过程似乎很直观:它是生成区间的过程,这些区间将在一定比例的样本中包含真值。然而,当我们根据数据计算出一个具体的区间并需要对其解释时,就面临难题。如何从我们对置信过程属性的了解转移到对一个具体置信区间的解释,并不是显而易见的。 </版本2> <版本3> 对置信过程的解释似乎相当直接:它是一个生成区间的过程,这些区间在一定比例的样本中包含真值。然而,当我们从实际数据中计算出一个具体的区间并需要对其进行解释时,就会遇到挑战。如何从对置信过程属性的理解转变为对一个具体观察到的置信区间的解释,并不是一个明显的过程。 </版本3> <最终版> 解释置信过程似乎直观:它指的是生成区间的任何过程,这些区间在一定比例的样本中包含真值。然而,当我们根据数据计算出一个具体的区间并需要对其解释时,就面临挑战。如何将对置信过程属性的理解转化为对一个具体观察到的置信区间的解释,并不显而易见。 </最终版> </段落_17>
<段落_18> <原始版> 教科书作者和置信区间的支持者通过声称置信区间具有三个可取之处的属性,无缝地弥合了这个差距:首先,置信系数可以被解读为一个度量,即我们应该对区间包含参数的不确定性有多大;其次,CI宽度是估计不确定性的度量;第三,区间包含参数的"可能"或"合理"值。所有这些都涉及从观察到的数据对参数进行推理:也就是说,它们是"后数据"推断。 </原始版> <版本1> 教科书作者和置信区间的支持者常声称置信区间具有三个优点:首先,置信系数可以被解读为衡量区间包含参数不确定性的指标;其次,CI的宽度是估计不确定性的度量;第三,区间包含参数的“可能”或“合理”值。所有这些都涉及从观察到的数据对参数进行推理,即所谓的“后数据”推断。 </版本1> <版本2> 教科书作者和置信区间的支持者通常声称置信区间具有三个特性:首先,置信系数可以被解读为对区间包含参数的不确定性程度的度量;其次,CI的宽度是估计不确定性的指标;第三,区间包含了参数的"可能"或"合理"值。这些都涉及基于观察到的数据对参数进行的推理,即所谓的"后数据"推断。 </版本2> <版本3> 教科书作者和置信区间的支持者们通常通过声称置信区间具有三个有利属性来弥合这一差距:首先,置信系数可以被解读为衡量我们对区间包含参数的不确定性程度的指标;其次,CI的宽度被视为估计不确定性的度量;第三,区间被认为包含了参数的"可能"或"合理"值。所有这些解释都涉及到从观察到的数据对参数进行推理,即所谓的"后数据"推断。 </版本3> <最终版> 教科书作者和置信区间的支持者通常声称置信区间具有三个优点:一是置信系数被视为衡量区间包含参数不确定性的指标;二是CI的宽度作为估计不确定性的度量;三是区间被认为包含参数的“可能”或“合理”值。这些解释都涉及到基于观察到的数据对参数进行的所谓“后数据”推断。 </最终版> </段落_18>
<段落_19> <原始版> 例如,对于95%置信区间,Masson和Loftus(2003)陈述"在没有任何其他信息的情况下,获得的置信区间包含总体均值的概率为95%。" Cumming(2014)写道"我们可以有95%的信心认为我们的区间包含[参数],并且可以将下限和上限视为[参数]的可能下限和上限。" </原始版> <版本1> 例如,对于95%置信区间,Masson和Loftus(2003)声称“在没有其他信息的情况下,我们获得的置信区间包含总体均值的概率为95%。” Cumming(2014)则写道:“我们可以有95%的信心认为我们的区间包含[参数],并且可以将区间的下限和上限视为[参数]的可能下限和上限。” </版本1> <版本2> 例如,对于95%置信区间,Masson和Loftus(2003)表示"在没有任何其他信息的情况下,得到的置信区间包含总体均值的概率为95%。" Cumming(2014)写道:"我们可以有95%的信心认为我们的区间包含[参数],并且可以将下限和上限视为[参数]的可能下限和上限。" </版本2> <版本3> 例如,对于95%置信区间,Masson和Loftus(2003)指出:"在没有其他信息的情况下,我们得到的置信区间包含总体均值的概率为95%。" Cumming(2014)则写道:"我们可以对我们的区间有95%的信心认为它包含了[参数],并且可以将区间的上下限视为[参数]的可能的上下界。" </版本3> <最终版> 例如,对于95%置信区间,Masson和Loftus(2003)表示:“在没有其他信息的情况下,我们得到的置信区间包含总体均值的概率为95%。” Cumming(2014)则写道:“我们可以有95%的信心认为我们的区间包含[参数],并且可以将区间的上下限视为[参数]的可能上下界。” </最终版> </段落_19>
<段落_20> <原始版> 这些对置信区间的解释是不正确的。我们将这些作者犯下的错误称为"基本置信谬误"(FCF),因为它似乎是根据置信区间的定义自然流出的。 </原始版> <版本1> 然而,这些对置信区间的解释是错误的。我们将这种错误称为“基本置信谬误”(FCF),因为它似乎直接源于对置信区间定义的误解。 </版本1> <版本2> 这些对置信区间的解释是错误的。我们称这些作者犯下的错误为"基本置信谬误"(FCF),因为它似乎是根据置信区间的定义自然而然产生的。 </版本2> <版本3> 然而,这些对置信区间的解释是不正确的。我们将这些作者的错误称为"基本置信谬误"(FCF),因为它似乎是根据置信区间的定义自然而然产生的。 </版本3> <最终版> 然而,这些对置信区间的解释是错误的。我们称这种误解为“基本置信谬误”(FCF),因为它似乎源于对置信区间定义的误读。 </最终版> </段落_20>
The text was updated successfully, but these errors were encountered:
No branches or pull requests
<段落_1>
<原始版>
将信心置于置信区间的谬误
</原始版>
<版本1>
置信区间的误解
</版本1>
<版本2>
关于置信区间的常见误解
</版本2>
<版本3>
论置信区间的普遍误解
</版本3>
<最终版>
关于置信区间的普遍误解
</最终版>
</段落_1>
<段落_2>
<原始版>
摘要:
</原始版>
<版本1>
摘要:
</版本1>
<版本2>
摘要:
</版本2>
<版本3>
概要:
</版本3>
<最终版>
摘要:
</最终版>
</段落_2>
<段落_3>
<原始版>
区间估计——对包含抽样不确定性的参数进行估计的一种方法——长期以来被吹捧为统计分析的关键组成部分。有几种类型的区间估计,但最受欢迎的是置信区间(CIs):在重复抽样中,平均包含真实参数值的区间。置信区间的宽度被认为是估计的精度的指标;置信区间被认为是指导哪些参数值是合理或合理的指南;区间的置信系数(例如,95%)被认为是指示真实参数是否包含在区间内的合理性的指标。我们在许多实例中展示,置信区间不一定具有这些属性,并且可能导致不合理或任意的推断。因此,我们警告不要仅仅依赖于置信区间理论来证明区间估计,并建议使用其他区间估计理论。
</原始版>
<版本1>
区间估计作为一种评估含抽样不确定性参数的方法,长期被誉为统计分析的核心。众多区间估计方法中,置信区间(CIs)最为流行:即在重复抽样中能够平均覆盖真实参数值的区间。置信区间的宽度常被视为估计精度的标志;人们认为置信区间能指引何种参数值是可接受的;而区间的置信水平(如95%)则被看作是参数真实包含于区间内可能性的指标。然而,我们通过多个案例展示,置信区间并非总具备这些特性,且有时可能导致不合理或武断的推断。因此,我们建议不应仅依赖置信区间理论进行区间估计,而应考虑其他区间估计方法。
</版本1>
<版本2>
区间估计,即在包含抽样不确定性的情境下对参数进行估计,长久以来一直是统计分析的核心。其中,置信区间(CIs)作为一种流行的区间估计方法,其含义是在重复抽样的情况下,能够平均涵盖真实参数值的区间。通常,置信区间的宽度被视为估计精度的指标,置信区间本身被认为是判定哪些参数值是合理的指南,而区间的置信系数(例如,95%)则被视为真实参数是否包含在区间内的合理性指标。本文通过多个实例展示,置信区间并非总是具备这些特性,并且可能导致不合理或随意的推断。因此,我们建议不应单纯依赖置信区间理论来证明区间估计的合理性,并推荐使用其他区间估计理论。
</版本2>
<版本3>
长期以来,区间估计——一种涵盖抽样不确定性的参数估计方法——一直被誉为统计分析的核心要素。其中最为人熟知的便是置信区间(CIs):在反复抽样过程中,平均而言能包含真实参数值的估计区间。人们普遍认为,置信区间的宽度反映了估计的精确程度,置信区间本身则指示了哪些参数值较为合理,而区间的置信水平(如95%)则被视为真实参数落在该区间内可能性的度量。然而,我们在多个案例中展示了置信区间并非总是具备这些属性,有时甚至会引导出不合逻辑或任意的推断。因此,我们建议不应仅仅依赖于置信区间理论来进行区间估计,并提倡考虑其他估计理论。
</版本3>
<最终版>
区间估计是评估抽样不确定性参数的核心方法之一,置信区间(CIs)作为其中最为流行的方式,在重复抽样中可以平均覆盖真实参数值。一般认为,置信区间的宽度反映了估计的精确度,它本身可指引何种参数值是可接受的,而置信水平(如95%)则被看作参数真实包含于区间内可能性的度量。然而,我们的案例研究显示,置信区间并不总是具备这些特性,有时甚至会导致不合理或武断的推断。因此,我们建议不应仅依赖置信区间理论进行区间估计,而应考虑其他方法。
</最终版>
</段落_3>
<段落_4>
<原始版>
关键词: 贝叶斯推理与参数估计,贝叶斯统计学,统计推断,统计
</原始版>
<版本1>
关键词: 贝叶斯推理与参数估计,贝叶斯统计,统计推断,统计学
</版本1>
<版本2>
关键词: 贝叶斯推理与参数估计,贝叶斯统计,统计推断
</版本2>
<版本3>
关键词: 贝叶斯推断与参数估计,贝叶斯统计学,统计推理,统计学
</版本3>
<最终版>
关键词: 贝叶斯推理与参数估计,贝叶斯统计,统计推断,统计学
</最终版>
</段落_4>
<段落_5>
<原始版>
"你一直在使用那个词。我不认为它意味着你认为它意味着的那样。"
</原始版>
<版本1>
“你总在用那个词。我觉得它并不是你所想的那个意思。”
</版本1>
<版本2>
“你一直在使用那个词,我不认为它意味着你以为的那样。”
</版本2>
<版本3>
"你一直在用那个词。我不认为它的含义是你所理解的那样。"
</版本3>
<最终版>
“你一直在用那个词。我不认为它意味着你所以为的那样。”
</最终版>
</段落_5>
<段落_6>
<原始版>
Inigo Montoya,《公主新娘》(1987年)
</原始版>
<版本1>
伊尼戈·蒙托亚,《公主新娘》(1987年)
</版本1>
<版本2>
Inigo Montoya,《公主新娘》(1987年)
</版本2>
<版本3>
伊尼戈·蒙托亚,《公主新娘》(1987年)
</版本3>
<最终版>
伊尼戈·蒙托亚,《公主新娘》(1987年)
</最终版>
</段落_6>
<段落_7>
<原始版>
过去一个世纪中,统计学的发展见证了旨在允许从数据中进行推断的方法的蓬勃发展。这些方法在其哲学基础、它们应该解决的问题以及它们在实践中的使用频率方面存在广泛的差异。一个受欢迎且广泛推广的方法类别是区间估计。对区间估计存在各种不同的方法,其哲学基础和计算方式各异,但总体上都被认为是对参数的估计,通过给出参数的一系列值而不是单一值来考虑测量或抽样不确定性。
</原始版>
<版本1>
在过去的一个世纪里,统计学的发展见证了旨在从数据中进行推断的各种方法的兴起。这些方法在其哲学基础、解决问题的方式以及实际应用的频率上存在显著差异。其中一个受欢迎且广泛使用的方法类别是区间估计。区间估计的方法众多,它们在哲学基础和计算方法上各不相同,但通常都旨在通过提供一系列可能的参数值而非单一值来反映测量或抽样的不确定性。
</版本1>
<版本2>
在过去一个世纪中,统计学的发展推动了各种旨在从数据中提取推论的方法。这些方法在哲学基础、解决问题的方式以及实际应用频率上差异显著。其中,区间估计作为一种流行的方法类别,包括多种不同的方法,它们在哲学基础和计算方式上各有不同,但普遍被视为通过给出一系列参数值而不是单一值来考虑测量或抽样不确定性的参数估计方法。
</版本2>
<版本3>
在过去的一个世纪中,统计学领域不断发展壮大,众多方法应运而生,旨在从数据中作出推断。这些方法在其哲学基础、解决问题的方式以及实际应用的频率等方面存在着显著差异。其中一个备受推崇且广泛应用的方法便是区间估计。尽管区间估计的方法多种多样,且在哲学基础和计算方法上各不相同,但它们共同的目标都是提供对参数的估计,通过给出一系列可能的参数值而不是单一的值来反映测量或抽样的不确定性。
</版本3>
<最终版>
在过去一个世纪中,统计学的发展见证了各种从数据中提取推论的方法的兴起。这些方法在哲学基础、问题解决方式以及实际应用的频率上有显著差异。其中,区间估计作为一种流行方法,提供了多种不同哲学和计算方法的选择,普遍旨在通过提供一系列可能的参数值来反映测量或抽样的不确定性,而非单一值。
</最终版>
</段落_7>
<段落_8>
<原始版>
在许多种区间估计方法中,最受欢迎的是置信区间(CI)。几乎所有初级统计教材都介绍了置信区间;它们受到许多知名期刊的方法论指南的推荐或要求(例如,Psychonomics Society,2012年;Wilkinson和Statistical Inference工作组,1999年);并且它们构成了方法改革提出的方案的基础(Cumming,2014年;Loftus,1996年)。在当前方法改革的氛围中,对置信区间理论允许的推断类型以及不允许的推断类型有着明确的理解,对于决定未来如何进行科学是至关重要的。
</原始版>
<版本1>
置信区间(CI)是众多区间估计方法中最受欢迎的一种。几乎所有初级统计教材都会介绍置信区间;它们被许多知名期刊的方法论指南推荐或要求(如Psychonomics Society, 2012;Wilkinson和Statistical Inference工作组, 1999);并且成为了方法改革提议的基石(如Cumming, 2014;Loftus, 1996)。在当前的方法改革氛围中,正确理解置信区间理论允许和不允许的推断类型对于决定未来科学发展方向至关重要。
</版本1>
<版本2>
置信区间(CI)是众多区间估计方法中最为常用的一种。大多数初级统计教材都会介绍置信区间,很多著名期刊的方法论指南也推荐或要求使用置信区间(例如,Psychonomics Society,2012年;Wilkinson和Statistical Inference工作组,1999年),并且它们是当前方法改革提议的基础(Cumming,2014年;Loftus,1996年)。在当前的方法改革氛围中,正确理解置信区间理论允许的和不允许的推断类型对于未来科学研究的决策至关重要。
</版本2>
<版本3>
在众多区间估计方法中,置信区间(CI)尤为受到欢迎。几乎所有基础统计教材都会介绍置信区间;它们被多个知名期刊的方法论指南推荐或要求,如Psychonomics Society(2012年)和Wilkinson与Statistical Inference工作组(1999年);置信区间更是许多方法改革方案的核心(例如,Cumming于2014年和Loftus于1996年提出的)。在当前的方法改革氛围中,准确理解置信区间理论允许和不允许的推断类型对于决定未来科学研究的走向至关重要。
</版本3>
<最终版>
置信区间(CI)是众多区间估计方法中最受欢迎的一种。几乎所有初级统计教材都会介绍置信区间;它们被许多知名期刊的方法论指南推荐或要求(如Psychonomics Society, 2012;Wilkinson和Statistical Inference工作组, 1999);并且成为了方法改革提议的基石(如Cumming, 2014;Loftus, 1996)。在当前的方法改革氛围中,正确理解置信区间理论允许和不允许的推断类型对于决定未来科学发展方向至关重要。
</最终版>
</段落_8>
<段落_9>
<原始版>
在这篇论文中,我们认为对置信区间(CIs)的提倡是基于对CI理论的一种民间理解,而非一种有原则的理解。我们概述了支持民间CI理论的三种谬论,并将其置于CI理论的哲学和历史背景中。通过一个从统计文献中改编的易懂的例子,我们展示了CI理论与民间CI理论的差异。最后,我们在ANOVA和回归分析中提倡并广泛使用的一个CI的上下文中展示了对置信的谬误,并讨论了CI理论与民间CI理论不匹配的含义。
</原始版>
<版本1>
本文认为,对置信区间(CIs)的推崇基于对CI理论的一种民间理解,而非原则性理解。我们总结了支持民间CI理论的三大谬误,并将其放置在CI理论的哲学和历史背景中进行探讨。通过一个改编自统计文献的简明例子,我们展示了CI理论与民间CI理论之间的差异。最后,我们在ANOVA和回归分析中广泛使用的置信区间的上下文中展示了关于置信的谬误,并讨论了CI理论与民间CI理论不一致的意义。
</版本1>
<版本2>
本文认为,对置信区间(CIs)的支持基于对CI理论的一种民间理解,而不是基于原则的理解。我们概述了支持民间CI理论的三种谬论,并将其放在CI理论的哲学和历史背景中进行探讨。通过一个改编自统计文献的易懂实例,我们展示了CI理论与民间CI理论的区别。最后,我们在ANOVA和回归分析中常用的一个CI示例中展示了对置信的误解,并讨论了CI理论与民间CI理论不一致的含义。
</版本2>
<版本3>
在本文中,我们认为对置信区间(CIs)的支持建立在一种民间理解而非原则性理解的基础上。我们将概述支持这种民间CI理论的三大谬误,并将其放在CI理论的哲学和历史背景下进行考察。通过一个改编自统计学文献的简明例子,我们揭示了CI理论与民间CI理论之间的差异。最后,我们将在ANOVA和回归分析中广泛使用的一个CI案例中展示对置信的误解,并讨论CI理论与民间CI理论不一致所带来的后果。
</版本3>
<最终版>
本文认为,对置信区间(CIs)的支持基于对CI理论的一种民间理解,而非原则性理解。我们总结了支持民间CI理论的三大谬误,并将其放置在CI理论的哲学和历史背景中进行探讨。通过一个改编自统计文献的简明例子,我们展示了CI理论与民间CI理论之间的差异。最后,我们在ANOVA和回归分析中广泛使用的置信区间的上下文中展示了关于置信的谬误,并讨论了CI理论与民间CI理论不一致的意义。
</最终版>
</段落_9>
<段落_10>
<原始版>
我们的主要观点是:不应该像现代支持者建议的那样使用置信区间,因为这种用法在置信区间理论中并没有得到证明。现代支持者认为置信区间具有的好处是在置信区间理论之外的考虑因素;因此,如果按照CI支持者建议的方式使用,CI可能会提供严重误导的推断。对于许多CI,支持者实际上并没有探讨CI是否支持合理的推断。因此,我们认为在最好的情况下,对CI理论的引用是多余的,因为可以在CI理论之外证明推断的合理性,在最坏的情况下是不明智的,因为这样的引用是站不住脚的。
</原始版>
<版本1>
我们的主要观点是:置信区间不应该像现代倡导者所建议的那样被使用,因为这种用法在置信区间理论中并未得到证实。支持者所声称的置信区间的优势实际上是在CI理论之外的考量;因此,按照CI倡导者的建议使用时,CI可能会导致严重误导的推断。许多支持者实际上并未探究CI是否支持合理的推断。因此,我们认为在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外证明;在最坏的情况下,这样的引用是不明智的,因为它缺乏根据。
</版本1>
<版本2>
我们的主要观点是:置信区间不应像现代支持者所建议的那样使用,因为这种用法并未在置信区间理论中得到证明。现代支持者声称的置信区间的好处,其实是基于置信区间理论之外的考虑。因此,如果按照支持者的建议使用,CI可能会提供误导性的推断。对于许多CI,支持者并未探讨其是否支持合理的推断。因此,我们认为,在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外得到证明;在最坏的情况下,这种引用是不明智的,因为它是站不住脚的。
</版本2>
<版本3>
我们主张的观点是:应当避免像现代支持者所提倡的那样使用置信区间,因为这种用法并没有在置信区间理论中得到证实。现代支持者宣扬的置信区间所具备的好处实际上是基于置信区间理论之外的考虑因素;因此,按照CI支持者的建议使用置信区间可能导致误导性极强的推断。对于许多CI来说,支持者并未真正探究这些CI是否支持合理的推断。因此,我们认为,在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外得到证明;在最坏的情况下,这样的引用则是不明智的,因为它们缺乏根据。
</版本3>
<最终版>
我们的观点是:置信区间不应像现代支持者所建议的那样被使用,因为这种用法并未在置信区间理论中得到证实。支持者声称的置信区间的优势实际上是在CI理论之外的考虑;因此,按照CI倡导者的建议使用时,CI可能会导致误导性的推断。许多支持者实际上并未探究CI是否支持合理的推断。因此,我们认为在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外证明;在最坏的情况下,这样的引用是不明智的,因为它缺乏根据。
</最终版>
</段落_10>
<段落_11>
<原始版>
置信区间的民间理论
</原始版>
<版本1>
置信区间的民间理解
</版本1>
<版本2>
置信区间的民间理论
</版本2>
<版本3>
置信区间的民间理论
</版本3>
<最终版>
置信区间的民间理论
</最终版>
</段落_11>
<段落_12>
<原始版>
在科学实践中,经常有必要估计一些感兴趣的数量,并表达对这一估计的不确定性。如果我们的目标是估计正态总体的真实均值,我们可能会选择样本均值 x¯ 作为估计值。非正式地说,我们期望 x¯ 接近,但接近程度取决于样本大小和样本中观察到的变异性。为了表达估计的不确定性,通常使用置信区间。
</原始版>
<版本1>
在科学研究实践中,经常需要估计某些感兴趣的量,并表达对这一估计的不确定性。如果目标是估计正态总体的真实均值μ,我们可能会选择样本均值 x̄ 作为估计。通俗地说,我们期望 x̄ 与μ接近,但接近程度依赖于样本大小和样本中观察到的变异性。为了表达估计的不确定性,通常会使用置信区间。
</版本1>
<版本2>
在科学实践中,经常需要估计某些感兴趣的量,并表达对这一估计的不确定性。例如,若目标是估计正态总体的真实均值μ,我们可能选择样本均值 x̄ 作为估计值。通常我们期望 x̄ 接近μ,但接近程度取决于样本大小和样本中观察到的变异性。为了表达估计的不确定性,我们通常采用置信区间。
</版本2>
<版本3>
在科学研究的实践中,我们经常需要估计某些感兴趣的量,并表达对这一估计的不确定性。例如,如果我们的目标是估计正态总体的真实均值μ,我们可能会选择样本均值 x̄ 作为估计值。一般而言,我们期望 x̄ 能接近μ,但这种接近程度取决于样本的大小和样本中观
察到的变异性。为了表达这种估计的不确定性,常用的方法是采用置信区间。
</版本3>
<最终版>
在科学研究中,我们经常需要估计感兴趣的量,并表达这些估计的不确定性。例如,若目标是估计正态总体的真实均值μ,我们可能会选择样本均值 x̄ 作为估计值。通常,我们期望 x̄ 接近μ,但这种接近程度依赖于样本大小和样本中的变异性。为了表达这种估计的
不确定性,置信区间是常用的方法。
</最终版>
</段落_12>
<段落_13>
<原始版>
关于置信区间的所有人都同意的一点是基本定义:对于一个参数(我们通用地称为,可能表示总体均值、中位数、方差、概率或任何其他未知数量),置信区间是由一个过程生成的区间,在重复抽样中,这个过程有固定的概率包含参数。如果该过程生成包含的区间的概率为0.5,则是一个50%的置信区间;同样,对于95%的置信区间,概率为0.95。
</原始版>
<版本1>
关于置信区间,大家一致认可的基本定义是:对于一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率或其他未知量),置信区间是由一个过程生成
的区间,在重复抽样中,该过程有一定的固定概率包含参数。例如,生成包含θ的区间概率为0.5的过程,产生的就是50%的置信区间;对于95%的置信区间,这个概率为0.95。
</版本1>
<版本2>
关于置信区间的一个共识是其基本定义:对于一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率或其他未知量),置信区间是由一个过程生成的区间,在重复抽样
中,该过程有固定概率包含参数。例如,若该过程生成包含θ的区间的概率为0.5,则是一个50%的置信区间;对于95%的置信区间,概率为0.95。
</版本2>
<版本3>
置信区间的一个普遍认可的基本定义是:对于一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率或其他未知量),置信区间是一个由特定过程生成的区间,在反复抽样中,这个过程有固定概率包含该参数。例如,如果一个过程生成包含θ的区间的概率为0.5,那么这就是一个50%的置信区间;对于95%的置信区间,这个概率则为0.95。
</版本3>
<最终版>
对于置信区间,普遍接受的定义是:对一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率等未知量),置信区间是由一个过程生成的区间,在重复抽样中,该过程有固定概率包含参数。例如,产生包含θ的区间概率为0.5的过程,生成的就是50%的置信区间;对于95%的置信区间,这个概率为0.95。
</最终版>
</段落_13>
<段落_14>
<原始版>
定义** 1 **(置信区间) _参数 θ 的 X% 置信区间是由一个过程生成的区间( L , U ),在重复抽样中,该过程有 X% 的概率包含 θ 的真值,对于 θ 的所有可能值都成立( Neyman , 1937 )。
</原始版>
<版本1>
定义 1 (置信区间):参数θ的X%置信区间是由一个过程生成的区间(L,U),在重复抽样中,该过程有X%的概率包含θ的真值,这一点对θ的所有可能值都适用(Neyman, 1937)。
</版本1>
<版本2>
定义1(置信区间):参数θ的X%置信区间是由一个过程生成的区间(L,U),在重复抽样中,该过程有X%的概率包含θ的真值,且这对θ的所有可能值都成立(Neyman,1937)。
</版本2>
<版本3>
定义1(置信区间) _参数 θ 的 X% 置信区间是一个区间( L , U ),由一个在重复抽样中有 X% 概率包含 θ 真值的过程生成,这一概率对于 θ 的所有可能值都适用( Neyman , 1937 )。
</版本3>
<最终版>
定义1(置信区间):参数θ的X%置信区间是一个区间(L,U),由一个在重复抽样中有X%概率包含θ真值的过程生成,且这一概率适用于θ的所有可能值(Neyman, 1937)。
</最终版>
</段落_14>
<段落_15>
<原始版>
1_
</原始版>
<版本1>
1
</版本1>
<版本2>
1_
</版本2>
<版本3>
1
</版本3>
<最终版>
1
</最终版>
</段落_15>
<段落_16>
<原始版>
置信区间的置信系数来源于生成它的过程。因此,区分过程(CP)和置信区间是有帮助的:X%置信过程是在重复样本中生成覆盖θ的过程,而置信区间是由这样的过程生成的特定区间。置信过程是一个随机过程;而置信区间是被观察并固定的。
</原始版>
<版本1>
置信区间的置信系数源于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是指在重复样本中生成包含θ的过程,而置信区间则是由这样的过程产生的具体区间。置信过程是随机的;而置信区间则是被观察并固定下来的。
</版本1>
<版本2>
置信区间的置信系数源于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是在重复样本中生成包含θ的区间的过程,而置信区间是由此过程生成的具体区间。置信过程是随机的,而置信区间是被观察并确定的。
</版本2>
<版本3>
置信区间的置信系数源于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是一个在重复样本中生成涵盖θ的区间的过程,而置信区间则是由该过程生成的特定区间。置信过程是随机的;置信区间则是观察到的且固定不变的。
</版本3>
<最终版>
置信区间的置信系数来自于其生成过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程是一个在重复样本中生成包含θ的区间的过程,而置信区间是由此过程生成的具体区间。置信过程是随机的,而置信区间则是被观察并固定下来的。
</最终版>
</段落_16>
<段落_17>
<原始版>
如何解释置信过程似乎很清晰:它是生成区间,这些区间将在样本的固定比例中包含真值的任何过程。然而,当我们从数据中计算出一个具体的区间并必须对其进行解释时,我们面临困难。如何从我们对置信过程属性的了解转移到对某个观察到的置信区间的解释,这并不明显。
</原始版>
<版本1>
置信过程的解释看似清晰:它指的是生成区间的任何过程,这些区间在样本的一定比例中包含真值。然而,当我们从数据中计算出一个具体的区间并需要对其进行解释时,就遇到了困难。如何将我们对置信过程属性的理解转化为对某个具体观察到的置信区间的解释,并非易事。
</版本1>
<版本2>
解释置信过程似乎很直观:它是生成区间的过程,这些区间将在一定比例的样本中包含真值。然而,当我们根据数据计算出一个具体的区间并需要对其解释时,就面临难题。如何从我们对置信过程属性的了解转移到对一个具体置信区间的解释,并不是显而易见的。
</版本2>
<版本3>
对置信过程的解释似乎相当直接:它是一个生成区间的过程,这些区间在一定比例的样本中包含真值。然而,当我们从实际数据中计算出一个具体的区间并需要对其进行解释时,就会遇到挑战。如何从对置信过程属性的理解转变为对一个具体观察到的置信区间的解释,并不是一个明显的过程。
</版本3>
<最终版>
解释置信过程似乎直观:它指的是生成区间的任何过程,这些区间在一定比例的样本中包含真值。然而,当我们根据数据计算出一个具体的区间并需要对其解释时,就面临挑战。如何将对置信过程属性的理解转化为对一个具体观察到的置信区间的解释,并不显而易见。
</最终版>
</段落_17>
<段落_18>
<原始版>
教科书作者和置信区间的支持者通过声称置信区间具有三个可取之处的属性,无缝地弥合了这个差距:首先,置信系数可以被解读为一个度量,即我们应该对区间包含参数的不确定性有多大;其次,CI宽度是估计不确定性的度量;第三,区间包含参数的"可能"或"合理"值。所有这些都涉及从观察到的数据对参数进行推理:也就是说,它们是"后数据"推断。
</原始版>
<版本1>
教科书作者和置信区间的支持者常声称置信区间具有三个优点:首先,置信系数可以被解读为衡量区间包含参数不确定性的指标;其次,CI的宽度是估计不确定性的度量;第三,区间包含参数的“可能”或“合理”值。所有这些都涉及从观察到的数据对参数进行推理,即所谓的“后数据”推断。
</版本1>
<版本2>
教科书作者和置信区间的支持者通常声称置信区间具有三个特性:首先,置信系数可以被解读为对区间包含参数的不确定性程度的度量;其次,CI的宽度是估计不确定性的指标;第三,区间包含了参数的"可能"或"合理"值。这些都涉及基于观察到的数据对参数进行的推理,即所谓的"后数据"推断。
</版本2>
<版本3>
教科书作者和置信区间的支持者们通常通过声称置信区间具有三个有利属性来弥合这一差距:首先,置信系数可以被解读为衡量我们对区间包含参数的不确定性程度的指标;其次,CI的宽度被视为估计不确定性的度量;第三,区间被认为包含了参数的"可能"或"合理"值。所有这些解释都涉及到从观察到的数据对参数进行推理,即所谓的"后数据"推断。
</版本3>
<最终版>
教科书作者和置信区间的支持者通常声称置信区间具有三个优点:一是置信系数被视为衡量区间包含参数不确定性的指标;二是CI的宽度作为估计不确定性的度量;三是区间被认为包含参数的“可能”或“合理”值。这些解释都涉及到基于观察到的数据对参数进行的所谓“后数据”推断。
</最终版>
</段落_18>
<段落_19>
<原始版>
例如,对于95%置信区间,Masson和Loftus(2003)陈述"在没有任何其他信息的情况下,获得的置信区间包含总体均值的概率为95%。" Cumming(2014)写道"我们可以有95%的信心认为我们的区间包含[参数],并且可以将下限和上限视为[参数]的可能下限和上限。"
</原始版>
<版本1>
例如,对于95%置信区间,Masson和Loftus(2003)声称“在没有其他信息的情况下,我们获得的置信区间包含总体均值的概率为95%。” Cumming(2014)则写道:“我们可以有95%的信心认为我们的区间包含[参数],并且可以将区间的下限和上限视为[参数]的可能下限和上限。”
</版本1>
<版本2>
例如,对于95%置信区间,Masson和Loftus(2003)表示"在没有任何其他信息的情况下,得到的置信区间包含总体均值的概率为95%。" Cumming(2014)写道:"我们可以有95%的信心认为我们的区间包含[参数],并且可以将下限和上限视为[参数]的可能下限和上限。"
</版本2>
<版本3>
例如,对于95%置信区间,Masson和Loftus(2003)指出:"在没有其他信息的情况下,我们得到的置信区间包含总体均值的概率为95%。" Cumming(2014)则写道:"我们可以对我们的区间有95%的信心认为它包含了[参数],并且可以将区间的上下限视为[参数]的可能的上下界。"
</版本3>
<最终版>
例如,对于95%置信区间,Masson和Loftus(2003)表示:“在没有其他信息的情况下,我们得到的置信区间包含总体均值的概率为95%。” Cumming(2014)则写道:“我们可以有95%的信心认为我们的区间包含[参数],并且可以将区间的上下限视为[参数]的可能上下界。”
</最终版>
</段落_19>
<段落_20>
<原始版>
这些对置信区间的解释是不正确的。我们将这些作者犯下的错误称为"基本置信谬误"(FCF),因为它似乎是根据置信区间的定义自然流出的。
</原始版>
<版本1>
然而,这些对置信区间的解释是错误的。我们将这种错误称为“基本置信谬误”(FCF),因为它似乎直接源于对置信区间定义的误解。
</版本1>
<版本2>
这些对置信区间的解释是错误的。我们称这些作者犯下的错误为"基本置信谬误"(FCF),因为它似乎是根据置信区间的定义自然而然产生的。
</版本2>
<版本3>
然而,这些对置信区间的解释是不正确的。我们将这些作者的错误称为"基本置信谬误"(FCF),因为它似乎是根据置信区间的定义自然而然产生的。
</版本3>
<最终版>
然而,这些对置信区间的解释是错误的。我们称这种误解为“基本置信谬误”(FCF),因为它似乎源于对置信区间定义的误读。
</最终版>
</段落_20>
The text was updated successfully, but these errors were encountered: