首页 > 数学 > 数学百科 > 正文

数据的描述—总体与样本

  • 日期:2009-08-29 08:08
  • 来源: 互联网
  • 浏览:
  • 字体:[ ]
在科学和社会的实践中,我们对于要描述的对象的集合中的每个个体总要联系上一个数,这样就得到一大堆数据。个体的集合称为总体,而总体的一部分称为样本。实际上,我们很难对总体进行全面的描述,而且往往也没有这个必要,例如全国小麦每亩产量。实际上,我们只是从样本的观察来对总体下结论的,这个过程称为统计推断。20世纪之前,对于总体与样本的区别是认识不够的。-yIJ 20 世纪初才弄清楚总体与样本之间的联系和区别,同时把统计的问题明确规定下来:(1)规格问题 即选择什么样的概率分布来描述总体。例如某一个量的测量数据,我们往往选择正态分布来描述。(2)估计问题 即通过样本中算出的一些量,称为统计量.来估计总体分布中的参数。(3)分布问题 即统计量的分布。因此在20年代,统计学的基本任务就是由样本做出关于总体结论的统计推断。
     为了得出正确推断,这个过程要有一个标准程式:(1)总体是一个客观存在的总体(例如本书所有句子构成的总体)。(2)样本是一个随机样本,而不是一个有代表性的样本,例如 10000人的人群中不能只选男性或女性。样本的选取要机会均等。为了得到随机样本,统计学家已编制了随机数表。(3)根据样本的统计值,对总体的参数进行估计,然后计算不确定性的区间,大致相当于误差范围。例如,总体是本书中所有句子中的字数,要估计参数是所有句子的平均字数。随机抽出10句,平均得出每句平均字数15个字,由于样本数太少,很少可能总体的平均字数也是15个字,我们可以根据统计理论计算出不确定性区间是15±5个字,也就是10个字到20个字的可能性较大。(4)统计检验,也就是判断样本信息支持总体参数的理想值到什么程度。

    相关文章

    关于我们 广告合作 版权声明意见建议 RSS订阅 TAG标签网站地图

    COPYRIGHT 2009 - 2020 自学习网

    本站部分内容摘自网络,若您的文章不愿被本站摘录,请及时通知我们。