- 讲师:刘萍萍 / 谢楠
- 课时:160h
- 价格 4580 元
特色双名师解密新课程高频考点,送国家电网教材讲义,助力一次通关
配套通关班送国网在线题库一套
【数据分析】
描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。由于在对现实问题的研究中,所获得的数据主要是样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。
(1)描述统计
描述统计研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。
①数据的整理
a.数据的检查。主要检查数据的完整性和正确性。
b.数据的分类。
c.数据的排序。包括顺序排列、等级排列和频数排列。
②频数分布描述方法
a.频数分布表
第一步:求全距R;第二步:设定组距d和组数r;第三步:划分组区间;第四步:求组中值m;第五步:登记频数。
b.频数分布图
常用的频数分布图有:条形图、饼状图、直方图、多边图。
c.常用特征参数:平均数、中位数、众数、方差和标准差、标准分数
算术平均数:平均数是指算术平均数,符号"M"。是所有观测值的总和除以观测值的个数之商,能够非常灵敏地反映数据的变动并有效比较和判断样本之间的差异情况。
加权平均值:将各数值乘以相应的权重值,然后加总求和得到总体值,再除以总的单位数。
【例】下面是一个同学的某一科的考试成绩:
平时测验80,期中90,期末95,学校规定的科目成绩的计算方式是:平时测验占20%,期中成绩占30%,期末成绩占50%。这里每个成绩所占的比重叫做权数或权重。
那么,加权平均值=80*20%+90*30%+95*50%=90.5
算术平均值(80+90+95)/3=88.3
中位数:中数又称中位数,符号"Md"。是指将所有观测数据按大小顺序进行排列,位于中间位置的数值即为中数,用以描述一组数据的典型水平。
求中数有三种情况:样本个数n为奇数时,第(n+1)/n个为中数;样本个数n为偶数时,中数为中间两数的平均数。
众数:众数,符号"Mo"。是观测值中出现次数最多的那个数,是集中量的一个指标。
平均数、中数与众数的关系:Mo=3Md-2M;在正态分布下,中数和平均数相等。
方差和标准差:差异量数是一个距离概念,符号S(方差就是标准差的平方,符号S2)表示一个数与另一个数或中心点之间的距离。方差和标准差是教育研究数据中常用的差异量数。
标准分数:分数是教育研究测量中的一种量化指标,常用的是标准Z分数,其为反映个体在总体中相对位置的统计量。韦克斯勒智力量表用的就是这种数据统计方式。标准分数的单位是标准差,即原始数据与平均数的差--差距越大,标准分数越大。大于平均数的原始数据,标准差为正,反之为负。
相关分析:研究两个变量之间的变化方向及其密切程度的分析称为相关分析。用r表示,相关系数的范围是-10为正相关;r的绝对值=1时,相关性最大,r=1时为完全正相关,反之为完全负相关。最常用的相关方式为积差相关(又名斯皮尔曼相关)。但需要注意的的是,相关关系不等于因果,高相关不意味着具有因果关系。
(2)推断统计
推断统计是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
推断的内容有:a.总体参数的估计;b.假设检验。
推断技术主要包括参数估计的点估计和区间估计,还包括检验假设的参数检验技术和非参数检验技术。参数检验常用的技术是平均数Z检验(两个大样本)、单样本t检验(两个小样本)、方差分析(两个以上样本);非参数估计主要运用χ2检验。
责编:文晖
课程专业名称 |
讲师 |
课时 |
查看课程 |
---|
课程专业名称 |
讲师 |
课时 |
查看课程 |
---|
点击加载更多评论>>