本文主要针对统计学都要学哪些知识,统计学基础笔记整理和统计学的专业知识等几个问题进行详细讲解,大家可以通过阅读这篇文章对统计学都要学哪些知识有一个初步认识,对于今年数据...
考研攻略
统计学专业要学:
专可能性统计、高等代数、数学分析、常微分方程、复变函数、实变函数、数学物理方程、数学实验、数学模型、数学方式论、普通物理、线性规划等。
数理统计、时间序列分析、多元统计分析、应用随机过程、统计计算、非参数统计等课程。
统计学考点重要内容及核心考点:
比如:
第一个、平均值,标准差,极差,方差,中位数的计算。
第二个、条形图,柏拉图,特性要因图,趋势图,饼形图的制作。
第三个、各项绩效指标的计算,如OEE,合格率,直通率,稼动率,材料耗用率。
第四个、假设再懂一部分统计检定,方差分析等会更好。
1. 数据收集:了解如何有效地收集数据,涵盖问卷调查、实地观察、抽样等方式。
2. 数据整理:学习对数据进行整理和归纳的方式,比如制表、绘制图表等。
3. 描述统计:掌握并熟悉常见的描述性统计量,比如平均数、中位数、众数、范围、方差和标准差等,以了解数据的集中趋势、离散程度等。
4. 可能性与统计分布:研究可能性和统计分布的基础理论,涵盖事件、样本空间、可能性、离散型和连续型随机变量等。
5. 抽样与推断统计:学习如何通过样本推断整体特点,并了解抽样误差、置信区间和假设检验等方式。
6. 有关与回归分析:掌握并熟悉有关系数和回归分析的原理和应用,用于研究变量当中的关系和预测。
7. 统计图表和图示:学习使用各自不同的统计图表和图示,比如直方图、条形图、饼图、散点图等,以展示和解释数据。
8. 统计学实践:通过实质上问题和案例研究,应用统计学方式和技巧处理实质上问题,培养统计思维和实践能力。
要做好数据分析,除了自己技术硬还有数据思维灵活外,还得学会必备的统计学基础知识!因为这个原因,统计学是数据分析一定要掌握并熟悉的基础知识,即通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的实质,甚至预测对象未来的一门综合性科学。
统计学用到了非常多的数学及其它学科的专业知识,其应用范围基本上覆盖了社会科学和自然科学的各个领域,而在数据量非常大的网络领域也不例外,因为这个原因扎实的统计学基础是一个优秀的数据人必备的技能。
但是统计学的知识涵盖了图形信息化、数据的集中趋势、可能性计算、排列组合、连续型可能性分布、离散型可能性分布、假设检验、有关和回归等知识,针对详细的重要内容及核心考点,本篇文章就不一一讲解了,感兴趣的考生请参考《深入浅出统计学》、《统计学:从数据到结论》等专业书籍。
统计学分为描述性统计学和推断性统计学。
一、描述性统计
定义:使用特定的数字或图表来反映数据的集中程度和离散程度。
1、集中趋势
集中趋势是指一组数据所趋向的中心数值,用到的指标有:算数均数、几何均数、中位数。
1) 算数均数:即为均数,用以反映一组呈对称分布的变量值在数量上的平均水平。
2)几何均数:经常会用到以反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
3)中位数:适用于偏态分布资料和一端或两端无确切的数值的资料是第50百分位数。
4)百分位数:为一界值,用来最终确定医学参考值范围。
2、 离散趋势
离散趋势是反映数据的变异程度,经常会用到指标有极差、四分位间距、方差与标准差、变异系数。
1)极差:为一组数据的最大值和最小值之差,但极差不可以反映全部数据的变异大小,且极易受样本含量的影响。经常会用到以描述偏态分布。
2)四分位数间距:它是由第3四分位数与第1四分位数相减得到,常和中位数一起描述偏态分布资料的分布。
3)方差与标准差:反映一组数据的平均离散水平,消除了样本含量的影响,常和均数一起用来描述一组数据中的离散和集中趋势。
4)变异系数:也称作异常值,多用于观察指标单位不一样时,可消除因单位不一样而不可以进行比较的困难。
比如箱线图完全就能够很好反映这当中部分重点统计值。
3、抽样方式和中心极限制要求理
#抽样方式
我们在做产品检验时,不可能把全部的产品都打开检验一遍看是不是合格,我们只可以从都的产品中抽取部分样本进行检验,依据样本的质量估算整体的产品质量,这个就是抽样,抽样的定义是为了检验整体从整体中抽离部分样本进行检测,以样本的检测结果进行整体质量的估算的方式。
抽样有各种方式,针对不一样的目标和场景,需运用不一样的方式进行检测,常见的抽样方式有:
#可能性抽样
•简单随机抽样;
•分层抽样;
•整群抽样(先将整体中若干个单位合并为组,这样的组称为群,再直接对群进行抽样);
•系统抽样(将整体中全部单位按一定顺序排列,在规定的范围内随机抽取一个单位作为初始单位,然后再按事先指定好的规则确定其他样本单位);
•阶段抽样(先抽群,然后在群内进行二阶段抽样)。
#非可能性抽样
•方便抽样(依据方便原则自行确定);
•判断抽样(依据专业知识进行判断);
•自愿样本(调查者自愿参与);
•滚雪球样本(类似树结构);
•配额样本(类似分层抽样);
#两者抽样方式当中的比较:
•非可能性抽样合适探索性的研究,为更深入的数据分析做准备,特点是操作简单方便、时效快、成本低。而且,针对抽样中的统计专业技术要求不是很高;
•可能性抽样的技术含量更高,调查成本更高,统计学专业知识要求更高,合适调查目标为研究对象整体,得到整体参数的置信区间。
#中心极限制要求理:若给定样本量的全部样本来自任意整体,则样本均值的抽样分布近似服从正态分布,且样本量越大,近似性越强。以30为界限,当样本量大于30时满足中心极限制要求理,样本服从正态分布;当样本量小于30时,整体近似正态分布时,这个时候样本服从t分布。样本的分布形态决定了我们在假设检验中采取何种方法去检验它。
二、推断性统计
定义:按照样本数据推断整体的数据特点。
1、基本步骤
产品质检时用的基本上都是抽样方式的推断性统计,推断性的过程就是一种假设检验,在做推断性统计时我们需明确几点:
1)问题是什么?-
2)需明确的证据是什么?
3)判断标准是什么?
明确后可以对应我们假设检验的哪些步骤了:
1)提出原假设(H0)和备选假设(H1),确定显著性水平(原假设为正确时,大家把它拒绝了的可能性)
2)选择检验方式,确定检验统计量
3)确定P值,作出统计推理
假设针对某一个器件,国家标准要求:平均值要低于20。
某公司制造出10个器件,有关数值请看下方具体内容:15.6 16.2 22.5 20.5 16.4 19.4 16.6 17.9 12.7 13.9
运用假设检验判断该公司器件是不是满足国家标准:
1)设假设:
原假设:器件平均值=20;
备择假设:器件平均值20;
2)整体为正态分布,方差未知,样本为小样本,因为这个原因采取T检验。
3)计算检验统计量:样本平均值17.17,样本标准差2.98,检验统计量为 (17.17-20)/(2.98/√10)=-3.0031
4)当置信度选择97.5%,自由度为9,这个时候为单尾检验,临界值为2.262。
5)因为-3.0031-2.262,拒绝原假设,因为这个原因接受备择假设,该器件满足国家标准。
2、假设检验类型
•单样本检验:检验单个样本的平均值是不是等于目标值
•有关配对检验:检验有关或配对观测之差的平均值是不是等于目标值
•独立双样本检验:检验两个独立样本的平均值之差是不是等于目标值
3、统计检验方式
Z检验:大多数情况下用于大样本(即样本容量大于30)平均值差异性检验的方式。它是用标准正态分布的理论来推断差异出现的可能性,以此比较两个平均数平均数的差异是不是显著。
T检验:用于样本含量较小(比如n30),整体标准差σ未知的正态分布样本。
F检验:F检验又叫方差齐性检验。在两样本t检验中要用到F检验。检验两个样本的方差是不是有显著性差异 这是选择哪种T检验(等方差双样本检验,异方差双样本检验)的前提条件。
(T检验用来检测数据的准确度,检测系统误差 ;F检验用来检测数据的精密度,检测偶然误差)
卡方检验:主要用于检验两个或两个以上样本率或构成比当中差别的显著性,也可以检验两类事物当中是不是存在一定的关系。
4、 双尾检测和单尾检测
这个和我们提出的原假设有关,比如我们检测的原假设:器件平均值=20;我们需拒绝的假设就是器件平均值20,这个时候就是单尾检验;假设我们的原假设是器件平均值20,则我们需拒绝的假设就是器件平均值20和器件平均值=20,这个时候就是双尾检测;
5、置信区间和置信水平
在统计学中,基本上都是依据样本来推断整体的情况的,但是在推断的途中,我们会碰见各自不同的各样的阻碍和干扰,故此,我们推断出的结果不是一个切确的数字,而是在某个合理的区间内,这个范围就是置信区间。
但整体中全部的数据都在这个范围也不现实,我们只大部分出现在->置信区间完全就能够了,这里的大部分就是置信水平的概念,一般情况我们的置信水平是95%。
置信区间[a,b]的计算方式为:(z成绩:由置信水平决定,查表得)
a = 样本均值 - z*标准误差,b = 样本均值 + z*标准误差
勤练习,软件熟;一定要熟练一门统计软件,现在主流的软件有SAS(医学上不少一定要使用这个)、SPSS、R和matlab等,这当中R是完全开源的免费软件,更新快,功能强大,应用面渐渐扩大,特别利于画图,相对比较易学是现在热门的新软件。大多数情况下来讲,统计的知识理解不好,软件差不多就不太能用好,相辅相成,期望同步提升
要具备一定的会计和经营管理方面的知识、同时还具备组织能力、分析能力和写作能力,要求统计人员要可以运用计算机进行统计报表、文字处理和统计资料的综合开发。
统计员大多数情况下干的是一部分看似很基础的工作,生产型企业有的在车间生产一线,虽然归财务,但超级难跟财务其他岗位一样在厂部办公室里上班,每天干的事情也看似重复劳动。但是统计是门学问,统计是成本核算的基础,针对生产流程复杂的生产型企业特别重要。
1.需熟练掌握并熟悉统计学的专业知识,主要涵盖描述统计和推断统计。前者主要涵盖收集、处理、分析解释数据的一部分方式;后者主要是指利用样本数据来推断整体特点的一部分统计学方式。详细来说,需掌握并熟悉用不需要方式展示与刻画数据,比如图表法;假设检验;参数估计;回归分析;因果推断,这些属于较为基础的统计。
2.要可以熟练使用一种或各种数据分析的软件,比如Excel、SPSS、SAS。不要轻看Excel,因为它处理数据的能力真的很强大,假设你觉得它不好用,那是因为你对它还不够了解!
3.最好可以掌握并熟悉一门编程语言。统计学的主要目标是处理和分析数据,而R语言和Python比较合适。掌握并熟悉一门编程语言,对以后从事数据分析师或者大数据信息内容服务平台科学方向会有很大的帮。
4.随着时代的进步,传统统计学渐渐和机器学习等新兴学科相结合,来处理大数据信息内容服务平台的问题。因为这个原因,可以学习SQL、Hadoop或者Spark的考点归纳。
以上就是本文统计学都要学哪些知识,统计学基础笔记整理的全部内容,关注博宇考试网了解更多关于文统计学都要学哪些知识,统计学基础笔记整理和考研攻略的相关信息。
本文链接:https://bbs.china-share.com/news/245055.html
发布于:博宇考试网(https://bbs.china-share.com)>>> 考研攻略栏目
投稿人:网友投稿
说明:因政策和内容的变化,上文内容可供参考,最终以官方公告内容为准!
声明:该文观点仅代表作者本人,博宇考试网系信息发布平台,仅提供信息存储空间服务。对内容有建议或侵权投诉请联系邮箱:ffsad111@foxmail.com
考研攻略
本文主要针对统计学都要学哪些知识,统计学基础笔记整理和统计学的专业知识等几个问题进行详细讲解,大家可以通过阅读这篇文章对统计学都要学哪些知识有一个初步认识,对于今年数据...
考研攻略
本文主要针对通讯专业与通信专业的区别和专业是通信等几个问题进行详细讲解,大家可以通过阅读这篇文章对通讯专业与通信专业的区别有一个初步认识,对于今年数据还未公布且时效性较...
考研攻略
本文主要针对北师大和北二外英语专业考研哪个比较好,北京第二外国语学院3+2本硕连读和北二外考研报录比等几个问题进行详细讲解,大家可以通过阅读这篇文章对北师大和北二外英语专业...
考研攻略
本文主要针对考研报名奖惩情况校级奖学金填吗,考研报名奖惩情况写错了有影响吗知乎和考研报名奖励怎么填等几个问题进行详细讲解,大家可以通过阅读这篇文章对考研报名奖惩情况校级...
考研攻略
本文主要针对什么专业可以通过二建证书的注册通过,二建土建哪些专业可以考公务员和什么专业的可以考二建等几个问题进行详细讲解,大家可以通过阅读这篇文章对什么专业可以通过二建...