第 一 章 统计学概论 第一章是其他章节的基础,主要介绍统计学的产生与发展、统计学性质及研究对象、统计研究的主要方法及理论基础,统计研究所涉及的基础性概念、统计研究和实践中常用的指标及指标体系的概念、统计指标的形成和三种表现形式。 第一节 统计与统计学 一、统计学的产生和发展 统计作为一种社会实践活动,大约产生于奴隶社会的中后期。奴隶主为了有效地对内统治和对外战争,必然要对其掌控范围内的各种资源做到心中有数,由此便产生了对土地、人口及各种资产方面的数据搜集和汇总工作。 中国最早的统计资料是公元前21世纪夏朝时期的人口和土地方面的资料。据载,当时分为九州,人口约1 355万人,土地约16 254万公顷。在战国时期,中国已经有了“上计”制度,即按照行政隶属关系逐级上报统计资料的一种制度。而且当时的一些政治家和思想家对这种制度的重要性作过一些论述。秦国的商鞅指出:“强国知十三数,欲强国,不知十三数,地虽利,民虽众,国愈弱至削。”齐国的管仲也对此有过精辟的论述:“不明于计数,而欲举大事,犹无舟楫而欲经于水险也。”其他一些文明古国,也都有对统计实践活动的记载,无论是古希腊、古罗马还是古埃及的史料中都可以找到当时人们进行统计工作的证据,如公元前3050年,古埃及为了建造金字塔就进行了全国范围的人口和财产方面的调查。 统计工作在封建社会时期的发展比较缓慢,其真正的发展是在资本主义社会。由于生产力的极大发展,统治者对国内资源现状的了解欲望更加强烈,而且了解的范围也不仅仅限于过去的人口、土地、税收、粮食等方面,还包括工业、农业、商业、银行、保险、交通、邮电、外贸、就业等事关国计民生的方方面面,在欧洲出现了“统计狂热”时期,许多国家建立了统计机关和统计研究机构,很多学者和实践工作者也试图将统计工作的经验进行总结和提升,因此也就有了很多关于统计理论方面的论著。 统计学作为一门学科,大约产生于17世纪70年代,以英国人威廉·配弟(W. Petty)在1671—1687年写成的《政治算术》一书的问世作为标志。该书中已经有了数据计量表示和显示的方法介绍,虽然比较朴实,但也是今天统计学中的基本内容和方法。威廉·配弟以劳动价值理论为基础,对英、法、荷三国的国情国力进行了数量对比分析,对英国的政治和经济发展提出了建设性的意见。马克思给予威廉·配弟很高的评价,称他为政治经济学之父和统计学的创始人。 在19世纪中叶,统计学的发展进入全新的时期,统计学的性质由研究和解决实际问题,即实质性学科向认识论和方法论学科转变。这主要归功于数学尤其是概率论和数理统计的发展和成熟。以比利时人凯特勒(L.Quetelet)为首的一些数理功底非常深厚的统计学者将臻于成熟的概率论原理和方法,如大数定律、中心极限定理、误差法则、正态分布等思想引入到统计学中,从而使这一学科成为研究大量现象数量方面的一门学科,而不再是为君主、国王等统治者服务的“关于政治事业的数学推理艺术”。 19世纪以后,统计学有很大的发展,形成了很多分支学科,也出现了不同的学派,但作为一种认识方法论的学科性质并没有改变过。 二、统计学的性质和特点 (一)统计的含义 统计一词,一般有三种含义:一是统计工作,二是统计资料,三是统计科学。 统计工作是指对社会经济现象的数量方面进行搜集、整理和分析的活动。统计资料是统计工作形成的结果,一般表现为各类数字型资料。统计科学是研究统计过程的理论和方法的科学。上述三种含义并不是孤立的,存在着密切的联系。统计工作是指人们搜集、整理、分析大量社会经济现象数量表现、数量特征及数量关系的活动,它的产生历史相对久远并且还会继续存续下去;统计工作的成果就是统计资料,没有统计工作也就不会有统计资料,统计资料为各种研究和决策提供必须的数据支持;指导统计工作实践和统计资料形成的理论和方法就是统计科学,它来源于统计工作实践,在统计工作实践中产生和发展,又反过来指导统计工作实践。 (二)统计学的性质和特点 1. 统计学的性质 统计学作为一门认识方法论学科,以大量现象的数量方面为其研究对象,其阐述的原理、原则和方法,可用来指导统计研究和统计工作,它对统计过程中的核算、分析、组织等环节均有重要的指导作用。统计作为一门应用性学科,是以大量社会经济现象的数量方面为其研究对象的。任何一种社会经济现象总会表现为数量和质量两个方面,并且遵循着量变现质变规律。统计学通过对事物现象量的方面研究来提示其质的方面,探索其发展的规律性和必然性。 2. 统计学的特点 统计学的特点主要表现为以下三个方面。 (1)数量性。统计活动的三个主要环节,即统计调查、统计整理和统计分析,总是围绕着数据的取得、数量关系的确定及分析、变量发展趋势的分析等数量方面进行的,所以统计学的数量性是其一个最基本属性,主要表现在: ①用横断面的数据表示现象在一定的发展时期所处的规模、结构和水平。根据2020年国家统计局所发布的2019国民经济和社会发展统计公报:全年国内生产总值(GDP)为990 865亿元,比上年增长6.1%。其中,第一产业增加值70 467亿元,增长3.1%;第二产业增加值386 165亿元,增长5.7%;第三产业增加值534 233亿元,增长6.9%。第一产业增加值占国内生产总值比重为7.1%,第二产业增加值比重为39.0%,第三产业增加值比重为53.9%①。以上关于国内生产总值及各次产业增加值就是用于反映规模的数据,增长的百分比则是用于反映发展速度水平的数据。其中,关于各次产业增加值占GDP的比重即是用于反映产业结构的数据。 ②以时间序列的统计数字反映同一现象总体在不同时间的发展速度和变动趋势。在2019年国家统计公报中也有关于2015年至2019年GDP及其增速的数据,见表1-1和图1-1。 表1-1 2015—2019年国内生产总值及其增速 年度 GDP(亿元) 增速(%) 年度 GDP(亿元) 增速(%) 2015 688 858 7.0 2018 919 281 6.7 2016 746 395 6.8 2019 990 865 6.1 2017 832 036 6.9 图1-1 2015—2019年国内生产总值 注:y为GDP,x为年度,R2为判定系数 资料来源:2019年国民经济与社会发展统计公报 表1-1所示的就是2015—2019年GDP及其增速的时间序列数据。可以看出,2015—2019年GDP有明显的增长趋势,但后期的增幅有所减小。图1-1所示GDP的时间序列散点图与表1-1中的第2列所示内容相同,但比表1-1更为直观。 ③以相关数据的对比反映现象间的联系或存在的问题。例如2010年到2019年某地区GDP平均增长速度为7.60%,城市职工收入年均增长5.8%。在这里提到了GDP和城市职工收入两个指标的发展变化情况,从数据上看,该地区GDP的发展速度较快,而且城市职工的收入也有了相应的增长,说明了这两个指标是同向发展的。并且从数据上看城市职工收入的增长速度略低于GDP的增长速度,这也符合经济发展的基本规律。 ④以历史和现状资料对现象未来的发展规模和水平进行预测。在后面的时间序列分析和相关分析中,会讨论某一现象的数量随时间变化而变化的问题,也会讨论某一数量的变化受其他变量变化的影响问题。只要找到不同数量变化之间的依存关系,就可以根据影响因素的变化来预测该现象在未来的发展规模和水平了。图1-1中所示的直线即为2015—2019年GDP的趋势线,图1-1上方所示的直线方程y=77 690x-155 865 243可以作为GDP的预测模型,据此模型,将x=2 020代入,即可以预测出2020年的GDP将达到1 068 557亿元。 (2)总体性。统计学的研究对象决定了其具有总体性这一显著特点。很多学科的研究是一个从个体到一般的过程,比如医学的研究是从个别病例的研究入手的,管理学的研究也是从个别企业的案例入手的。统计学则与这些学科的研究方法有着本质的不同,它关心个别事物现象的质量与数量表现,但它研究的并不是个别事物现象,而是总体的数量特征和数量表现,即大量现象的规律性和大量过程的倾向性。 (3)具体性。统计学研究的数量方面与数学研究的数量有着一定的区别,数学研究的是抽象的数量及数量关系,而统计学研究的是具有一定社会经济意义的数量。任何事物现象总是表现为质与量的统一,遵循着量变与质变规律。统计学研究数量首先要对其质量方面有一个准确的认识,对其质的规定性有了一个正确的认识后,才能进行数量方面的研究。统计学以数量方面作为研究对象并不意味着统计学的研究目的是数量方面,其最终的目的是通过对具体数量方面的研究来揭示事物现象质的特征,探讨其质的规律性。 三、统计学的分支学科 统计学发展到现在已经形成了许多分支学科,统计方法也已经被用于自然科学和社会科学的诸多领域。从统计方法的构成来看,它可以分为描述统计和推断统计;从统计方法研究和统计方法应用角度来看,又可分为理论统计和应用统计。 (一)描述统计和推断统计 描述统计(Descriptive Statistics)研究如何取得客观现象的数量,并通过图表形式对所获取的数据进行加工处理和显示,进而通过综合、概括和分析得出反映事物现象规律的数量特征。本书第二章到第四章的内容基本属于描述统计学的范畴,主要研究统计资料的搜集方法、数据的加工处理方法、数据的显示方法以及数据分布特征的分析方法等。 推断统计(Inferential Statistics)则是研究如何从总体中获取一定的样本数据,并根据从总体中按随机原则抽取的样本数据,对总体的数量表现和数量特征进行推断的一门科学。一般来讲,统计推断不是必然性推断,而是以一定的概率形式给出的推断。 描述统计和推断统计是统计方法论的不同构成部分,而不是严格意义上的统计学的不同类别。描述统计和推断统计既反映了统计学发展的不同阶段,也反映了统计工作或统计研究过程的不同阶段。从统计学的发展来看,早期的统计学基本上属于描述统计学,它更多地关注实际数据的获得和表现,现代统计学更多地研究数量规律和数量关系,很大的部分属于推断统计。 从统计研究过程来看,统计研究基本可以划分为在逻辑上互相衔接的三个阶段,即统计调查、统计整理、统计分析以及对数据的解释。统计研究的过程是从统计总体的确定开始的,经过资料搜集、整理加工环节,再经过统计分析环节,完成统计研究的全过程。描述统计和推断统计在这个过程中应用于不同的环节,描述统计可以说贯穿于统计活动的全过程,而推断统计则主要应用于统计分析阶段,它在参数估计与假设检验、相关与回归分析、方差分析、列联分析、时间序列分析和指数分析中都可以应用,见图1-2。 图1-2 统计研究过程及描述统计、推断统计主要对应的环节 (二)理论统计和应用统计 理论统计(Theoretical Statistics)是指统计学的数学原理,它主要研究统计学的一般理论和一般方法。运用理论统计解决现实问题就形成了应用统计(Applied Statistics)。 理论统计抽象地研究统计的数学原理,需要广泛的数学基础。由于概率论是统计推断的基础,所以,概率论也可以纳入统计学的范畴。 应用统计是研究如何运用统计学原理去分析和解决实际问题。目前,统计学几乎应用到了所有的科学领域,比如统计学原理应用于生物学就形成了生物统计学,应用于医学就形成了医疗卫生统计学,应用于经济学就形成了经济统计学,应用于社会科学就形成了社会统计学,等等。统计学原理应用于不同类型的企业就形成了企业统计,如工业企业统计、商业企业统计、建筑企业统计等;统计学原理应用于国民经济中的不同部门就形成了部门统计,如林业统计、农业统计、地勘单位统计等。无论统计学原理应用于什么领域,其基本原理都是一样的,但由于不同领域的特点不同,所以在不同领域应用时又会表现出不同的特点。 除了理论统计和应用统计之外,还有讨论统计科学自身发展的学科,即统计史。 第二节 统计学的方法及理论基础 一、统计学的基本方法 和其他学科一样,统计学之所以能够成为一门独立的学科,必然有其独特的研究对象和研究方法。统计学的方法是指统计研究的方法,其基本方法主要有大量观察法、综合指标法和归纳推断法。 (一)大量观察法 大量观察法是指在统计研究中,从总体出发对其全部或足够多的单位进行观察和分析研究的方法。 大量观察法是统计学特有的研究方法,这是因其独特的研究对象所决定的。统计学研究大量现象的数量方面,对大量现象的研究必然会有大量观察法。这里所说的大量既可以是所研究现象的全体或称其为总体,也可以是总体中的一部分单位,即构建一定容量的样本,通过样本参数对总体参数作出一定的推断。总体中不同单位的数量特征和数量表现会受到两类不同因素的影响:一类是决定性因素,它使得不同单位在某一方面的数量表现出一定的共性;另一类为偶然因素或个性因素,它使得不同单位表现出数量上的差异。大量观察法的意义在于通过对大量单位的研究消除个性因素的影响以使总体表现出共性的规律,即数量规律性。 (二)综合指标法 综合指标是表明总体数量特征的数据,综合指标法就是利用综合指标对统计总体进行分析和研究的方法。 统计学既然不以个别现象作为研究对象,对其总体数量的描述指标必然具有综合性质。这个数量既来源于不同的单位,又区别于不同单位的数量表现,它是由每一个单位的数量表现综合而成的。统计指标按其表现形式可分为绝对指标(或称统计绝对数)、相对指标(或称统计相对数)和平均指标(或称统计平均数)。绝对指标可以说是由每个单位数量经过汇总后形成的指标,它是计算相对指标和平均指标的基础,也就是说统计相对指标和平均指标是由绝对指标派生出来的。 通过不同的统计指标可以描述事物现象在其发展过程中所处的规模、水平以及发展速度,也可以表现出总体中不同构成部分的规模及结构比例,还可以借助统计指标进行数量相互关系的分析。在一定意义上讲,统计分析就是对统计指标及指标间的关系进行的分析,或者说是对数量特征、数量关系、数量界限及数量规律性的分析。 (三)归纳推断法 归纳推断法或说统计推断法是指以一定的置信标准,根据样本数据来判断总体数量特征的归纳推理方法。 由于统计研究的总体是一个以大量个别事物现象构成的集合,因此在对总体进行研究时,有时可能无法获得每个事物现象的数量表现,或者没有必要获得每个事物现象的数量表现,这样归纳推断法便是通过样本来研究总体的一个有效方法。归纳推断法利用样本数据对总体数量作出判断,这个判断必然会存在一定的误差,只要将误差控制在一定的范围之内,加上一定的概率保证,推断的结果便是可信的。 上面主要介绍了统计学的基本方法,在统计学的方法论体系中,对不同问题的研究还有很多具体的或专门的方法,这些方法会在以后的章节中陆续介绍。 二、统计学的理论基础 (一)统计学与其他学科的关系 1. 统计学与数学的关系 一方面,统计学研究数量,数学也研究数量,两者之间必然存在一定的联系: (1)统计学和数学两个学科均是研究数量或数量关系。 (2)统计学的理论基础之一是数学,没有数学的不断发展,统计学也就不会形成一门独立的科学,而只能停留在实质性学科的范畴。 (3)统计实践为数学的发展指出了一定的发展方向。虽然数学有其独特的研究方法和研究对象,但是无论是科学意义上的统计,还是社会经济意义上的统计,都会对数学研究提出一定的需求。 (4)无论是统计学还是数学,都不能独立地研究客观现象的水平、结构、关系及其运行规律,而只是为其他学科的研究提供一种切实可行的方法和工具。 另一方面,统计学不叫数学或应用数学,必然有其区别于数学的方面,主要表现在: (1)数学研究的是抽象的数量,统计学研究的是具有一定社会经济意义的数量。数学中的数量通常是无量纲的量,而统计学中的数量通常是有量纲的量,即使在有些时候统计指标也会表现为无量纲,但仍然不失其具有一定社会经济意义的特点。 (2)数学研究通常采用逻辑推理方法,一般会用演绎的方法来证明一种结论的正确性,统计学更多的是运用实证分析和归纳的方法,虽然统计学也会用到演绎的方法,但并不是统计学的主导方法。 (3)从事数学研究的人可以凭借聪明的才智和丰富的想象力进行假想命题的研究,而统计学家和统计工作者必须深入实际,取得并分析实际的统计资料,以得出研究结论。 (4)数学和统计学的学科分类和研究对象不同。 2. 统计学与其他学科的关系 从前面的统计学的分类中可以看出,统计学几乎在所有学科领域都有其应用,因此也就必然和其他学科产生一定的联系。有些学科可能作为统计学的基础性学科,比如经济学、会计学、社会学、心理学等,统计学中的一些概念和理论基础可能出自这些学科。而统计学也为其他一些学科提供了一定的研究方法和数据支持,同时也为其他学科的研究提供一定的研究方向。比如人们早已通过统计发现新生婴儿的男女性别比例为 1.07∶1,但是为什么会是这样的比例,统计学则无法给出答案,必须由生物学或医学研究给出。统计学可以给出是什么,但有时却无法解释为什么。 (二)统计学的理论基础 统计学的理论基础包括马克思主义哲学、相关学科、数学三个构成部分,见图1-3。 图1-3 统计学的理论基础 1. 马克思主义哲学 马克思主义哲学是关于自然、社会和人类思维发展的最一般规律的科学,它是人们认识世界和改造世界的最有力的思想武器。历史唯物主义要求人们在认识世界时,要历史地去看、客观地去看。只有尊重事物现象在历史发展过程中不同时期的客观真实性,才能正确地认识其发展规律性。辩证唯物主义要求人们在认识客观事物时,要正确地把握量变与质变规律,一切事物的发展变化都是从量变开始的,当量变到一定程度时就会引起质变。这点对于现象类型的划分、事物性质的界定、对事物的评价等方面都会起到指导性作用。 2. 相关学科 相关学科主要是指诸如经济学、会计学、社会学、财政金融学及计算机科学等。统计学的主要工作是搜集、整理、分析统计资料,因此会形成很多对象化形态的统计指标。这些对象化形态指标的初级形态——观念形态统计指标形成的主要依据一般是来自相关学科的基础理论。比如,统计学要核算GDP以取得GDP的真实数据,但是GDP并不是统计学里特有的概念,而是经济学里的概念,要准确地理解这个概念并核算出其真实的数据就必须以经济学作为其理论基础。又比如,统计学要计算价格指数,就要以市场经济理论作为基础;进行人口、经济、工业等方面的调查与统计就要以人口学、社会学、经济学、会计学等学科作为理论基础;进行统计调查与分析时还会涉及大量的数据计算,计算机科学也会成为其理论基础,等等。 3. 数学 可以说是数学的发展改变了统计学的学科性质,统计分析中不仅涉及数据的计算问题,更为重要的是统计学的方法论基础依赖于数学,没有数学也就不会形成现代统计学的理论体系,微积分、线性代数、概率论与数理统计等数学分支学科对统计学的发展都起到了相当大的作用。统计理论研究需要坚实的数学基础,但这并不等于说从事统计工作的人也需要掌握高深的数学知识,以至于有些学者认为从事统计工作的人只要有高中阶段的数学基础就已经足够了。 第三节 统计学的基本概念 一、统计总体和总体单位 (一)统计总体 统计总体也称总体,它是根据研究目的,由大量具有某一共同性质的个体构成的集合。构成总体的个体就是总体单位或称单位。例如要研究某一个企业的职工队伍情况,属于该企业的全体职工就构成了一个总体,每一个职工就是构成这个总体的基本单位,即总体单位。 根据定义,统计总体具有三个基本属性: (1)同质性。统计总体的同质性是指构成总体的基本单位即总体单位至少在某一个方面会表现出共同的性质。比如上例中,该企业的每一个职工都隶属于该企业,换言之该企业的每一个职工的工作单位都是相同的。除此之外,每个职工也许在其他方面还有共性,比如国籍、所在的省市,等等。 (2)大量性。统计是以大量现象作为研究对象的,基本含义是:其一,它不研究个体属性;其二,如果总体所包括的单位数不足够大,则统计规律性就无法显示出来。只有对大量现象进行综合研究,才可能消除由于个体偶然因素造成的影响。 (3)差异性。差异性或称异质性,是说总体单位至少在某一方面具有共性,那么,在其他方面就一定要表现出差异,尤其是在所要研究的属性方面一定要有明显的不同。试想,如果单位在其他各方面都是同质的,那么进行统计研究是没有意义的,研究个体就可以了。 统计总体可分为有限总体和无限总体。有限总体是指在一个总体中包含了有限单位,即总体单位数是有限的。例如,一个由企业职工构成的总体是有限总体,一个国家的人口是有限总体,一定时间内生产的产品是有限总体,等等。无限总体是指总体单位数为无穷大的总体。比如,炮弹的可能射程构成的总体是无限总体,某种灯泡的可能寿命是无限总体,在[0,1]闭区间里的实数是无限总体,而在此区间里的自然数则是一个有限总体。对有限总体而言,对其既可以进行全面调查,也可进行非全面调查,但对于无限总体则只能进行非全面调查。 (二)总体单位 构成统计总体的基本单元就是总体单位,简称为单位。总体单位的含义非常宽泛,能形成总体集合的任何个别事物现象都可成为总体单位,它既可以是有形系统中的单位,也可以是概念系统中的单位。 例如,如果将某企业的所有产品构成一个总体,那么每一个产品就是一个总体单位,这里的单位是有形系统中的单位;如果将某一部法律视为一个总体,那么,其中的各项条款也可以视为一个单位,这里的单位属于概念系统中的单位。 须注意,总体和单位都是相对概念。在一定的条件下,总体可以转化成单位,单位在另一条件下也可能成为总体。 二、标志和标志表现 (一)标志 总体单位所共同具有的属性或特征的名称叫标志。比如在一个由全体职工构成的总体中,职工在很多方面具有共同属性,大家都有年龄、性别、出生日期、政治面貌、民族、身高、体重、工资等,这些大家共同具有的属性名称就是标志。 按照标志的性质不同,可将其分为两类。一类称数量标志,即反映总体单位数量特征的名称,它可以表示为一定的数量。比如在上述提及的职工总体中,年龄、出生日期、身高、体重、工资是数量标志,它们都是用于反映每个职工数量特征的名称。另一类叫品质标志,它是用来反映总体单位品质属性或特征的名称,如上例中的性别、政治面貌、民族属于品质标志。 (二)标志表现 标志在每一个单位的具体表现就是标志表现。由于标志分为数量标志和品质标志两种,则标志表现也有两种形式,即数量标志表现和品质标志表现。数量标志表现可以表示为一定的数量,比如年龄30岁,身高170 cm,工资2 300元,等等。品质标志只能由文字、符号、代码等来表示。比如政治面貌为党员、民族为汉族、籍贯为河北,等等。实质上,这类标志只能通过文字来表示,有时候为了便于汇总和统计分析,也用一定的符号或代码来表示,比如民族可以利用如下代码表示:01—汉族,02—蒙古族,03—回族……也可以表示为:A—汉族,B—蒙古族,C—回族……尽管代码为数字形式,但仍为品质标志。 在一个总体中,各单位的标志可以相同,也可以不同。相同的标志叫不变标志,不同的标志叫可变标志。可变标志既可以是数量标志,也可以是品质标志。可变的数量标志也叫变量。变量又可分为连续变量和离散变量。表1-2所示的某汽车生产企业底盘车间职工基本情况调查表,可以体会如上提及的标志和标志表现的相关概念。 表1-2 标志和标志表现的相关概念示意 序号 所在车间 姓名 性别 籍贯 年龄 基本工资 ←标志 01 底盘 张三 男 山东 26 3 500 ← 标 志 表 现 02 底盘 李四 男 河北 28 3 800 03 底盘 王五 男 安徽 32 3 800 04 底盘 赵六 女 安徽 24 3 200 ...... ↑ 品质标志 ↑ 品质标志 ↑ 品质标志 ↑ 品质标志 ↑ 品质标志 ↑ 数量标志 ↑ 数量标志 可变标志 不变标志 可变标志 可变标志 可变标志 可变标志 可变标志 变量 变量 三、统计指标和统计指标体系 (一)统计指标 统计指标包括指标名称和指标数值两部分,它表明了统计指标形成过程中的两个基本形态,即观念形态和对象化形态。 1. 观念形态的统计指标 观念形态的统计指标是表明总体数量特征的概念或范畴。比如:工业总产值、进出口总额、单位成本、总产量、投资利润率,等等。这些都属于概念意义上的统计指标,或者说它们只是说明了指标的名称,还没有取得其具体的指标数值。当然,观念形态的统计指标不仅包含了指标名称,同时也隐含了指标的计算方法和计量方法。可以认为,这些指标的计算和计量方法在本学科或相关学科中都已经有了明确的界定。因此构成观念形态的统计指标应该具有三个基本要素,即指标名称、计算方法、计量单位。 2. 对象化形态的统计指标 对象化形态的统计指标是指反映总体数量特征的概念以及具体数值。对象化形态的统计指标是有明确意义和具体表现的统计指标,它包含了指标名称、计算方法、计量单位、时间范围、空间范围和具体数值六个要素。 2019年国家统计局发布统计公报:“年末全国就业人员77 471万人,其中城镇就业人员44 247万人,占全国就业人员比重为57.1%,比上年末上升1.1个百分点。全年城镇新增就业人员1 352万人,比上年少增9万人。年末全国城镇调查失业率为5.2%,城镇登记失业率为3.6%。全国农民工总量29 077万人,比上年增长0.8%。其中,外出农民工17 425万人,增长0.9%;本地农民工11 652万人,增长0.7%。” 在上述内容中涉及的年末就业人员、城镇就业人员、城镇新增就业人员、年末城镇调查失业率、城镇登记失业率、农民工总量、外出农民工总量、本地农民工总量等属于观念形态的统计指标,而一旦加入了“2019年”“全国”以及指标后面的具体数值,就成为对象化形态的统计指标了。 综合指标法是统计研究的三个基本方法之一,因此统计指标在统计研究中起到了十分重要的作用。可以说,如果没有统计指标就无法进行统计研究,也无法开展统计工作。统计指标具有如下的三个主要特点: (1)数量性。根据统计指标的含义,统计指标是反映总体现象综合数量特征的概念或范畴,因此数量性是统计指标的一个显著特点。凡是不能量化的、不能表现为数量的概念或属性就不能成为统计指标。 (2)综合性。同样根据定义,统计指标是反映总体数量特征的范畴。既然反映的是总体数量而不是总体单位数量,则其必然是经过对各单位数量进行汇总或汇总后衍生出来的,那么,它就一定具有综合性的特点。 (3)具体性。构成对象化形态统计指标的六个要素中,包括具体数值,这是统计指标具有具体性的一个方面。另一方面,观念形态的统计指标也是由相关学科的抽象概念具体化和数量化的结果。 应该注意,统计指标和标志尽管存在一定的联系,但它们是两个完全不同的概念。两者的联系主要表现在: (1)汇总联系。对标志的汇总就可以形成统计指标。 (2)变换联系。在不同的研究目的之下,指标和标志是可以互相转化的。如果将原来的统计总体变为总体单位,则原来的指标名称和指标数值就转化成标志和标志表现了。反之亦然。 统计指标和标志的区别主要表现在: (1)两者描述的对象不同。统计指标是用于描述总体的,而标志是用于描述总体单位的。 (2)两者的表现形式不同。统计指标具有数量性的特点,而标志既可以是数量的,也可以是品质的。 (二)统计指标体系 统计指标体系是由多个有联系的统计指标构成的系统。这个系统主要有两种不同的构成模式,一种是指标之间存在严格的数学关系,另一种是各个指标之间不存在一定的数学关系。 1. 具有数学关系的统计指标体系 如果在一个统计指标体系中,各个指标之间存在着加、减、乘、除、乘方、开方,以及其他种高等数学关系,那么这个指标体系就是具有数学关系的统计指标体系。比如用销售额指标、销售量指标和单价指标就可以构建一个这样的指标体系: 销售额=销售量×单价 同样,用产量、工人平均劳动生产率、工人数也可以构建一个指标体系: 产量=工人平均劳动生产率×工人数 2. 不具有数学关系的统计指标体系 在这种指标体系中,各种指标之间虽然不存在严格的数学关系,但各个指标之所以纳入该体系中,是因为它们从不同的方面反映了总体的运行状况。比如为了反映某企业的经营状况,可以用产量或产值、工人劳动生产率、利润总额、成本总额、利润率、单位成本、市场占有率、销售增长率、资金周转率等指标构建一个指标体系。尽管其中有些指标之间可能存在一定的数学关系,但总体来看它们之间不存在数学关系。 第四节 统计指标的表现形式 一、统计指标的分类 (一)按照统计指标反映的总体数量特征性质不同分 1. 数量指标 描述总体绝对数量规模和水平的外延性统计指标称为数量指标。例如GDP、进出口总额、产量、利税总额、职工人数,等等。 数量指标的特点是其数值大小与总体包含的单位数的多少有关。一般来讲,总体的范围越大,包含的单位数越多,则数量指标值也就越大。当然也有例外的情况,比如对产量指标来说总体越大,包括的单位数越多,产量值至少不会减小。但对于利润总额这个数量指标来说,上述结论可能并不成立,因为有可能存在亏损的企业,如果将亏损企业纳入总体中,总体利润不但不增,反而减少了。 2. 质量指标 描述总体数量相对程度或一般水平的统计指标称为质量指标。例如计划完成程度、单位成本、销售利润率、增长率、价格指数,等等。 质量指标的特点是其数值大小往往与总体的大小或包含的单位数无关。当总体范围扩大或总体单位数增多时,该类指标并不一定会增大;同样,当总体范围或总体单位数减少时,该类指标也不一定会减小。 (二)按照统计指标的表现形式不同分 1. 总量指标 总量指标是数量指标的表现形式,也可称为绝对指标或统计绝对数。显然总量指标具有数量指标的特点,其实两者并没有本质区别,只是在不同的分类之下得出的不同结果而已。 总量指标是统计中常用的形式,它是计算其他指标的基础。 2. 相对指标 它是同两个有联系的总量对比而成的指标。相对指标也称统计相对数,它属质量指标的一种。 实际工作中,也经常将两个相对指标或平均指标进行对比而得到相对指标。比如可以对比不同国家或地区的恩格尔系数、人均GDP水平等,但是归根结底它仍然是由总量指标计算而来的。 3. 平均指标 平均指标是总体一般水平的代表数值,也称其为统计平均数。它属于质量指标的一种,也具有质量指标的特点。 上述三个指标将在后文中进行详细介绍。 二、总量指标 总量指标按总体特征的内容不同可以分为总体标志总量和总体单位总量,按总量指标反映的时间状态不同可以分为时期总量和时点总量。 (一)总体标志总量和总体单位总量 1. 总体标志总量 总体标志总量就是总体单位标志值之和。例如:2020年某企业职工工资总额为2 500万元。这里的工资总额2 500万元就是总体标志总量,它是由该企业每个职工(总体单位)的工资(标志)相加后得到的数值。 2. 总体单位总量 总体单位总量也称总体总量,是指一个统计总体中包含的单位总数。例如:在研究某城市职工家庭生活水平情况时,该城市每一个职工家庭的集合就构成了一个总体,这个总体中包括的家庭总数就是总体单位总量。 3. 总体标志总量和总体单位总量的关系 在计算总体标志总量时,一般会采用下面的计算公式: (1-1) 式中:X为总体标志总量,xi为每个单位的标志值,N为总体单位总量。 在计算总体标志总量时,要对总体每一个单位的标志值进行加总,一共有N个要加总的标志值。 总体标志总量和总体单位总量都是相对概念,它们在一定条件下可以转换。例如"职工人数"在研究企业职工方面的情况时,它可能是总体单位总量,而在研究企业盈利状况时,职工人数则可能是总体标志总量。 另外,须注意的是,对总体标志值的加总并不是在任何情况之下都是有意义的。例如,要计算某一个单位职工的平均年龄时,对每个人的年龄进行加总可以得出“总年龄”,然后除以职工人数就可以得到平均年龄,“总年龄”在现实中几乎是没有意义的,但是计算平均年龄时却必须要对其进行加总。 (二)时期总量与时点总量 1. 时期总量 时期总量是总体在一定的时期内数量累计所达到的结果。例如:GDP、销售量、进出口总额等指标均为在一定时期内累计的结果。时期总量具有可加性的特点,即将一定时期内的指标数值相加后具有一定的实际意义,而且一般来讲,随着时期的加长,指标数值往往也会随之加大。 2. 时点总量 时点总量用于表示事物在某一瞬时时刻所处的状态。比如职工人数、库存量、固定资产净值等均为某一时间点上数值,它是在一定时刻将总体中不同组成部分的指标值相加后得到的。在实际中,对不同时点上的指标值加总往往是没有意义的,而且其指标值的大小也往往与时间的长短没有直接关系。 三、相对指标 相对指标是由具有一定联系的总量指标对比后形成的统计指标,尽管相对指标并不是在任何时候都表现为两个总量之比,有时也可能是相对指标或平均指标之比,但归根结底是由总量指标计算而来的,所以相对指标是总量指标的派生指标。相对指标按其作用不同可分为六类,即结构相对指标、比例相对指标、强度相对指标、比较相对指标、动态相对指标、计划完成程度相对指标。 (一)结构相对指标 结构相对指标是总体中部分数值与总体全部数值的对比,它表明部分在总体中的比重,因此也称为比重指标。计算公式为 (1-2) 式中:为第i个构成部分的总量,为总体总量。 例如,2019年全年国内生产总值990 865亿元,其中,第一产业增加值70 467亿元,第二产业增加值386 165亿元,第三产业增加值534 233亿元。根据上述资料就可以计算出各次产业在GDP中比重,即结构相对指标,见表1-3。 表1-3 2019年GDP的三次产业构成 产业 增加值(亿元) 比重(%) 比例 第一产业 70 467 7.11 1 第二产业 386 165 38.97 5.48 第三产业 534 233 53.92 7.58 GDP 990 865 100.00 — (二)比例相对指标 比例相对指标是总体中不同部分数值对比的结果,表明总体中不同部分之间的比例关系。计算公式为 (1-3) 式中:为总体中第i个构成部分数值,为总体中基准部分数值。 以第一产业为基准,利用表1-3中的数据,可以计算出2019年中国GDP三次产业的比例为1∶5.48∶7.58。 (三)强度相对指标 强度相对指标是性质不同又有一定联系的指标对比的结果,用于说明事物的强度、密度、普遍程度等。计算公式为 (1-4) 式中:X为某一总体指标数值,Y为另一有联系总体指标数值。 例如,2020年某地区共有商业网点100个,人口10万人,则可以计算出该地区平均每万人拥有的商业网点个数为100/10 = 10(个/万人),也可以计算出平均每一个商业网点服务的人口为100 000/100 = 1 000(人/个)。这里计算的两个相对数都是强度相对指标,由计算的过程和结果可以看出,强度相对指标是一个有量纲的量,这是该指标区别于其他相对指标的地方。而且强度相对指标的分子和分母是可以颠倒的,颠倒后仍然是一个强度相对指标,只不过颠倒后的含义与颠倒前的含义有所不同。 (四)比较相对指标 比较相对指标是某一指标在不同空间、不同条件、不同场合下的对比,它表明现象在不同空间或条件发展的不均衡程度或差异程度。计算公式为 (1-5) 式中:为某条件下的某个指标数值,为另一条件下的该指标数值。 例如,根据国际货币基金组织(IMF)2019年4月发布的《世界经济展望数据库》显示,2018年人均GDP排名第1位的卢森堡为114 234美元,是中国的11.89倍;排名第9位的美国为62 606美元,是中国的6.52倍。中国当年的人均GDP水平为9 608美元,排在第72位。 (五)动态相对指标 动态相对指标是不同时间上的同一指标数值进行的对比,它表明该现象的发展变化程度,也称发展速度指标,发展速度减1就得到增长速度。计算公式为 (1-6) 式中:为报告期某个指标数值,为基期该指标数值 例如,根据表1-1中的2015—2019年的GDP资料,可以得到表1-4所示的动态相对指标GDP的环比发展速度和环比增长速度。 (六)计划完成程度相对指标 计划完成程度相对指标是一定时期内实际完成的指标数值与该时期计划完成的指标数值之比,一般用百分数表示。公式为 (1-7) 式中:为一定时期某指标实际完成数,为同期该指标的计划完成数。 表1-4 动态相对指标 年度 GDP(亿元) 环比发展速度(%) 环比增长速度(%) 2015 688 858 108.23 8.23 2016 746 395 108.35 8.35 2017 832 036 111.47 11.47 2018 919 281 110.49 10.49 2019 990 865 107.79 7.79 注1:2014年的GDP为636 463亿元。 注2:本表的发展速度为按现价计算,表1-1中的数据为按不变价格计算,所以出现两者数值的不一致。 须指出,当计划数是以较上期提高或降低率形式给出时,其计算公式的表现形式有所不同。在提高率形式时,计算公式为 (1-8) 在以降低率形式给出时,计算公式为 (1-9) 【例1-1】 某企业2020年计划销售额比2019年提高10%,实际提高了15%,问销售额计划完成程度是多少?该企业计划单位成本比上年降低5%,实际降低了3%,该企业单位成本的计划完成程度又是多少? 解:(1)根据式(1-7)或式(1-8) (2)根据式(1-7)或式(1-9) 一般情况下,计划完成程度相对指标大于1,表示超额完成计划。计划完成程度相对指标小于1,表示没有完成计划。须注意,本例中该企业2020年并没有完成单位成本的降低计划,但计划完成相对指标的计算结果大于1,这是一种特殊情况。即在以降低率形式给出时,计划完成程度相对指标大于1,表示没有完成计划。反之,当计划完成程度相对指标小于1时,表示超额完成了计划。 四、平均指标 平均指标也称统计平均数,它是表示总体单位一般水平的统计指标。主要有算术平均数、几何平均数、调和平均数、众数和中位数。这些指标将在第四章中作详细介绍。 附录1-I 2019年国民经济和社会发展公报①(摘编) 2019年,面对国内外风险挑战明显上升的复杂局面,在以习近平同志为核心的党中央坚强领导下,各地区各部门以习近平新时代特色社会主义思想为指导,全面贯彻党的十九大和十九届二中、三中、四中全会精神,按照党中央、国务院决策部署,坚持稳中求进工作总基调,坚持新发展理念和推动高质量发展,坚持以供给侧结构性改革为主线,着力深化改革扩大开放,持续打好三大攻坚战,统筹稳增长、促改革、调结构、惠民生、防风险、保稳定,扎实做好稳就业、稳金融、稳外贸、稳外资、稳投资、稳预期工作,经济运行总体平稳,发展水平迈上新台阶,发展质量稳步提升,人民生活福祉持续增进,各项社会事业繁荣发展,生态环境质量总体改善,“十三五”规划主要指标进度符合预期,全面建成小康社会取得新的重大进展。 一、综合 初步核算,全年国内生产总值990 865亿元,比上年增长6.1%(见图1-4)。其中,第一产业增加值70 467亿元,增长3.1%;第二产业增加值386 165亿元,增长5.7%;第三产业增加值534 233亿元,增长6.9%。第一产业增加值占国内生产总值比重为7.1%,第二产业增加值比重为39.0%,第三产业增加值比重为53.9%(见图1-5)。全年最终消费支出对国内生产总值增长的贡献率为57.8%,资本形成总额的贡献率为31.2%,货物和服务净出口的贡献率为11.0%。人均国内生产总值70 892元,比上年增长5.7%。国民总收入988 458亿元,比上年增长6.2%。全国万元国内生产总值能耗比上年下降2.6%(见图1-6)。全员劳动生产率为115 009元/人,比上年提高6.2%(见图1-7)。 图1-4 2015—2019年国内生产总值及其增长速度 图1-5 2015—2019年三次产业增加值占国内生产总值比重 图1-6 2015—2019年万元国内生产总值能耗降低率 图1-7 2015—2019年全员劳动生产率 年末全国大陆总人口140 005万人,比上年末增加467万人(见表1-5),其中城镇常住人口84 843万人,占总人口比重(常住人口城镇化率)为60.60%,比上年末提高1.02个百分点(见图1-8)。户籍人口城镇化率为44.38%,比上年末提高1.01个百分点。全年出生人口1 465万人,出生率为10.48‰;死亡人口998万人,死亡率为7.14‰;自然增长率为3.34‰。全国人户分离的人口2.80亿人,其中流动人口2.36亿人。 年末全国就业人员77 471万人,其中城镇就业人员44 247万人,占全国就业人员比重为57.1%,比上年末上升1.1个百分点。全年城镇新增就业1 352万人,比上年少增9万人(见图1-9)。年末全国城镇调查失业率为5.2%,城镇登记失业率为3.6%。全国农民工总量29 077万人,比上年增长0.8%。其中,外出农民工17 425万人,增长0.9%;本地农民工11 652万人,增长0.7%。 表1-5 2019年年末人口数及其构成 指标 年末数(万人) 比重(%) 全国总人口 140 005 100 其中:城镇 84 843 60.60 乡村 55 162 39.40 其中:男性 71 527 51.1 女性 68 478 48.9 其中:0~15周岁 24 977 17.8 16~59周岁 89 640 64.0 60周岁以上 25 388 18.1 其中:65周岁以上 17 603 12.6 图1-8 2015—2019年常住人口城镇化率 图1-9 2015—2019年城镇新增就业人数 全年居民消费价格比上年上涨2.9%(见图1-10)。工业生产者出厂价格下降0.3%。工业生产者购进价格下降0.7%。固定资产投资价格上涨2.6%。农产品生产者价格上涨14.5%(见表1-6)。12月,70个大中城市新建商品住宅销售价格同比上涨的城市个数为68个,下降了2个。 图1-10 2019年居民消费价格月度涨跌幅度 表1-6 2019年居民消费价格比上年涨跌幅度(%) 指 标 全国 其中 城市 农村 居民消费价格 2.9 2.8 3.2 其中:食品烟酒 7.0 6.7 7.9 衣着 1.6 1.7 1.2 居住 1.4 1.3 1.5 生活用品及服务 0.9 0.9 0.8 交通和通信 -1.7 -1.8 -1.4 教育文化和娱乐 2.2 2.3 1.9 医疗保健 2.4 2.5 2.1 其他用品和服务 3.4 3.5 3.1 年末国家外汇储备31 079亿美元,比上年末增加352亿美元(见图1-11)。全年人民币平均汇率为1美元兑6.898 5元人民币,比上年贬值4.1%。 图1-11 2015—2019年年末国家外汇储备 供给侧结构性改革继续深化。全年全国工业产能利用率为76.6%,比上年提高0.1个百分点。其中,黑色金属冶炼和压延加工业产能利用率为80.0%,提高2.0个百分点;煤炭开采和洗选业产能利用率为70.6%,与上年持平。年末商品房待售面积49 821万平方米,比上年末减少2 593万平方米。其中,商品住宅待售面积22 473万平方米,减少2 618万平方米。年末规模以上工业企业资产负债率为56.6%,比上年末下降0.2个百分点。全年教育、生态保护和环境治理业固定资产投资(不含农户)分别比上年增长17.7%和37.2%。“放管服”改革持续深化,微观主体活力不断增强。全年新登记市场主体2 377万户,日均新登记企业2万户,年末市场主体总数达1.2亿户。全年减税降费超过2.3万亿元。 新动能保持较快发展。全年规模以上工业中,战略性新兴产业增加值比上年增长8.4%。高技术制造业增加值增长8.8%,占规模以上工业增加值的比重为14.4%。装备制造业增加值增长6.7%,占规模以上工业增加值的比重为32.5%。全年规模以上服务业中,战略性新兴服务业企业营业收入比上年增长12.7%。全年高技术产业投资比上年增长17.3%,工业技术改造投资增长9.8%。全年服务机器人产量346万套,比上年增长38.9%。全年网上零售额106 324亿元,按可比口径计算,比上年增长16.5%。 区域协调发展扎实推进。分区域看,全年东部地区生产总值511 161亿元,比上年增长6.2%;中部地区生产总值218 738亿元,增长7.3%;西部地区生产总值205 185亿元,增长6.7%;东北地区生产总值50 249亿元,增长4.5%。全年京津冀地区生产总值84 580亿元,比上年增长6.1%;长江经济带地区生产总值457 805亿元,增长6.9%;长江三角洲地区生产总值237 253亿元,增长6.4%。 脱贫攻坚成效明显。按照每人每年2 300元(2010年不变价)的农村贫困标准计算,年末农村贫困人口551万人,比上年末减少1 109万人;贫困发生率0.6%,比上年下降1.1个百分点(见图1-12)。全年贫困地区农村居民人均可支配收入11 567元,比上年增长11.5%,扣除价格因素,实际增长8.0%。 图1-12 2015—2019年年末全国农村贫困人口和贫困发生率 二、农业 以后内容略 【本章关键知识点】 统计的含义、性质及研究对象 统计学的研究方法 统计总体和总体单位 标志和标志表现 总量指标 相对指标 【复习思考题】 1. 统计学的性质和研究对象是什么? 2. 统计研究的基本方法有哪些?为什么称其为基本方法? 3. 什么是统计总体,什么是总体单位?两者有什么关系? 4. 什么是标志,什么是标志表现?它们是如何分类的? 5. 什么是观念形态的统计指标?什么是对象化形态的统计指标?它们有什么不同? 6. 指出下面文字中统计指标的种类: (1)“2004年全年粮食产量46 947万吨,比上年增加3 877万吨,增产9.0%;棉花产量632万吨,增产30.1%;油料产量3 057万吨,是上年的1.09倍;糖料产量9 528万吨,为上年的98.8%。” (2)“2004年年末全国总人口为129 988万人,男性占51.5%,女性占48.5。全年全国出生人口1 593万人,出生率为12.29‰;死亡人口832万人,死亡率为6.42‰;全年净增人口761万人,自然增长率为5.87‰,比上年下降0.14个千分点。” 【练习题】 自学自测 扫 描 此 码 四、计算题 1. 已知2004年中国内地对主要国家和地区的进出口情况,如表1-7所示。 表1-7 2004年对主要国家和地区进出口情况 国家和地区 出口额(亿美元) 比上年增长(%) 进口额(亿美元) 比上年增长(%) 中国香港地区 1 009 32.3 118 6.1 日本 735 23.7 944 27.3 韩国 278 38.4 622 44.3 东盟 429 38.7 630 33.1 欧盟 1 072 36.9 701 28.8 俄罗斯 91 51.0 121 24.7 美国 1 249 35.1 447 31.9 试计算: (1)2004年中国内地对上述国家和地区的进出口总额; (2)2003年对上述国家和地区的进口额和出口额; (3)表1-7中,最大贸易伙伴与最小贸易伙伴进出口总额的比较相对指标; (4)以对俄罗斯的出口额为基准,计算上述国家和地区为总体的出口额比例相对指标。 2. 某市2019年和2020年不完整的GDP及构成情况如表1-8所示,试补充表中所缺的数字。 表1-8 2019年和2020年某市GDP计划、实际及构成情况 产业 2020年增加值(亿元) 计划完成程度(%) 2019年 增加值(亿元) 2020年比2019年的 增长率(%) 计划 实际 第一产业 100 130 98 第二产业 120 115 90 第三产业 6 合 计 420 125 【轻松一刻】 【参考文献】 [1] 孔锐,高孝伟. 统计学[M]. 北京:中国大地出版社,2006. [2] 张梅琳. 应用统计学[M]. 上海:复旦大学出版社,2004. [3] 陈嗣成,冯虹. 新编统计学原理[M]. 北京:首都经济贸易大学出版社,2004. [4] 刘春英,贾俊平. 统计学原理[M]. 北京:对外经济贸易出版社,2002. [5] 贾俊平. 统计学[M]. 北京:人民大学出版社,2013. [6] 袁卫,庞皓,曾五一. 统计学[M]. 北京:高等教育出版社,2000. [7] 黄良文,曾五一. 统计学原理[M]. 北京:统计出版社,2000. [8] 贾俊平,邹明霜. 统计学学习指导书[M]. 北京:中国人民大学出版社,2004. [9] 贾俊平,金勇进,易丹辉. 《统计学》教学案例和教学项目汇编[M]. 北京:中国人民大学出版社,2000. [10] 李洁明,祁新娥. 统计学原理[M]. 二版. 上海:复旦大学出版社,1999. [11] 高嘉英,马立平. 统计学[M]. 二版. 北京:首都经贸大学出版社,2004. [12] 孔锐,高孝伟,何大义,等. 统计学:原理及应用[M] 北京:清华大学出版社,2016. ① 资料来源:http://www.gov.cn/xinwen/2020-02/28/content_5484361.htm ① 资料来源:http://www.gov.cn/xinwen/2020-02/28/content_5484361.htm ?? ?? ?? ?? 2 | 统计学——原理与数据分析 第一章 统计学概论 | 3