电脑桌面
添加盘古文库-分享文档发现价值到电脑桌面
安装后可以在桌面快捷访问

统计学变异的概念

来源:莲生三十二作者:开心麻花2025-09-191

统计学变异的概念(精选7篇)

统计学变异的概念 第1篇

一、变异指标的意义及种类

设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3),每人数五个计数盘,得结果为q=68.12-65.23=2.89 cm有50%的7岁男童,坐高在65.23~68.12cm之间,其四分位数间距为2.89cm。 来源:

3.均差 四分位数间距虽比极差稳定,但仍只是两点之间的距离,没有利用每个变量值的信息。于是有人计算每个变量值与均数(或中位数)差的绝对值之和,然后平均称为均差(或平均直线差)作为变异指标之一。来源:

(4.13)

例4.8 试计算4.3中,心重的均差。

由例4.3知x=293.75g,代入式(4.13)得

4.方差 式式(4.13)中用变量值与均数之差的绝对值之和∑∣x-x∣,而不用离均差之和∑(x- x)是因为∑(x- x)=0,不能说明变异情况,故取绝对值以去掉负号。亦有人用平方的办法,即用离均差平方和∑(x-x )2,既去掉了负号,又提高了指标的灵敏性。因为数值愈大,平方后增大的愈多,所以离均差稍有变化,就能从指标上反映出来。例如有甲乙两组数据如下: 式(4.14)中的n-1是自由度。n个变量值本有n个自由度,但计算标准差时用了样本均数x,因此就受到了一个条件即∑x= nx的限制。例如有4个数据,它们的均数为5。由于受到均数为5的限制,4个数据中只有3个可以任意指定。如果任意指定的是4、3、6,那么第4个数据只能是7,否则均数就不是5了。所以标准差的自由度为n-1。 来源:

2.标准差的计算

(1)按基本公式(4.14)计算来源:

例4.9 用例4.3资料计算心重的标准差。 来源:

已算得x=293.75g,代入式(4.14)得

(2)递推法 当用电子计算机进行计算,希望每输入一个数据,都能得到x与s,则将式(4.8)与式

(4.5)配合计算。

(4.15)

这里sn表示n个数据的标准差,sn-1表示n-1个数据的标准差。xn是第n个数据,xn-1是n-1个数据的均数。

例4.10 仍用例4.3资料,已算得前19例心重的x19=292.37,s19=38.71。 x20=320,代入式(4.15)得 来源:

(3)直接法 不需先计算均数,直接用变量值代入式(4.16)或式(1.17)计算。

(4.16)

或 (4.17)

式(4.16)的分子是由式(4.14)的分子简化而得来的,证明如下。

例4.11 用elisa(酶联免疫吸附测定)法检测vero-e6,细胞培养上清正常标本10份的结果(100xod490值)为2,3,3,4,4,5,5,5,6,8,求标准差。

变异理论与概念的丰富性 第2篇

以数学教学中的“方程”概念为例, “含有未知数的等式叫做方程”, 学生对此概念记得很熟, 但在做“某同学买了2块橡皮, 每块花了X元, 买1个笔记本花了6元, 一共花去9元, 问每块橡皮几元, 请列出方程”的题目时, 仍然列出了这样的方程: (9-6) ÷2=X。教师们发出困惑:我们清清楚楚地教了概念, 学生也能熟练地诵读, 为什么一到应用时就出问题?症结在哪里?

症结在哪里?这里涉及概念内涵的丰富性问题。许多数学概念的内涵往往是丰富的, 要透彻理解一个概念需要多维度、多层次的感悟, 经历概念形成的过程, 不要指望靠背诵抽象的概念名词就能掌握其内涵。概念是对丰富多彩的现象世界的抽象, 它是简约的, 但它反映的事物是多维的、立体的, 对于抽象思维水平不高、经验阅历有限的学生来说, 就越需要从各个角度、不同层次加以认识。所以认识概念不仅要区分开概念的本质属性与非本质属性, 还面临着概念本质属性如何丰富起来的问题。

通过对上例的分析发现, 由于简单的背诵, 学生对“方程”的认识非常单薄, 仅有两个维度:含有未知数和有等号, 所以会列出“ (9-6) ÷2=X”的方程。然而, 方程的内涵非常丰富, 比如与四则运算的运算加工或普通等式比较, 方程的一个属性是“现实问题的数学描述, 这种描述可以是已知量, 也可以含有未知量”, 也就是说, 它是不经过运算加工的数学问题, 只是对问题情境的数学描述, 同时揭示出它的另一个属性:既可以用已知量进行描述, 也可以用未知量进行描述。

那么怎样才能成功地进行概念教学, 让概念丰富和立体起来呢?变异理论为我们提供了一个视角, 它的提出者是世界著名教学论专家瑞典哥德堡大学的马飞龙 (又译作“马腾”) 教授。

一、以本学科常用的认识概念的基本维度为线索, 多方面认识概念

变异理论认为:“对于学习来说, 一定数量的重复是绝对有必要的。但并不是说学习能从一成不变的简单重复中产生。另一方面, 我们也不认为学习能从毫无重复、变化无端中产生。学习源于系统的重复和变异。变异理论的基本观点是, 为了认识某个事物, 就必须注意到这个事物与其他事物之间的不同。”[1]

学习不能从一成不变的简单重复中产生, 让学生把概念记熟、背诵, 显然不是学习的最佳选择。学习也不能从毫无重复、变化无端中产生, 所以让学生每天面对陌生的学习内容也不是最佳选择。学习源于系统地重复和变异, 而要发现与其他事物之间的重复或不同, 就必须首先进行比较。因此, 变异理论的基本方法是对比。马飞龙在他的另一篇文章中, 引用了19世纪英国哲学家和神学家James Martineau的一段话, 很好地说明了对比的分化力量:“先看一个象牙球, 然后把它拿走, 它会给我们留下一个内在表征, 其各方面特征同时存在, 不能区分。接下来出现一个白球, 这时, 而不是刚才, 通过对比的作用, 一个因素即颜色, 从球里分离出来, 显现到突出地位。再用一个鸡蛋替换白球, 这个新的差异会将形状从沉睡状态唤醒到我们的意识中。由此, 对我们而言, 最开始只是与某个背景相分离的一个物体, 逐渐成为一个红色的物体, 再是一个红色球体”。[2]对比使人注意到事物的变异, 并通过变异把反映事物的维度 (即上述引用中的因素如颜色、形状) 揭示出来。我们认为揭示出反映事物的维度是非常重要的, 维度是支撑概念图式的一个个支架, 多一个维度, 这个概念就更立体一些, 这些维度有机联系在一起, 支撑起这个概念图式。“所谓客观的现实’是如此难以接近, 使人们有必要以图式结构来处理世界。”[3]维度就是搭建概念图式的框架, 多一条维度, 对概念的理解就多一条线索, 维度越多, 概念就越丰满, 接近“客观的现实”的可能性就越大。

所以, 变异理论认为, 学习发生的最佳条件, 感悟最容易发生的情境, 是在进行比较、辨别的时候。“辨别是指找出使一事物区别于其他事物的突出特征或关键差异。这些突出特征就是事物的变异维度, 可以用来说明哪些是这个事物 (正例) 和哪些不是 (反例) 。因此, 知觉学习就是找出突出特征或关键性的变异维度。”[4]那么反过来是不是可以说, 根据维度就容易找出突出特征或关键性的变异, 也就是容易辨别概念呢?比如上例中, 根据颜色、形状等维度的情况, 能否容易辨别、认识“红色球体”这个概念呢?回答是肯定的, 知道的维度越多, 揭示出概念本质属性的可能性就越大。概念尤其是数学概念具有高度的抽象性, 这种抽象性往往掩盖着它与具体事物的联系, 例如方程有多种属性, 其中既包括定义中揭示的“含有未知数的等式”两个属性, 也包括定义中未揭示的属性, 这些未揭示的属性是隐含的, 如果学生们能认识到这些属性, 就可以通过在不同维度的比较中唤醒并使它们凸显出来。比如从表达形式上看, 方程是用数、符号等表示的相等关系;从算式表达形式的实质上看, 是两个等价事件的不同表述用等号连接起来;从表述形式对数量关系加工程度上看, 只是现实问题的数学描述而不是加工, 这种描述可以是已知量, 也可以含有未知量;从运算方式上看, 方程是通过相等关系去寻找未知量的值, 可以把未知量看做已知量参与列式和运算。上述四个维度的属性体现了方程不同于普通等式的特别之处, 如果没有对这些维度的比较, 概念的内涵就不会被学生所认识。可以说, 没有在各个维度上的比较就不会有特性, 也就不会认识到概念内涵的丰富性。

所以在概念教学中, 除了准确认识定义中揭示的本质属性外, 还应该在概念其他维度的情况上, 特别是在那些反复出现、具有一般性的学科基础维度方面, 通过比较加以多维度的认识, 以揭示出隐含在其中的属性。比如数学学科概念的基本维度:表达什么数量关系, 运算特点是什么, 要解决什么问题, 有什么应用, 几何意义是什么等。上述的方程属性就是在方程的表达形式、表述内容、运算方法、组成要素等几个维度上的情况。建议教师们要搜集、整理本学科常用的概念基本维度, 在教学时从这些维度多方面加以认识。概念在多维度上的属性之间不是孤立的, 而是具有逻辑性的。在日常生活中, 我们常根据事物的各种可能性关系对它们进行认识, 试图通过推理将各个方面联系起来, 克服在初识概念时受表面知觉的局限, 而更关注其内在的本质。所以对于某个维度的属性, 还可以利用因果关系或等级关系对此属性进行分析推理以得到新的属性, 使学生对概念的认识逐渐丰富、立体起来。

二、以学生的认知结构为依托, 提高丰富概念的效率

对概念这种立体、多维的认识需要较长时间才能达到, 因此比较高效率的方式是从学生的认知结构里构建的概念体系中加以认识。在学生的认知结构中, 存在着概念图, 将有关某一主题按照上位、下位、平等级别的概念连接, 形成关于该主题的概念网络, 它反映着学习者现有的认知结构。奥苏贝尔认为, 新概念的学习是在原有概念的基础上, 形成新的认知结构的过程。原有认知结构对新的学习始终是一个最关键的因素:一切新的学习都是在过去学习的基础上产生的, 所以用旧概念常常能表征新概念。为什么呢?用变异理论解释就是:知觉学习就是找出突出特征或关键性的变异维度。但“识别的条件是什么呢?鲍顿和马飞龙指出, 当某个现象或某个事物的一个方面发生变化, 而另外一些方面保持不变时, 变化的方面就会被识别出来。”[5]新概念与学生概念图中的旧概念比较, 新概念脱胎于它们, 继承了它们的许多属性, 在很多方面 (或维度) 是不变的, 只是在几个方面变化 (但是通过一个一个方面的变化聚合起来) , 符合容易识别的条件。所以, 在掌握旧概念的基础上, 识别了变化的方面, 就抓住了新概念的本质属性;把旧概念变化的方面说出来, 就表征了新概念。

学生已经掌握了的旧概念, 在学生的大脑中已经形成了系统的体系, 在学生眼里它们是理所当然的, 隐含着除定义外经过推理、联系得到的许多属性, 相对于没有掌握的概念, 它们是立体的、多维的、形象生动的、丰富多彩的。因此新概念的掌握除关注与旧概念发生变化的维度外, 还要关注与旧概念相同的维度, 它们可以快速使新概念的属性丰富起来。例如方程的上位概念是等式, 平位概念是不含未知数的等式, 理解方程时等式的许多维度如目的、意义、运算法则等对方程同样适用。而与平位概念加以对比, 也可以使新概念的维度丰富起来。“一个单词的含义不仅来自它所指的事物, 或它之前或之后搭配的词, 而且可以来自它能替换的词。例如棕色’的含义可以通过不是红色、蓝色, 也不是黄色来解释。疑问句的含义也可以部分地理解为既不是陈述句, 也不是祈使句或感叹句。语言是一个系统, 我们运用其某些组成部分的时候, 整个系统就会出现在我们的意识中并产生一定的意义”[6]。所以方程与它的平位概念“不含未知数的等式”比较, 其诸多属性便显示出来:它与数量的关系不是加工数量的关系, 而是描述、运算的顺序;它不是顺运算, 而是逆运算、算理的表达;它不是逆向推理, 而是正向推理等。

在学生的认知结构中, 不仅有共时性的对比, 而且有历时性的对比, 通过在不同维度上的对比, 不仅从结构的共时性中寻找概念之间的关联, 而且还应该从结构的历时性中寻找它们之间的逻辑。“没有接触过关于同一现象的另一种理论, 我们 (如果不是不可能) 就很难理解一种理论但这同时意味着我们不可能理解首次遇到的理论。于是, 有人提出应将科学史作为科学课程的组成部分”, “因此, 因为有对比 (很多时候是互相对立) , 学习亚里士多德关于力与运动关系的学说可以促进对牛顿相关观点的理解;学习笛卡儿对重力的解释有助于学生理解牛顿的重力学说;绝对的时空观可以揭示相对论的含义;地心说可以促进对日心说的理解”[7]。考察科学史可以知道, 人类认识一个新概念或新结论, 总是在实践中感到原有的概念或结论的不足, 在个别的具体实践中, 对其中数量关系、空间形式产生了本质的、一般性的认识, 并能用来解决新问题, 便提出新概念或新结论。课堂教学显然不能一成不变地重复那漫长而曲折的历史过程, 但对于那些至关重要的概念, 可以把人类发现这个概念的过程浓缩加工后呈现给学生, 这等于为学生认识新概念提供了多维度的信息:它产生的前提、价值、意义、适用范围等;它们逻辑性地联系在一起, 成为新概念的隐含属性, 并为以后产生新的概念属性打下逻辑基础。“基础教育的数学有四个层次: (1) 数及其运算 (即算术) ; (2) 式及其运算 (包括因式分解、配方变形、合并同类项等) ; (3) 式与变量的数学 (函数可以说是两个之间的一个特殊关系式) ; (4) 极限运算下的变量数学 (即微积分) 。在这四个层次中, 方程起到了纽带的作用。方程基于“式的运算”, 又为函数概念打基础。方程是通向“未知的隧道”实际上, 方程的本质是为了求未知数, 而在未知数和已知数之间建立起来的一种等式关系。也就是说, 学习方程, 目的是求未知数, 方法是“拉关系”, 具体策略是通过等式变换进行“还原与对消”。这符合“代数学”的本意是“还原和对消的科学”, 也就是要把淹没在方程中的未知数暴露出来, 还原x的本来面目。这好比要结识朋友, 就得通过别人介绍, 借助中介关系, 如此而已。[8]

三、在优化的教学情境中丰富概念

学生在建构一个概念的心理表征时, 既有可以用语言表达的语言维度的属性, 又有难以用语言表达的非语言维度的属性, 而且, 非语言属性远远多于语言属性。当学生完成对某个概念的建构时, 其语言属性的表征仅仅是可以表达出来的外部形式, 而不能以外部形式表达出来的非语言属性的表征则与语言表征紧密联系, 并给予语言表征有力的支撑。在概念的理解中, 语言和非语言表征同样重要。在对客体的主动活动中, 主体在获得语言表征的同时, 还可获得情节属性的表征和动作属性的表征。语言表征是活动中经验的抽象与概括。情节表征是活动中的视觉映象或其他映象, 动作表征则是行动中获得的直接体验。通过这些语言、动作、情节属性表征的建立, 丰富复杂的概念心理表征就获得了。如果只有语言属性的表征, 而没有非语言属性的表征, 那么认识必定是机械的、单调的、不完整的。单纯的语言符号概念教学, 情节维度的属性和动作维度的属性是非常有限的, 所以情境教学不失为一条有效的弥补途径。“经过教师的选择、设计、整理和条理化, 作为蕴涵特定概念的优化的情境, 其实是帮助学生以结构化的方式理解世界的主要途径”。[9]

“侦察员在破案现场量得嫌疑人的鞋印长度为27厘米。资料显示:成人脚长约是身高的1/7, 是鞋长的8/9, 嫌疑人身高大约是多少?用方程解决这个问题, 学生可以经历下面的过程: (1) 找一个相等关系:脚长=脚长。 (2) 等价事件的不同表达:用X厘米表示身高, 脚长= (符号表达) , 用鞋长表示的脚长=27。 (3) 用语言表达相等关系:用身高表示的脚长=用鞋长表示的脚长。 (4) 用数学符号表达相等关系:X=27。 (5) 解方程求出未知数的值:X=168。”[10]

在这个情境中的方程里, 学生可以得到关于方程的许多视觉映象和动作映象, 使方程的“相等关系”、“等价事件”等这些抽象维度顿时鲜活生动起来。而且一些无法用词语表达的属性也以动态的映象贮存在头脑中, 学生通过情境提供的各种刺激和信息, 充分利用情节、动作、语言维度所提供的意象蒙太奇, 形成自己对概念的多维度的、立体的、生动的理解。

学习源于系统的重复和变异, 概念学习也同样如此, 通过重复中的变异, 认识到概念蕴涵的一个个维度。这些维度都包含了独特的属性, 它们有机地、逻辑地联系在一起, 建构起了立体的、丰富的概念内容。

参考文献

[1][5]植佩敏, 马飞龙.如何促进学生学习——变异理论与中国式教学[J].人民教育, 2009 (8) .

[2][4][6][7]马飞龙.迁移的悖论[A].迁移中的共同性与差异性[C].2005, 13-16、17、11、15.

[3]伊瑟尔.怎样做理论[M].南京:南京大学出版社, 2008:43.

[8]舒欣.关于方程概念的欣赏[J].数学教学, 2010 (1) .

[9]吴刚.情境教育与优质教学[J].课程.教材.教法2009 (6) .

语言变异的概念整合阐释 第3篇

关键词:概念合成 语言变异 语音变异

一、引言

钱钟书的《围城》是一部伟大的文学作品,从20世纪80年代到现在,国内学者对《围城》作品的研究成果层出不穷,主要集中在语言的运用、作品的社会意义、文学评论等方面,本文意从概念整合理论的角度出发研究《围城》的语言魅力。

二、概念整合理论

(一)概念整合理论简介。概念合成理论是由Fauconnier和Turner 首先提出的,是由心理空间理论发展而来的。心理空间理论是解释一切言语行为的理论指导。人们谈话交流时为了理解话语而建构的概念整合。概念整合就是把两个或两个以上的已有概念整合为合成空间中带有创新性的一个新的空间。语言学家普遍认为概念整合理论无处不在且对任何事物具有解释力,是人类的一种基本认知方式。

(二)概念整合的主要类型。Fauconnier& Turner(2002) 指出概念整合网络里最基本的类型有镜像网络类型,单纯网络类型,单域网络类型,双域网络类型。

1.镜像网络

所有镜像网络里的网络空间并不存在冲突,不论是两个输入空间,还是类属空间都相互独立,互不干涉。

2.单纯网络

单纯网络含有两个输入空间,一个是框架,一个是价值。这个网络整合了两个最基本的框架和价值。概念整合也包含了单纯网络是因为他也产生了复合空间,在这个空间里产生了两个角色。

3.单域网络

单域网络中的两个输入空间有着不同的组织框架,其中一个输入空间的组织框架延伸形成整合空间的组织框架。单域空间的整合涉及到最典型的从源域到目标域的隐喻。

4.双域网络在双域网络里

两个输入空间有着不相同甚至相冲突的组织框架。他们均部分投射到合成空间,形成层创结构。

(三)概念整合理论对《围城》语言变异的阐释

1.汉语语音借用

钱钟书老先生年轻时也是海归,字里行间都容易流露出对英文的留恋。这些海归经历也在他的文章中体现出来,《围城》主人翁方鸿渐也是众多海归中的一位。可是并没有像别人一样辉煌,但又希望能在语言间体现自己的留学经历,所以便时不时冒出些英文的字眼。

(1)“东坡”两个字给鲍小姐南洋口音念得好像法国话里的 “坟墓”. (tombeau)

(钱钟书,1991:5)

例(1)作者把对对方的憎恨写得恰到好处,惟妙惟肖,鲍小姐是南洋口音,所以她的口音和其他的留学生还不一样。“东坡”二字对于鲍小姐来说会有点难度。因为发音不准,倒是个巧合,和法语的tombeau很是相似,而tombeau翻译成汉语是“坟墓”的意思。中国人特别忌讳“死亡”之类的词语,这也让鲍小姐和苏小姐二人的关系立马鲜明了起来。为两位女人的斗争埋下伏笔。

2.词语拆用

(2)一千年后,这些书准像敦煌石室里的卷子那样名贵,现在呢,他们古而不稀,短见浅识的藏书家还不知道收买。

(钱钟书,1991:203)

例(2)描述的是三闾大学的图书馆。一个大学的图书馆本应该藏书甚多,才能经得起学者们的考验,对得起学生的信赖,是说明一个大学好与坏的最好的证明。可是三闾大学的藏书是真对不起观众。“通共不上一千本”,少而精大家也能原谅,却都是“老的,破旧的,无用的”中文教科书。作者用了咱们中国人称“古稀”的词语来讽刺三闾大学的图书馆。古稀之年在我们中国人的眼里是高寿而且很有阅历,很有经验的年龄。三闾大学的图书“古”,形容很古老,很无用,我们知道学术要前沿,要尖端。“稀”本应该是珍稀,可是用在这形容并不“珍稀”而是“稀少”。人生七十古来稀,可是三闾大学的是“古而不稀”。词语结构骤然拆开,给人一种陌生但又能猜出词义来的感觉,语义也发生偏离。“古而不稀”指的是古老而又不稀奇,陈旧而又没有价值。“一千年后,这些书准像敦煌石室的卷子那样名贵”,可是藏书家还是不知道要收藏起来,这句话明显是反语,描述出战后的文化教育事业带来的冲击是巨大的。这样避免了直接说出作者的愤怒之情,又能起到戏谑嘲讽的功效,可谓是一举两得。

风格是对常规的突破,变异就是不流于平淡,就是语言的突破。在《围城》中,运用概念整合来实现语言变异对人们每天使用的语言中突破出来的。对旧的话语中提炼出新的意义。幽默诙谐,作者的意图需要读者思考,品味,比直接说出字面意思要深刻而且隐晦,耐人寻味。本文运用了理想化认知模式和心理空间理论来阐释语用预设的内在实质和在文学作品中的作用。同一信息在不同的读者空间中具有差异性,这就为预设的生成提供了可能性。当这种文学作品的预设与读者的预设达成一致时,文学作品的魅力就突显出来了。

三、结语

概念整合理论运用于比喻研究中, 能够从一个全新的角度为读者理解比喻提供有步骤的认知过程, 也能为写作者写出好的比喻句提供有操作性的写作原则。

参考文献

[1]祝婉瑾.社会语言学译文集[C].北京:北京大学出版社,1985.

[2]冯广艺.变异修辞学(修订版)[M].武汉:湖北教育出版社,2004.

[3]陈望道.修辞学发凡[M].上海:上海教育出版社,2006.

[4]陈松岑.语言变异研究[M].广州:广东教育出版社, 1999.

统计学变异的概念 第4篇

火灾的燃烧产物非常复杂, 但火场参变量既有一定的随机性, 在空间分布上又具有某种相关性, 故可用地质统计学方法研究其空间变异性。众所周知, 火场氧浓度降低、大量烟气遮挡视线和吸入毒性气体是造成火灾中人员无法逃生而窒息死亡的三大主要因素。故笔者以火场烟气中CO体积分数为例, 用地质统计学方法对其空间变化形态进行研究。

1 地质统计学基本原理

1.1 区域化变量

地质统计学主要的研究对象是一些与空间位置有关并体现着随机性和结构性的变量, 在地质统计学中这些变量被称为区域化变量。即以空间点x的三个直角坐标xu, xv, xw为自变量的随机场Z (xu, xv, xw;ω) =Z (x) 为一个区域化变量, Z (x) 的具体含义视场合而定。当Z (x) 代表某种变量时, 一方面当空间一点x固定后, Z (x) 是不确定的, 可看成是一个随机变量, 这就体现了其随机性;另一方面, 在空间两个不同点x和x+h处的变量Z (x) 与Z (x+h) 又具有某种程度的自相关性。故区域化变量同时反映了空间变量的结构性和随机性。

1.2 变差函数

1.2.1 变差函数的定义

地质统计学中将区域化变量Z (x) 在x, x+h两点处的值之差的方差之半定义为Z (x) 在x方向上的变差函数, 记为γ (x, h) , 见式 (1) :

undefined

当区域化变量满足二阶平稳假设或本征假设时, Z (x) 的变差函数就变成了只依赖于h而与x无关的函数, 简记为γ (h) , 见式 (2) :

undefined

1.2.2 实验变差函数

由数理统计知识可知, 变差函数可以转化为将[Z (x) -Z (x+h) ]2离散后求其均值, 此时求得的变差函数称为实验变差函数, 见式 (3) :

undefined (3)

式中:Z (xi) 为i点上的观测值;Z (xi+h) 为与i点距离为h的点的观测值;h为两观测点之间距离, 称为滞后距;N (h) 为相距为h的点对的数目。

实验变差函数具有方向性, 按照某一方向取滞后距, 可得该方向上的实验变差函数。不同大小的滞后距h对应不同的变差函数值。可见, 实验变差函数γ* (h) 就是用某一个域内有限的观测点数据构造变差函数γ (h) 的估计值, 根据式 (3) 可以对已知观测点的区域化变量的变差函数做出估计。

1.2.3 理论变差函数

为估计未知点的区域化变量的变差函数值, 求出实验变差函数后可拟合理论变差函数模型, 由此估计其他点区域化变量的变差函数值。通常拟合变差函数的模型有多种, 其中最常用的一种球状模型, 数学表达式见式 (4) :

undefined

式中:a为变程;C0为块金值;C为拱高值;C0+C为基台值。

球状模型变差函数见图1。变程a反映了区域化变量的影响范围, 当h>a时变差函数不再单调增加, 说明变量的变化性与距离无关了。 基台值C0+C反映了变量变化性的大小, 块金值C0反映了变量连续性的优劣。

1.3 克立格估值

在地质统计学中采用克立格法对区域化变量进行估值。克立格法是根据待估样本点的有限邻域内若干已测定的样本点数据, 考虑了样本点的形状、大小和空间相互位置关系, 与待估样本点的相互空间位置关系, 以及变差函数提供的结构信息, 对待估样本点值进行的一种线性无偏最优估计。克立格估值有多种类型, 其中常用的是普通克立格估值法, 线性估计式见式 (5) 。

undefined (5)

式中:Zi为观测点上的观测值;Zv*为待估点上的估计值;λi为权系数。

克立格估值条件为: (1) 无偏性条件, 即E (Zv*-Zv) =0; (2) 方差最小性条件, 即满足Var (Zv*-Zv) 2最小。其中Zv为待估点上的真实值。根据上述两条件导出求克立格估值权系数λi的方程组, 简称为克立格方程组, 表达式见式 (6) :

undefined

式中:xv为待估点的坐标, γ (xi, xj) 为观测点i与j之间的变差函数值, γ (xj, xv) 为观测点j与待估点之间的变差函数值, μ为拉格朗日乘数。

解上述方程组可得到克立格估值权系数λi。

2 火场参数空间分布规律模拟

2.1 FDS模拟火灾场景

火灾房间的室内净空尺寸 (长宽高) 为6 m4 m3 m, 两侧长边墙上分别设有门和窗, 火源在地板上的位置如图2所示。该例中以房间起火后某一特定时间段, 距离地板2.1 m高度处的烟气中CO体积分数为研究对象, 视该高度平面内CO体积分数为区域化变量, 研究该参数在二维空间内的分布趋势。

首先, 由FDS模拟软件计算该平面内CO的体积分数, 并将该平面划分为0.2 m0.2 m的网格, 将FDS模拟的网格点上的CO体积分数绘成三维立体图, 见图3所示。

在该平面内选取22个点作为观测数据点 (分布图见图4) , 由这22个点上的数据进行克立格估值计算, 得出0.2 m0.2 m的网格点上的CO体积分数估值。

2.2 地质统计学计算过程

2.2.1 计算变差函数

首先根据上述FDS模拟的22个点上的CO体积分数值, 运用式 (3) 计算实验变差函数值。笔者分别对u方向和v方向计算了实验变差函数, 运用最小二乘法将实验变差函数拟合成理论变差函数模型, 得到两个方向上的理论变差函数模型的参数, 见表1。

由表1可知, CO体积分数在u方向3.357 m距离内空间相关性较好, 在v方向上2.335 m距离内是空间相关的。v方向的变程比u方向的变程小, 这说明v方向的相关性不如u方向的好。两个方向的块金值都为零, 这反映了CO体积分数在整个区域连续性较好。v方向的基台值C0+C为0.132 m, u方向的基台值为0.077 m, v方向比u方向的基台值大表明v方向的变化幅度比u方向的变化幅度大。由于本例中房间的门窗洞口在长边 (u方向) 墙上, v方向的通风情况较好, 故v方向CO体积分数变化性较u方向大, 此结论与上述计算结果吻合。

2.2.2 普通克立格估值

运用克立格方程组对上述0.2 m0.2 m的网格每个网格点的CO体积分数值进行克立格估值。计算步骤为:在建立理论变差函数的基础上, 用式 (6) 给出的克立格方程组, 计算克立格估值权系数λi, 并将λi带入式 (5) 计算得出克立格估计值。由克立格估值结果绘出的CO体积分数三维立体图, 如图5所示。

将图5表示的估值结果与图4的模拟结果对比分析可以看到, 普通克立格方法估值的精度是比较高的。上述三维立体图可直观显示CO体积分数的空间变化形态, 由图5可以看出, 在火源附近CO体积分数突然增大, 靠近门、窗口附近CO体积分数有所增加, 可见由克立格估值模拟的CO体积分数空间分布特征比较符合实际的火灾场景。

3 结论与展望

(1) 变差函数模型或参数能够反映变量的空间变化特性。由表1可知, CO体积分数在空间分布上存在相关性, v方向的变程比u方向小, 且v方向的基台值比u方向大, 这说明v方向的变化性比u方向的变化性大 (因为v方向有门窗通风口) ;两个方向的块金值都为零, 这反映了在整个研究区域内变量的连续性较好。

(2) 克立格估值是一种最小方差线性无偏估计。由于文章篇幅所限, 笔者将FDS模拟的网格点CO体积分数数据与克立格估值结果数据的差别以三维立体图的形式进行对比。对比分析图4和图5可知, 克立格方法估值的精度是比较高的。此外, 克立格估值既能给出区域化变量的最优估计值, 又能给出估计方差, 这种特性是其它任何一种估计方法所没有的。

(3) 地质统计学是模拟与空间位置有关的变量空间变化规律的有效工具和方法。根据有限个采样点上的数据, 借助变差函数的结构特点, 对未采样点的区域化变量的取值进行最优估计。因而用地质统计学方法来研究火场参变量的空间变异性, 可以定量地揭示其在空间不同方向上的变化规律。同时, 它不仅可以进行变量的整体估计, 还可以进行变量的局部估计。

(4) 地质统计学在消防工程领域的应用前景广阔。地质统计学是研究具有结构性和随机性的空间分布数据的有效工具, 除了笔者列举的CO体积分数外, 诸如火灾烟气的温度、危险化学品储存及易燃易爆场所可燃气体的浓度等, 都可以看作区域化变量。用地质统计学方法定量分析这些变量的空间分布形态, 可为消防工程设计及监督检查人员提供参考信息或决策依据。此外, 近年来地质统计学的研究范围也从空间分析扩展到时间分析, 产生了时间域上的地质统计学, 这将为其在消防领域内的应用提供更广阔的前景。

参考文献

[1]侯景儒.实用地质统计学[M].北京:地质出版社, 1998.

[2]张仁铎.空间变异理论及应用[M].北京:科学出版社, 2005.

[3]孙洪泉, 陆国桢, 邵玉宏, 等.判别分析法在矿井地质构造预测中的应用[J].煤炭学报, 1996, 21 (5) :455-458.

[4]邢红星, 琚太忠, 林建阳.普通克里格法在矿产储量计算中的应用[J].地质与勘探, 1997, 33 (4) :46-51.

统计学变异的概念 第5篇

关键词:有机碳密度;地统计学;空间变异;GIS;空间相关性

中图分类号:S153.6 文献标识码:A 文章编号:1674-1161(2014)02-0019-03

碳循环是全球环境变化问题的研究重点,而土壤呼吸作用产生的碳尤其是有机碳是全球碳循环总量的重要组成部分。土壤有机碳大部分集中在土壤表层,其动态变化对大气CO2浓度、土壤质量及土地生产力有非常重要的影响,直接影响土壤肥力和作物产量。

昌图县位于辽宁省铁岭市北部,属中温带亚湿润季风大陆性气候,地势平坦,土质肥沃,年平均气温6~7 ℃,年平均降水量600 mm,是辽宁省的产粮大县之一,也是全国著名的农业大县、商品粮生产基地。昌图县的主要土壤类型为棕壤、草甸土和黑土。分析当地土壤有机碳的空间变异特性,全面系统地了解昌图县土壤有机碳的密度,对指导昌图地区的生产实践和区域建设具有重要意义。

1 材料与方法

1.1 样品采集与分析

根据昌图县土壤类型分布特点及土壤系统分类采样原则,于2012年在昌图县采集70个样点(0~20 cm土层)的样品,并记录野外样点位置,根据土壤剖面特征进行土层描述。土壤系统分类的采样原则为:重要性原则(农林牧业利用价值大)、主要性原则(分布广,面积大)、独特性原则(分布面积虽小但类型独特)、均匀性原则(全县各地尽量均匀)。

土样经风干处理后,采用干烧法(元素分析仪)测定有机质含量;采用环刀法测定容重;过筛后称定砾石质量。

土壤有机碳密度(T0)通常是指单位面积土体中所含有的有机碳质量,是表征土壤质量及陆地生态系统对全球变化贡献大小的量度指标。对共分为m层的某土壤剖面来说,T0计算公式为:

T0 =Σmj=1(1-δ%)ρjcjdj/100 (1)

式中:cj表第j层中土壤有机碳平均含量,g/kg;ρj为容重,g/cm3;δj%为砾石的体积分数;dj为厚度,cm。

1.2 研究分析方法

分别利用Excel和SPSS 13.0进行试验数据的基本处理和描述性统计分析,采用GS+7.0统计软件和域法进行半变异函数拟合和特异值识别,选用ArcGis9.3地理信息系统软件完成土壤有机碳克里格插值的空间分析。

2 结果与分析

2.1 土壤有机碳描述性统计

对昌图县的70个土壤样本数据进行一般描述性统计,数据基本符合正态分布,结果见表1。

由表1可以看出,表层土壤(0~20 cm)的有机碳密度在0.55~3.41 g/kg之间,平均含量为1.97 g/kg;从反映离散程度的变异系数可以看出,有机碳密度表现出强变异性,变异程度较大。考虑到特异值对样本数值的影响,采用域法识别特异值,确定样本数据中无特异值出现。

2.2 土壤有机碳半变异结构分析

在多种因素的共同作用下,土壤性质具有空间分布的非均一性或空间变异性,且它们彼此不是相互独立的,而是在一定范围内存在空间自相关性。地统计学的核心是根据样本点确定研究对象(土壤性质的某一变量)随空间位置变化的规律,以此推算位置点的属性值。检验结果表明,土壤有机碳密度变量服从正态分布,故进行变异函数模型拟合,得到如图1所示的半方差函数理论模型。

一般认为,块金值(C)代表随机变异的量,如施肥、耕作措施、种植制度等各种人为活动引起的变异。基台值(C0+C)代表变量空间变异的结构性方差,即由土壤母质、地形、气候等非人为因素引起的变异,是系统内总的变异。块金系数[C0/(C0+C)]则是块金值与基台值的比值,表示随机部分引起的空间异质性占系统总变异的比例。按照区域化变量空间相关程度的分级标准,块金系数<25%时,变量具有强烈的空间相关性;块金系数在25%~75%之间时,变量具有中等空间自相关;块金系数>75%时,变量的空间自相关性微弱,变异主要由随机变异组成,不适合采用空间插值的方法进行空间预测。根据变异函数理论模型得出的相应参数见表2。

由表2可以看出:昌图县表层土壤有机碳密度的理论变异函数符合线形模型,块金值与基台值之比为15.18%,土壤表层有机碳密度的空间相关性较强,表明昌图县土壤有机质具有较强的空间相关性,区域性因素引起的变异占较大比例。究其原因,可能是昌图作为农业大县,土地利用、施肥、管理等随机因素对表层土壤造成一定程度的人为干扰。

在农业活动中,农民为提高粮食产量,常常大量使用肥料,导致土壤中的有机碳含量增加。另外,耕作能改变土壤结构,增加土壤生物的呼吸速率,从而使土壤中的有机碳含量减少。

2.3 土壤有机碳空间分布特征

采用ArcGis9.3地理信息系统软件中的地统计模块,分析土壤有机碳密度的空间分布特征,完成土壤有机碳克里格插值的空间分析。克里格插值法(Kriging)也称空间局部估计法或空间局部插值法,它建立在半变异函数理论及结构分析基础上,根据待估样点(或待估地块)有限邻域内若干已测定的样点数据,在认真考虑样点的形状、大小、空间相互位置关系以及它们与待估样点间的空间位置关系,半变异函数提供的结构信息后,对待估样点进行线性无偏最优估计,最终得出待估样点某些属性(或性状)的空间分布插值图。

图2是昌图县表层土壤有机碳密度的空间分布插值图,显示了不同级别养分含量的分布状况。

从图2可以直观地看出,昌图县南部和东部土壤的有机碳密度较高,多在1.98~2.70 g/kg之間;西北部有机碳密度较低,维持在1.26g~1.78 g/kg之间。总的来看,昌图县土壤有机质分布呈现东南部向西北部递减的规律。

3 结论与讨论

从经典统计学分析结果来看,昌图县表层土壤有机碳密度表现出强度变异,可能是日益增强的人类活动所致。地统计学分析结果表明,昌图县表层土壤有机碳密度的空间变异函数可以用线性模型进行拟合,表层土壤有机碳密度的空间相关性较强。Kriging插值图直观地描述了昌图表层土壤有机碳密度的分布格局。总的来看,有机碳密度呈现从东南部向西北部递减的规律,这与昌图的农田利用状况息息相关。

同时,研究存在以下问题:1)仅对深度0~20 cm的土层进行分析,不能全面细致的说明问题。若想计算有机碳的储量,则需采集剖面0~100 cm的土样。在今后的研究中,需要进行深层次的样品采集。2)表层土壤有机碳密度受人为因素影响很大,要获得更为准确详实数据,需在更多的地点进行土样采集,且采样点位也需进行进一步确定;3)对土壤有机碳含量的研究内容不够全面,拟在将来做更为深入的研究。

参考文献

[1] 潘根兴.中国土壤有机碳库及其演变与应对气候变化[J].气候变化研究进展,2008,4(5):282-289.

[2] 金峰,杨浩,赵其国.土壤有机碳储量及影响因素研究进展[J].土壤,2000(1):12-17.

[3] 薛正平,杨星卫,段项锁,等.土壤养分空间变异及合理取样数研究[J].农业工程学报,2002,7(4):86-91.

[4] 雷志栋,杨诗秀.土壤特性时空变异性初步研究[J].水利学报,1985(9):10-21.

[5] 陈彦,吕新.基于GIS和地统计学的土壤养分空间变异特征研究——以新疆农七师125团为例[J].中国农学通,2005,21(7):389-

391.

统计学变异的概念 第6篇

高中生物“染色体变异”一节中, 概念多、难度大, 如“染色体组”、“单倍体育种”、“多倍体育种”等, 即使采用多媒体教学, 效果也不甚理想。笔者所在的教育行政部门架构了“网络生态学习系统”, 为实践“翻转课堂”提供了很好的平台。尝试“翻转课堂”下的生物学概念教学, 寻求课堂教学时间和空间的突破, 达成最佳的教学效果, 不妨从“云教育”理念下的网络教学入手。

一、基于“云教育”理念下的网络教学

信息时代教育的边界被进一步打破, 学习的地点和方式都可以发生改变, 教师将教学资源推送到“网络生态学习系统”上, 学生可以用便携的电子设备随时随地登陆、学习, 当这个平台融入了教学、管理、交流等更多功能时, 基于“云教育”理念下的课前网络教学便得以实现。

1.“微视频”点播, 启动课前学习

这里的课前学习并不是传统的预先阅读文本, 它的载体是网络共享的“微视频”。在这一节中, 笔者就录制了“染色体结构会出现怎样的变异?”“染色体数目会出现怎样的变异?”“有趣的多倍体和单倍体”, “三倍体西瓜是怎么来的”等多个微视频供学生点播。这些视频时长不超过5分钟, 短小精悍、有一定的逻辑性, 与课堂教学的主题密切相关, 学习系统中的“动态演示区”除了有教师的视频讲解, 还能实时同步播放课件、板书和标注。

这种“微视频”点播的方式实现了学习的选择性。人本主义心理学家罗杰斯强调:人的本质特征就在于自觉的选择意识, 学习活动也是一连串选择的集合, 在选择中体现了学习者的主体性和能动性。每一个学生都有其独特的智力背景和情感背景, 正是这种差异, 带来了不同的情感倾向和认知基础。学生点播“微视频”, 可以选择学习内容, 播放自己感兴趣的微视频;可以选择学习进程, 视频的暂停、回放功能为不同层次的学生留下了学习空间, 缩小了认知水平的差异。

2.提出“真问题”, 了解认知障碍

传统教学中, 能当堂提出问题的学生只是少数, 教师更多地是根据预设推进教学。“翻转课堂”则不同, 课前学习视频后, 学生有充足的时间思考并提出自己的问题, “在线互动区”就是师生之间、学生之间的网络交流平台。

在这节中多数学生就提出以下问题:“染色体变异中的缺失、重复和基因突变中的缺失、增添一样吗?”“易位和交叉互换为什么很像呢?”“到底什么是一个染色体组呢?”“单倍体育种的过程是怎样的呢?”一些羞于提问的学生则匿名留言:“染色体丢失片段能观察到吗?”“XY染色体是不是同源染色体?”“无籽西瓜怎么繁殖后代呢?”这些问题不管复杂或是简单, 都是学生经过思考后提出的“真问题”。真实的问题, 才能反映出个体学习过程中的认知障碍, 帮助老师充分掌握学情。简单的问题, 可以及时在线解决, 减轻学生课堂认知负荷;复杂的共性问题, 恰恰就是教学难点, 老师可以针对性地选择教学策略, 组织有效的课堂教学活动。

3.绘制“概念图”, 搭建认知图式

“翻转课堂”的课前学习不能止步于看视频、提问题。在“网络生态学习系统”平台中还有一个“作业区”, 教师可以让学生尝试完成“染色体变异”的概念图 (图1) 。

奥苏贝尔认为, 有意义学习的心理机制是同化, 同化又有三种方式:下位学习、上位学习、并列结合学习[1]。根据其“逐渐分化”理论, 学生如果有良好的认知结构, 那么课堂学习就可以从包摄性最高的整体性知识开始, 逐渐掌握细节和内涵。概念图能帮助学生在深入学习时联系到“固着点”上去, 这种下位学习的方式最有效。

二、以“问题解决”为核心的课堂教学

“翻转课堂”的创新在课前, 但关键仍在课堂。学生作好了认知的准备、提出值得探究的问题, 那么在课堂中就应该以问题解决为核心, 通过有效的活动, 在“体验”、“解构”和“合作”中深入学习生物学概念。

1.在“体验”中形成概念

抽象概念之间如果发生混淆, 可能是因为符号表征时出现了相似。同样是“缺失”“增添”, 如果分别发生在DNA中和染色体中有什么差别呢?同样是“片段的转移”, 易位和交叉互换又有什么区别呢?绝大多数学生在课前学习中对此疑惑不解。

笔者设计了关于染色体和DNA的模型活动:动手“去掉”纸质模型DNA中的数个碱基和染色体上的片段, 对比观察这两种情况的差别;通过“移接”磁性贴模型中同源染色体之间的片段和非同源染色体之间的片段, 比较“易位”和“交叉互换”的区别。学生在活动中感受到了相似概念之间的差别, 从传统课堂的“旁观者”到翻转课堂的“体验者”, 获得了感性材料的真切体验, 才能有效地形成概念。

2.在“解构”中建构概念

“雄果蝇精子中的一组染色体就组成了一个染色体组”, 这是课本给出的原型。究竟什么是一个“染色体组”?学生很难理解, 这个概念也很难用“定义”的形式直接传递。认知心理学中的概念学习理论认为:学习者习得的概念内容包括原型、样例和核心成分。在概念教学中既要充分发挥原型和样例的作用, 又要使之上升到准确的核心成分, 才能对概念进行双层表征。

“翻转课堂”的课堂教学中应该引导学生对“染色体组”的概念原型进一步解构:果蝇的精子中有哪几条染色体? (Ⅱ、Ⅲ、Ⅳ、X或Y) ;这些染色体在形态、大小和功能上有什么特点? (各不相同) ;这些染色体之间是什么关系? (是非同源染色体) ;它们是否携带着控制生物生长发育的全部遗传信息? (是) [2]。只有提炼出这些核心成分, 学生才能真正准确地建构起“染色体组”的概念。

3.在“合作”中探究概念

“翻转课堂”还实现了学生的人际交往发展, 课堂教学不仅是一种认知活动、情感活动和实践活动, 同时也是一种人际交往活动, 对于有较大难度的概念, 可以组织学生进行小组合作探究。譬如“单倍体育种”和“多倍体育种”, 探究可以围绕以下问题进行:单倍体 (多倍体) 育种的原理是什么?常用方法有哪些?优点和缺点各是什么?小组成员各自发表观点、讨论交流、思维碰撞、彼此启发、经验共享。之后, 小组安排代表向全班同学汇报发言, 要条理清晰地讲出小组的观点。结束后, 其他小组可以补充发言, 并展开小组间的评价。对于普遍性的问题, 教师可以进行必要的全班指导。

正是在合作探究、生生对话和师生互动中, “翻转课堂”让学生真正成为了学习的主人, 每个学生既是知识的传播者, 又是知识的接受者。这种“人人教我, 我教人人”的学习方式推动着学生:要把别人教会, 必须对知识进行精细加工, 才能提出自己的观点。“翻转课堂”下的小组合作探究, 不仅培养了学生与人合作共事的能力、人际交往技能, 还增强了学生的集体责任感和荣誉感。

“翻转课堂”是伴随网络技术发展出现的新的教学模式, 其本质是先“学”后“教”。“学”是在多维开放、网络共享的环境下开始的, “教”是在互动合作、体验探究的课堂中进行的。

信息时代下, 课堂不再是获取知识的唯一场所, 课本也不再是知识的唯一载体, 学生乐于亲近电子终端, 随时登录平台进行微视频学习, 可谓是“学得积极”。“翻转课堂”的关键更在于“教得有效”, 围绕问题解决, 在活动体验、合作探究中让学生有效地完成认知内化和知识建构。这种教学模式下, 教学内容没有减少, 教学标准没有降低, 学生学得主动、愉快, 完全契合素质教育“减负”的精神。在教育信息化发展的过程中, “翻转课堂”必将对现有的教学模式产生影响, 这种变革也许才刚刚开始, 笔者将继续实践和探索下去。

参考文献

[1]陈琦, 刘儒德主编.教育心理学.高等教育出版社, 2005.

统计中的相近概念比较 第7篇

一、 系统抽样与分层抽样

系统抽样是将总体平均分成几个部分,按照一定的规则,从每个部分中抽取一个个体作为样本,适用于总体中个体数较多的情况.从容量为N的总体中抽取容量为n的样本时,首先把总体平均分成n个部分(若N不能被n整除,则先随机地把多余的个体剔除),令k=,然后分别随机地将各部分中的k个个体编号为1,2,…,k,接着在编号1,2,…,k中用简单随机抽样确定编号l,最后将编号为l的n个个体取出.

分层抽样是将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各部分在总体中所占的比例实施抽样,适用于总体由差异明显的几个部分组成的情况,可以使样本更具有合理性.

例1 (1) 某制罐厂每小时生产易拉罐10 000个,每天生产12小时.为了保证产品的合格率,每隔一段时间要抽取1个易拉罐送检,工厂规定每天共抽取1 200个进行检测,应该如何抽样?

(2) 某工厂有3条生产同一产品的流水线,每天分别生产3 000,4 000,8 000件产品.要从每天生产的所有产品中抽取一个容量为150件的样本进行产品质量调查,应该如何抽样?

解析 问题(1)的特征为间隔同样的时段抽取一个易拉罐,所以应该用系统抽样;问题(2)的特征为3条不同的流水线生产的产品质量有明显差异,为了使样本更具有合理性,必须按比例在相应的流水线上抽样,所以应该用分层抽样.

注意 不管是系统抽样还是分层抽样,每个个体被抽到的可能性都相等,且为(n为样本容量,N为总体容量).

如果说上面一个问题中的数据易于处理,那么下面一个问题应该怎么处理呢?每个个体被抽到的可能性还都相等吗?

例2 从1 003件产品中抽出20件,应该怎样抽取呢?

解析 先按简单随机柚样抽出3件,然后按系统抽样从剩下的1 000件中抽出20件.这样行吗?

你可能会认为这样不行,这样一来每个个体被抽到的可能性不再都相等,原来每个个体被抽到的可能性均为,但是现在只有.果真如此吗?

事实上,先除去3件,则每个个体被抽到的可能性仍均为.这是因为每个个体被除去的可能性均为,被留下的可能性均为,而留下的1 000个个体中每个个体被抽到的可能性均为.但在整个抽样过程中,某个个体被抽到是指这个个体被留下且被抽到,因此每个个体被抽到的可能性均为×=,与用简单随机抽样所得到的可能性相同.故这样做仍然是等可能性抽样,仍然对每个个体都公平.

注意 这里留下的产品数必须是20的倍数,因此剔除的产品数最少是3件,最多是1 883件.另外,这里把两个“可能性”相乘,用到的是“条件概率”(选修2-3中)的知识.

二、 频数分布直方图与频率分布直方图

1. 频数与频率

(1) 频数:一组数据中个别数据重复出现的次数或一组数据中某个确定的范围内的数据的个数.

(2) 频率:频数与数据组中所含数据的总个数的比.

(3) 共同点:反映了一组数据的分布情况.

(4) 关系:①各个数据或各个范围内的数据的频数之和等于数据总个数(样本容量);②各个数据或各个范围内的数据的频率之和等于1;③频数=频率×数据总个数.

2. 频数分布直方图频率分布直方图

(1) 共同点:直观、形象地反映了样本的分布规律,使人一目了然,尤其能很快地看出各组频数、频率之间的相对大小.

(2) 不同点:在频数分布直方图中,各小长方形的高度等于各组的频数;在频率分布直方图中,各小长形的面积等于各组的频率.

例3 为了了解高一学生的体能情况,某校抽取部分学生进行了一分钟跳绳测试,将所得数据整理后,画出了频率分布图(如图1).图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.

(1) 样本容量是多少?

(2) 若次数在110以上(含110)为达标,试估计该学校全体高一学生一分钟跳绳的达标率是多少?

(3) 若要从次数在[120,130),[130,140),[140,

150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从次数在[140,150]内的学生中选取的人数应为多少?

(4) 在这次测试中,次数的中位数落在哪个小组内?请说明理由.

解析 这里容易把已知图形与频率分布直方图混淆.在频率分布直方图中,纵坐标为“频率/组距”,各小长方形的面积等于相应各组的频率,高度与相应各组的频率成正比.而已知图形中,纵坐标为“频率”,所以各小长方形的高度等于相应各组的频率,所以各小长方形的高度之和为1,并且各小长方形的面积与相应各组的频率成正比,所以从左到右各组的频率依次为0.04,0.08,0.34,0.3,0.18,0.06.又第二小组频数为12,因此易得答案:(1)150;(2)88%;(3)2;(4)第四组.

注意 不要把频率分布直方图中各小长方形的高误认为是相应各组的频率.此外,茎叶图类似于横置的频数分布直方图.

三、 平均数与标准差

平均数反映了样本的集中性,即以某一数值为中心而分布的性质,是样本中所有数据“最理想”的近似值;标准差反映了样本的离散性,即样本中数据与中心分散偏离的性质.

例4 不通过计算,分别比较图2中(1)、(2)两组数据的平均值和标准差的大小.

解析 从图中可以看出,(1)、(2)两组数据的平均值相等.这是因为图(2)中前10个数据与图(1)中的数据完全相同,且图(2)中后6个数据的平均值与前10个数据的相同.

图(1)中数据的标准差比图(2)中数据的标准差大.这是因为图(2)中前10个数据与图(1)中的数据完全相同,而图2中后6个数据的离散程度比前10个数据的小.因此整体上图(2)中数据的离散程度小于图(1)中数据的离散程度.

注意 有时若不知道一个分组中各数据的具体情况,则可用该组的中值表示该组数据的平均值.

1. 中央电视台对某电视剧的收视率作有奖调查,打算从江苏、广东和辽宁省共抽取1 000名幸运观众,一般采用的抽样方法是___________;邮政部门销售有奖明信片,规定每1 000万张为一个开奖组,通过随机抽取的方式确定号码后四位数为0588的获取当年邮票年册一本,这样确定获奖号码的抽样方法是________.

2. 为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到的频率分布直方图如图3,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设各组最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为_____,_____.

3. 一个教练员组织了一次总分为20分的测验,测分标准使得分数必须是5的倍数.他得到了如下分数分布:得20分的占了40%,得15分的占了30%,得10分的占了20%,另外10%的人得5分.这次测验得分的标准差是多少?

参考答案

统计学变异的概念

统计学变异的概念(精选7篇)统计学变异的概念 第1篇一、变异指标的意义及种类设有甲乙两人,对同一名患者采耳垂血,检查红细胞数(万/mm3)...
点击下载文档文档内容为doc格式

声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

确认删除?
回到顶部