标准数据类范文
标准数据类范文(精选9篇)
标准数据类 第1篇
关键词:欧盟,农药残留限量标准,农产品出口,引力模型
一、引言
欧盟是世界上较早制定农残标准的地区,并不断修改和调整相应的法律法规,2000 年欧盟发布了修订农药最大残留限量(Maximum Residue Limits,以下简称MRLs)的规定,许多MRLs越来越低,并且该规定还增补了一些新的农药。 2002 年,欧盟委员会又发布指令2002/66/EC———《动植物产品农药残留最高限量》,该指令修订了76/395/EEC,86/362/EEC,86/363/EEC和90/642/EEC指令附录中关于蔬菜、水果、谷物、动物源食品及部分植物源食品内及表皮中的农药最大残留限量。 2005 年,欧盟就关于动植物源食品和饲料产品内部和表面的农药残留限量标准发布条例(EC)396/2005。 该法规涉及315种食品和农产品中471 种农药, 共包括118000 个MRLs。 2008 年,欧盟正式实施新的农药残留标准体系(EC)149/2008,要求更加严格。 欧盟法规中对农残限量不断修改和补充的法规还有(EC)178/2006、(EU)600/2010、(EU)212/2013、(EU)752/2014 等。 此外,欧盟食品和饲料快速报警系统(RASFF)是欧盟在一般食品法(EC) 178/2002 的要求下建立和发展起来的,伴随着本法规的实施,RASFF也随之成为欧盟食品安全监管及通报的核心平台。 在被通报的出口农产品中,农药残留超标占有很大的比例。 2014 年,在欧盟RASFF通报的原因及分布情况中,农药残留被通报数435 次,占比13.78%,是欧盟通报区外产品的第二大原因。 对我国产品发布通报的原因中,农药残留78 项,占比19.12%。农药残留已经成为我国农产品被欧盟通报的第三大原因。
国外学者较早采用引力模型研究农药残留、兽药残留或其他有毒物质的最大残留限量标准对产品出口带来的贸易限制。 Sun等(2005)[1]利用引力模型,研究了日本农药毒死蜱最大残留限量标准对中国蔬菜出口的影响, 认为该农药限量标准的提高将会显著减少中国蔬菜的出口量;Gebrehiwet等(2007)[2]同样采用引力模型,研究了美国、OECD国家和欧盟国家的黄曲霉毒素残留限量标准对南非水果、 坚果类等食用产品出口的影响。研究结果表明,发达国家为保障食品安全制定的黄曲霉毒素残留限量标准,对南非产品出口贸易起到了限制作用,标准越严格,对出口贸易就冲击越大。
我国学者主要集中于讨论国外设置的环保标准对单一农产品出口的影响上,孙东升等[3]研究了欧盟MRLs与中国茶叶出口的关系。 认为MRLs标准的提高影响了我国茶叶出口成本和价格的上升,不利于我国茶叶的出口。 顾国达,牛晓婧,张钱江(2007)[4]将1988 年《茶叶卫生国家标准》、1995 年《 绿色食品 ———红茶和绿茶 》、2001 《 无公害食品———茶叶》三次法令的颁布作为虚拟变量的设置依据,验证了日本的农药残留标准对中国茶叶出口贸易的阻碍作用。 陈红蕾,李旋(2007)[5]选取欧盟对茶叶农药残留限量的标准数量作为研究的重点变量,结果表明欧盟农药残留标准对我国茶叶出口存在十分明显的负面影响。 刘朋飞、李海燕(2010)[6]将国外标准和中国蜂蜜国家标准以虚拟变量的形式引入扩展的引力模型中,针对美国、德国和日本设置的环保标准,实证分析了我国蜂蜜出口受到的阻碍作用。 王瑛,许可(2014)[7]研究了1992-2012 年27个国家(地区)的食品安全标准对中国农产品出口量的影响,并对蔬菜类、肉类、鱼及其他水产品分别进行估计,结果显示食品安全标准是限制我国农产品出口的重要因素之一。
尽管国内外学者已经做出了不少关于农药、兽药和其他有害物质等对农产品出口影响的理论与实证方面的研究,但仍然存在以下不足:首先,关于农药残留标准对我国农产品出口影响的研究仍然较少,尤其是针对欧盟近年来越来越严格的农残法规,并没有系统的追踪研究。 其次,国内学者关于农药残留标准对本国农产品出口影响的研究主要集中在单一农产品上,鲜有关于农药残留标准对我国整体农产品出口的规范研究,因此无法确定农残标准对我国农产品出口的整体影响。 最后,大部分国内外学者选择黄曲霉毒素、毒死蜱、氯霉素等有害物质的限量标准作为研究对象,鲜有涉及其他农药的综合研究。 随着近年来我国农产品出口的竞争优势不断下降, 农产品贸易逆差呈逐年增长的趋势,继续研究国外农药残留标准对我国农产品出口的影响仍具有非常重要的意义。
二、模型设定与数据来源
本文选取2005-2014 年我国32 类农产品出口欧盟成员国的面板数据进行实证分析,32 类农产品以初级农产品为主,包括蔬菜、水果、谷物、软体动物、蜂蜜、咖啡以及用作香料或药料的种子等,选择这32 类农产品的原因是它们是欧盟农药残留标准主要针对的对象,也是我国出口欧盟各成员国的主要农产品,样本国家为德国、法国、荷兰、意大利和比利时。 这5 个国家是我国出口农产品的主要贸易伙伴,也是对我国农产品通报情况最为严重的欧盟成员国。 例如,2012 年欧盟RASFF通报情况中这5个国家的通报比例占比为47.53%1。 所以,选取这5个国家分析欧盟农药残留标准对我国出口农产品的影响更具有代表性。
1、计量模型设定
本文沿用学术界对环境与贸易问题的主流研究方法, 利用扩展的引力模型来研究欧盟农药残留标准对我国农产品出口的影响。以前的研究表明,一国农产品出口量主要受出口国GDP、 进口国GDP、汇率、地理距离等方面的影响,本文将剔除不显著的变量同时加入本文研究的核心变量———农药残留标准MRL和农药数量SER,计量模型拟定为:
其中i表示出口国,j表示进口国,t表示时间,k表示农产品种类,εij为误差项。
2、变量设定及数据来源
以下对每个变量及数据来源进行逐个分析。
(1)被解释变量———农产品出口量(Xkij,t)。(Xkij,t)表示i出口国在t年向j国出口k类农产品的贸易额。 本文选取的进口国分别为德国、法国、意大利、荷兰、 比利时,32 类农产品的分类标准为HS2002,选取的规则统一为海关编码前4 位, 数据来源于UNCOMTRADE数据库2, 本文将对上述五个国家32 个组别的农产品分别进行回归分析。
(2)解释变量 ———农药残留标准(MRL)和农药数量(SER)。 欧盟委员会对32 组样本农产品制定的农药残留标准均不相同,标准越高,意味着农药最大残留限量MRL的值越低, 我国相应农产品的出口贸易额也就越小, 因此MRL与我国农产品出口拟呈正相关关系。 与之前相关研究不同的是,本文分别选取了农药氟草胺、啶虫脒、活化酯和己唑醇的最大残留限量作为核心解释变量,32 类样本农产品均受这四种农药的限制,并且欧盟多次修订关于这四种农药最大残留限量的条例和指令。 同时本文选择样本农产品每年受欧盟农残法规限定的农药数量SER,作为衡量农残标准严格程度的另一个解释变量,农药数量越多,表明农残标准越严格,我国相应的农产品出口贸易额就会越小,所以SER与我国农产品出口额拟呈负相关关系。 氟草胺、啶虫脒、活化酯和己唑醇的MRL数据来源于欧盟委员会网站3、农药最大残留数据库、FAO数据库,农药数量SER的数据主要来源于欧盟委员会网站。
(3)控制变量———进口国人均GDP(PY) 。 在本文的研究中,进口国的人均GDP被用来衡量进口方的购买能力,PY越大, 意味着进口国的购买能力越强,那么我国农产品出口到该国的贸易额就会越多,因此,PY与我国农产品出口额拟呈正相关关系,五个国家的人均GDP数据都来自世界银行网站4。
(4)控制变量———欧元兑人民币平均汇率(EX)。一般认为,欧元兑人民币汇率对出口呈正相关关系,汇率上升, 本币的贬值使得本国商品的外币价格下降,我国出口产品对于欧洲人民来说价格更便宜,对本国商品的需求必将增加, 因此我国的出口量也会增加。 但是这个阶段一般需要一个调整过程,经过一段时间后贸易收入才会增加。 所以本文中欧元兑人民币平均汇率EX与我国农产品出口额的相关关系具有不确定性,数据来源于世界银行网站。
三、模型回归结果分析
本文利用Eviews7.2 对样本数据进行回归分析,时间跨度10 年,每个时间截面上32 组农产品。以氟草胺为例,对面板数据模型做回归分析优于混合估计模型。 同时,在面板数据固定效应和随机效应回归方法的选择上,本文通过Hausman检验确定采用固定效应模型(见表1)。
资料来源:作者根据Eviews7.2检验报告整理。
表1 表明,采用固定效应模型的有荷兰和比利时,而德、法、意则没有。 本文选取的32 类农产品在有些年份的出口额缺失, 这些数据缺陷可能致使Hausman检验无效,而且选取的样本农产品均是我国对欧盟出口贸易额较大的农产品,并非随机抽样的结果,适用于固定效模型。 为了减少截面异方差,最终模型采用了广义最小二乘法(GLS)中的交叉权重系数法(Cross Section Wights)进行实证分析,回归结果见表2。
表2 的回归分析结果显示, 五个扩展的引力模型总体拟合程度都非常好。 说明扩展的引力模型能够很有力地解释我国农产品出口欧盟受环境规制影响的问题。 五个模型的D-W值都接近于1,这说明模型可能存在自相关, 也可能是因为时间区间太短所致。 由于本文的主要目的在于采用扩展的引力模型对我国农产品出口欧盟遭遇环境规制的壁垒效应进行定性分析, 所以本文选择对可能存在的自相关不进行相关修正。从各个解释变量的回归系数来看:
1、欧盟农残标准
两个代表欧盟农药残留标准的变量SER和MRL是本文研究的重点。 五个国家中除意大利之外的变量LNSER系数符号均与预期的符号相同,并且均通过不同水平的显著性检验。 意大利模型的变量LNSER系数为正,且并不显著,这可能跟意大利部分年份贸易数据的缺失有关。 五个国家的变量LNMRL系数符号均为负,与预期符号相同,并且变量在不同程度的显著性水平下通过检验。 表明本文所考察的欧盟农药残留标准(Regulation EC 396/2005and Amendments) 确实在一定程度上对我国农产品的出口产生了壁垒作用。 以出口德国的海关编码为0805 类农产品———鲜或干的柑橘属水果为例,如果欧盟农药残留限量标准中规定的农药数量每增加1%,我国鲜或干的柑橘属水果出口德国的贸易额会相应降低0.308%;如果欧盟农药氟草胺的最大残留限量标准每降低1%,我国鲜或干的柑橘属水果出口德国的贸易额会相应降低0.024%。 这一点与实际情况相符合, 欧盟的环境规制和市场准入制度与国际标准相比最为严格,对进口食品的要求也最高,短期内确实阻碍了我国农产品的对欧出口。
2、欧盟成员国人均GDP
五个国家的系数均为正,且在99%的置信区间内显著。 说明进口国的人均国内生产总值和出口国的出口贸易有着很强的正相关关系,欧盟成员国人均GDP增长,对我国农产品的需求和购买能力会进一步增加。
3、欧元兑人民币平均汇率
五个国家的LNEX系数为负并且显著,这可能跟汇率的滞后效应———J曲线效应有关。 所以短期内欧元兑人民币平均汇率EX与我国农产品出口额成负相关关系。
为了更有力的说明欧盟农药残留限量标准确实对我国农产品出口产生了负面效应,本文还选取农药啶虫脒、活化酯和己唑醇三种农药的最大残留限量作为核心解释变量分别建立模型。同样对模型进行冗余固定效应似然比检验确定采用面板数据估计,使用Hausman检验确定选择固定效应模型,最后运用广义最小二乘法(GLS)中的交叉权重系数法(Cross-Section Weights)来估计模型,回归结果如表3、表4和表5所示。
注:括号内为各变量系数对应的t统计值;***、**、*分别表示在1%、5%、10%的水平下显著。
注:括号内为各变量系数对应的t统计值;***、**、*分别表示在1%、5%、10%的水平下显著。
表3是啶虫脒对我国农产品出口影响的实证分析结果,五个国家中变量LNSER系数符号均与预期的符号相同,并且均通过不同水平的显著性检验,变量LNMRL系数符号均为正,与预期符号相同,并且变量在不同程度的显著性水平下通过检验。表明本文所考察的啶虫脒最大残留限量标准确实在一定程度上对我国农产品的出口产生了阻碍作用。与氟草胺相比,五个国家的LNMRL系数均较小。说明啶虫脒对我国农产品出口的影响没有氟草胺的影响大,也没有氟草胺显著,可见不同的农药残留标准对出口农产品的影响程度不同。
表4是活化酯对我国农产品出口影响的实证分析结果,五个国家变量LNMRL系数符号均为正,与预期符号相同,除了法国模型之外变量在不同程度的显著性水平下通过检验。所以活化酯最大残留限量标准对我国农产品的出口也产生了负面效应。如果欧盟农药残留限量标准中活化酯的限量标准每降低1%,我国鲜或干的柑橘属水果出口德国的贸易额会相应降低0.047%,出口荷兰的贸易额会降低0.127%,出口比利时的贸易额会相应降低0.348%,可见,该农药对我国农产品出口荷兰和比利时的影响比较大。
表5 是农药己唑醇对我国农产品出口影响的实证分析结果, 五个国家中变量LNMRL系数符号均为正,与预期符号相同,在意大利的模型中,变量LNMRL在5%显著性水平下通过检验,其他四个国家在1%的显著性水平下通过检验,说明己唑醇最大残留限量标准对我国农产品的出口产生的抑制作用比较显著,并且弹性系数也比其他三种农药的解释变量系数大。所以该农药对我国农产品出口欧盟的影响是非常大的,尤其是对比利时的出口。
注:括号内为各变量系数对应的t统计值;***、**、*分别表示在1%、5%、10%的水平下显著。
注:括号内为各变量系数对应的 t 统计值;***、**、* 分别表示在 1%、5%、10%的水平下显著。
四、政策建议
模型回归结果证实了欧盟农药残留标准(MRLs)对我国农产品出口的阻碍作用,为我国农产品出口应对欧盟农药残留标准以及建立相关预警机制,提供了科学依据。为此,本文提出以下几点建议:
1、加大农药残留检测技术的投资力度
我国农产品种类和质量参差不齐,而对各类产品的农药残留控制也不成熟。政府和企业应进一步加大科技投资力度,不断提高我国农药残留的检测技术和控制技术,符合国外农药残留标准,促进我国农产品的出口。
2、完善国内农药残留标准
目前我国农药残留标准数量比欧美发达国家少,但欧美许多有害物质的残留标准并不仅仅是为食品安全而制定的,存在阻碍贸易自由化、保护本国企业免受竞争的嫌疑。我国农产品质量安全标准规定笼统、覆盖范围窄,可以借鉴发达国家的环境标准、包装管理方面的立法经验,出台适合我国使用的标准及管理体系。
3、树立绿色形象,开发新市场
目前,我国农产品出口市场主要集中在美、日、欧三个国家和地区。 关于我国食品安全的问题时常发生,各进口国已经并且将继续提高安全标准作为限制我国农产品出口的一个重要手段。 因此我国必须拓宽思路,开发具有潜力的新兴市场和具有竞争优势的农产品,严格把关绿色食品的安全问题,树立新的出口形象,从而缩小我国的农产品贸易逆差。
参考文献
[1]Sun D,J Zhou,and X Yang.Study on the Effect of Japan’s Technical Barriers on China’s Agricultural Exports[J].Journal of Agricultural Technical Economics 5,2005,6-12.
[2]Gebrehiwet Y,Ngqangweni S,Kirsten J F.Quantifying the trade effect of sanitary and phytosanitary regulations of OECD countries on South African food exports[J].Agrekon,2007,46(1):1-17.
[3]孙东升,孙雯静,周锦秀.欧盟农药最大残留限量(MRLs)对中国茶叶出口的影响[J].农业技术经济,2007,(01):63-71.
[4]顾国达,牛晓婧,张钱江.技术壁垒对国际贸易影响的实证分析——以中日茶叶贸易为例[J].国际贸易问题,2007,(06):74-80.
[5]陈红蕾,李旋.欧盟绿色贸易壁垒对我国茶叶出口影响的实证分析[J].科技管理研究,2007,(07):36-38.
[6]刘朋飞,李海燕.技术壁垒对我国蜂蜜出口影响的实证分析[J].国际贸易问题,2010,(11):99-104.
大数据类读书笔记 第2篇
一是鼓励、扶持基 于数据的创新创业。书中提到,政策扶持的传统方法,可能是以政府主导建立大数据产业园,对新兴企业提供办公场所等便利条件或者现金支持,这固然有效,但更 为有效的是调动全社会的力量。调动全社会的力量来支持可以包括扶植民间团体,快速推进新技术、新理念在全社会的传播。现在云技术大众基本上都耳熟能详了, 而这主要是各大互联网服务上都相继推出了相应的云服务以及各大媒体对这项技术的关注,促进了大众对新技术的了解与支持。
二是政府机构要建 立专门机构来统筹管理数据工作。在大数据时代不同的数据需要整合,公安、消防、民政、社保等等数据都需要进行联动,将沉睡在数据库内的数据唤醒,为政府制 定政策所用,避免各自为政、多头管理的情况发生。数据的联通也能在一定程度上减少群众的“办证”问题,相信在大数据时代,大家可能只需要一张身份卡就能满 足绝大部分的数据需要。
聚类分析中聚类标准的研究与应用 第3篇
聚类分析是按照一定的要求和规律将事物进行分类的一种数学方法, 它原来是数量统计中多元分析的一个分支。随着近年来数据挖掘技术的发展, 聚类分析越来越多地用于大量的未知类别数据的分类。聚类分析内容非常丰富, 算法很多, 而聚类的标准则往往只采用距离和相似度两种度量方式。
2 距离和相似度
为了将样品进行聚类, 须研究样品之间的关系, 制定一个聚类的标准, 按照样本之间的接近程度将样本归为不同的类, 达到聚类的目的。在确定各个样本之间的关系时, 通常采用两种度量来表示样本之间的接近程度:距离d和相似度r。
由于实际问题中, 遇到的指标有的是定量的 (如长度、重量等) , 有的是定性的 (如性别、职业等) , 因此将变量的类型按以下三种尺度划分:间隔尺度、有序尺度、名义尺度。不同类型的变量, 在定义距离和相似系数时, 其方法有很大差异。研究比较多的是间隔尺度, 因此现主要探讨间隔尺度的距离和相似系数的定义。
2.1 样品分类
2.1.1 距离
如果把n个样品看成p维空间中n个点, 则两个样品间相似程度可用p维空间中两点的距离来度量。常用的距离有:
a.明氏距离
当各变量的测量值相差悬殊时, 要用明氏距离并不合理, 常需要先对数据标准化, 然后用标准化后的数据计算距离。
b.马氏距离
马氏距离是由印度统计学家马哈拉诺比斯于1936年引入的, 故称为马氏距离。这一距离在多元统计分析中起着十分重要的作用。马氏距离既排除了各指标之间相关性的干扰, 而且还不受各指标量纲的影响。除此之外, 它还有一些优点, 如可以证明, 将原数据作一线性交换后, 马氏距离仍不变等。
c.兰氏距离
它是由Lance和Williams最早提出的, 故称兰氏距离。此距离仅适用于一切xij〉0的情况, 这个距离有助于克服各指标之间量纲的影响, 但没有考虑指标之间的相关性。
以上三种距离的定义是适用于间隔尺度变量的, 如果变量是有序尺度或名义尺度时, 也有一些定义距离的方法。
2.1.2 相似系数
研究样品之间的关系, 除了用距离表示外, 还有相似系数, 相似系数是描写样品之间相似程度的一个度量, 常用的相似系数有:夹角余弦和相关系数。
a.夹角余弦
这是受相似形的启发而来的。两个向量相似程度可以用它们的夹角余弦的大小表示。将任何两个样品xi与xj看成p维空间的两个向量, 这两个向量的夹角余弦用表示。
b.相关系数
通常所说相关系数, 一般指变量间的相关系数。
2.2 类之间的距离
正如样品之间的距离可以有不同的定义方法一样, 类与类之间的距离也有各种定义。例如可以定义类与类之间的距离为两类之间最近样品的距离, 或者定义为两类之间最远样品的距离, 也可以定义为两类重心之间的距离等等。类与类之间用不同的方法定义距离, 就产生了不同的聚类方法。常用到的有最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方法等等。现仅选取最短距离法介绍。
最短距离法聚类的步骤如下:
2.2.1 定义样品之间距离, 计算样品两两距离, 得一距离矩阵记D (0) 。
2.2.2找出D (0) 的非对角线最小元素, 设为Dpq, 则将GP和Dq合并成一个新类, 记为GP。
2.2.3将D (0) 中第p、q行及p、q列用上面公式并成一个新行新列, 新行新列对应, 所得到的矩阵记为Dp。
2.2.4对D (1) 重复上述对D (0) 的 (2.2.2) 、 (2.2.3) 两步得D (2) ;如此下去, 直到所有的元素并成一类为止。
如果某一步中非对角线最小的元素不止一个, 则对应这些最小元素的类可以同时合并。
2.3 聚类算法
按照以距离或相似度为样本间的相似程度, 聚类分析有很多种算法。主要的聚类方法有四种:划分方法聚类、层次方法聚类、基于密度的聚类算法、基于模型的聚类算法。
现选取按距离为样本间的相似程度的聚类算法和按相似度为样本间的相似程度的聚类算法为例研究绩效考核的聚类分析。现选取5个员工来进行聚类分析, 每个样本只测一个指标, 它们是1、2、3.5、7、9, 试用最短距离法对5个样品进行分类。
2.3.1定义样本之间距离采用绝对距离, 计算样本两两距离, 得距离矩阵为D (0) 如下:
{{0}, {1, 0}, {2.5, 1.5, 0}, {6, 5, 3.5, 0}, {8, 7, 5.5, 2, 0}}
2.3.2找出D (0) 的非对角线最小元素1, 即D12=d12=1, 则将G1与G2合并成一个新类, 记为G6={X1, X2}
2.3.3计算新类G6与其它类的距离
{{0}, {1.5, 0}, {5, 3.5, 0}, {7, 5.5, 2, 0}}
2.3.4找出D (1) 的非对角线最小元素1.5, 则将相应的两类合并。
{{0}, {3.5, 0}, {5.5, 2, 0}}
2.3.5找出D (2) 的非对角线最小元素2, 则将G4与G5合并成一个新类, 记为G8={X4, X5}, 最后再计算G7和G8的距离, 并将相应的两行两列合并成一行一列, 新的行列由原来的两行中较小的一个组成, 得表D (3) 如下。
模糊聚类分析是用模糊数学方法定量地确定研究对象的亲疏关系和相似性, 由于客观事物之间并没有一个截然区别的界限, 因而分类时所依据的数据指标的变化大都具有联系性, 因此导致显示的分类往往伴随着模糊性, 用模糊数学方法进行聚类分析就显得更自然、更符合客观实际。模糊聚类中样本间的相似程度以相似系数来度量的。
一般情况下, 用不同的方法聚类的结果是不完全一致的。哪一种方法更好?这需要提出一个标准作为衡量的依据, 但至今还没有一个合适的标准。各种方法的比较目前仍是值得研究的一个课题, 在实际应用中, 一般采用以下两种处理方法:一种办法是根据分类问题本身的专业知识结合实际需要来选择分类方法, 并确定分类个数。另一种办法是多用几种分类方法去作, 把结果中的共性取出来, 如果用几种方法的某些结果都一样, 则说明这样的聚类确实反映了事物的本质, 而将有争议的样品暂放一边或用其它办法如判别分析去归类。
结束语
聚类分析作为一种对未知类别数据分类的数学方法, 在数据挖掘领域和其他现实应用中被越来越广泛地利用, 它既可以作为其他算法的预处理过程, 这些算法对聚类处理后的数据进行分析, 又能够作为一个独立的工具获取数据分布的情况。聚类分析有很多种算法, 主要的有层次方法、划分方法、基于密度的方法和基于模型的方法。聚类分析虽然有众多不同的算法, 但这些算法在聚类标准上是一致的。
参考文献
[1]吴韵琴.全国10个省市人口素质的聚类分析和模糊综合评判[J].河北理工学院学报, 20044, (3) :16-18.
标准中文简历-研发类 第4篇
地址:浙江省杭州市西湖区余杭塘路388号
浙江大学室(310058)
电话:(86)1348-618-电子邮件:
教 育 经 历
2009.9-至今浙江大学药学院药物化学医学硕士浙江大学与巴黎高师联合实验室组员
研究方向:P53-MDM2和Akt酶双靶点抑制剂抗肿瘤药物的设计、合成和药理研究2005.9-2009.7浙江大学材料与化学工程学院化工系工学学士
主修课程:化工原理、化学反应工程、高等有机化学、仪器分析、生物化学、战略管理学等科 研 经 历
2009.9-至今P53-MDM2和Akt酶双靶点抑制剂抗肿瘤药物的设计、合成和药理研究项目负责人 负责新型抗肿瘤药物的结构设计、合成及构效关系研究,独立完成相关药代动力学实验 得到全新结构化合物近百个,部分化合物有较高的活性(Akt酶 IC50=43nM) 据此课题,“2010年长三角药物化学研讨会”专题报告一次,发表SCI论文一篇2011.5-2011.7S-甲基腺苷高巯乙胺的制备方法及其结构确证 项目负责人设计实验方案,熟练运用萃取,重结晶,柱层析等技术,成功建立高效分离纯化方法快速完成碳谱、氢谱、红外等谱图的解析,精确确证其分子结构,并整理出此类项目的研究思路 2009.10-2010.1左旋氧氟沙星中特征杂质的分离纯化及结构确证 项目负责人 建立快速有效的分析方法,并运用中压制备液相、半制备液相、HPLC等仪器探索纯化方法 突破技术难点,使杂质含量从0.8%提高到 95%(HPLC)
2008.9-2009.6本科毕设:左旋薄荷酮和左旋香芹酮在超临界二氧化碳中扩散系数的实验研究 项目负责人 负责超临界色谱仪及配件的安装、调试及超临界二氧化碳中扩散系数的测定 实验成果被评为“2009届浙江大学百篇特优本科毕业设计”(前3%)
社 会 实 践
2010.10-2010.12药学院第一届交谊舞培训班 组织者
负责整个活动的组织及策划,包括舞蹈老师招聘,活动前期宣传及专项经费管理等 近40人参加了一期活动,获得同学们的广泛好评,为加强学院内部交流创造良好契机 2009.11“2009年长三角药物化学研讨会”会务组成员 协助制定会议日程,安排与会人员行程
作为展厅的主负责人,带领团队高效开展场地联系、展厅布置,圆满完成与会人员接洽工作 2008.7浙江金华康恩贝生物制药有限公司 生产实习生
参加包括各生产车间、质检部、资料处等多个轮值岗位的实习工作
认真完成实习任务,积极学习大型制药企业各个部门的职能和管理方法,获得实习单位好评 所 获 奖 励 及 科 研 成 果
学术类:已发表SCI论文一篇,待发表两篇;
参与省级科研项目三个,已完成企业合作项目两个;
“2009届浙江大学百篇特优本科毕业设计”
实践类:跆拳道优秀学员(前10%)、浙大药学院乒乓师生联赛亚军、“谁与争锋”篮球赛亚军 英 语 及 其 它
数据流聚类算法研究 第5篇
随着无线传感网络以及有关领域的相应发展,流数据日益成为主要的数据形式之一。例如无线传感器中的监测数据,网络入侵监测数据,以及金融产业中不断变化的股票数据等,即属于此类。这些数据都具有与传统静态数据不同的特性,诸如实时、有序、快速变化等。而对于目前较为有限的存储空间,数据流却又无法长期保存在计算机中,因此如何在线实时有效地处理这些数据,从中挖掘提取有用的知识, 即成为数据挖掘领域的热点问题之一。
数据挖掘,亦称作知识发现,是指从大量的数据中挖掘得到人们感兴趣的知识的具体发现过程。现如今,人们可以通过多种渠道获取信息数据,随着数据量的大幅增长,如何从这些数据中找到有价值的信息,就成为数据挖掘的首要任务。数据挖掘的分析方法主要有以下几种:
( 1) 关联分析。两个或多个数据变量之间存在着某种相关性,这就是关联。通常情况下,数据库中庞大数据的关联性很难发现,而且关联分析又具有一定的不确定性,因此产生的规则必须带有可信度。
( 2) 分类分析。分类是数据挖掘领域的一个重要技术手段。一般分为训练学习过程和测试过程。例如,决策树、神经网络、k近邻算法、贝叶斯算法等都是常见的分类技术。
( 3) 聚类分析。作为数据挖掘、模式识别等工程和技术领域的研究热点之一,聚类分析表现了高度优良的性能和效果。聚类就是将一个整体的数据集划分成若干个簇,使得不同簇之间的相似性尽可能地小,而同一个簇中的相似性又尽可能地大。
综上所述,可知聚类技术是数据挖掘领域的重要技术方法之一,而数据流高速动态变化和一次扫描等特性却给数据流聚类带来了巨大的挑战。如何能够仅利用一次扫描就达到最好的聚类效果,以及如何生成任意形状的聚类,则是近些年来研究者们深度探讨的重点课题之一。
1传统的数据聚类算法
传统静态的数据聚类算法对于后期数据流聚类算法的进一步研究具有相当重要的现实意义,很多数据流聚类算法都是一些常见的经典聚类算法的变形。聚类算法一般可以分为三类,分别是基于划分的方法、基于层次的方法、基于密度的方法。在此,对这三类方法进行分别的探讨和解析,具体如下。
1. 1传统的聚类方法
( 1) 基于划分的方法
最为典型的、基于划分的聚类方法就是k - means算法( k均值算法) 。实现过程为,给定欲聚类的数目k,并随机选择{ x1,x2,x3,,xk} k个数据点作为聚类中心,再计算各个数据点到xi的距离,将数据点合并到距离最近的聚类中,重新计算聚类中心,也就是质心,直到目标函数收敛为止。通常,采用平方和误差最小函数( sum of the squared error) 作为目标函数。
这里,p代表每个数据点,m是每个簇X的平均值。
k - means算法是通过距离来计算数据之间的相似性,所以对噪声数据比较敏感,一个孤立点就极有可能对最终的聚类结果产生很大影响,基于此,即提出了k - mediods,即k中心点算法。
( 2) 基于层次的聚类方法
基于层次的方法通常分为自顶向下和自底向上两种情况。在这些方法中,比较常用的就是Birch算法[1]。Birch算法中引入了CF聚类特征和CF tree聚类特征树这两个概念。 具体过程为: 首先全面扫描数据库,建立一个初始的聚类特征树; 从根节点向下,计算与要插入的数据点间的距离,找寻最短距离,直至找到与该数据点最近的叶节点; 如果吸收后大于阈值T,删除或分裂叶节点。
Birch算法适用于大数据集的聚类处理,具有较低的算法空间复杂度和时间复杂度,聚类效果良好。但是,birch算法多是利用半径来计算聚类的范围,因此对于非球状的聚类,就不会达到理想的效果。
( 3) 基于密度的聚类方法
基于密度的聚类方法是将具有相似的密度点的数据聚合在一起,可以根据不同的密度变化将聚类拓展到任意的地方,这就弥补了基于距离聚类只能产生球状实现效果的缺陷。但是这类算法的复杂度一般却比较高。
1. 2基于群智能的聚类方法
群智能就是昆虫或者飞鸟等群体表现出来的群体智能, 例如蚂蚁觅食,筑巢等过程中所表现出来的智能。近年来, 众多学者将群智能应用于数据聚类中,取得了良好的聚类效果。群智能优化算法主要有蚁群优化算法( ACO) 、粒子群优化算法( PSO) 、人工鱼群优化算法等。
2003年,Merwe等人[2]最先提出了PSO与K - means算法结合的混合聚类算法。该算法利用K - means方法得到某组聚类的中心,并在粒子群初始化时将聚类中心赋值给某个粒子,其余粒子则随机初始化,之后运用基本PSO聚类算法完成聚类。
Azzag等人提出了一种基于蚂蚁觅食原理的聚类算法[3]。算法中,数据点可看作是具有不同属性的蚂蚁,而聚类中心就是蚂蚁所要寻找的“食物”,由此数据聚类过程即成为蚂蚁寻找食物源的过程。此外,文献[4]继续提出通过蚂蚁自聚行为、达到聚类的蚁群聚类算法。该算法中,蚂蚁能够通过自我聚集行为构建一个树状结构,即蚂蚁树( Ant- Tree) 。蚂蚁不仅代表数据,而且也代表该蚂蚁树的节点,初始状态时将蚂蚁置于一个固定点上,该点相当于树根。接着蚂蚁在树上已经固定的蚂蚁身上移动,寻找适合自己的位置。
将群智能应用于聚类挖掘中,能够获得明显优于传统聚类算法的实验结果,也不会象传统聚类算法( 如K - means算法) 一样那么容易产生局部最优解,只是算法的收敛时间较长。
2数据流聚类算法
由于数据流是随时间不断变化的,每单位时间段都有大量的数据到达,这就使得数据流中的数据将无法长期存储, 此时若采用传统的数据挖掘聚类算法就无法得到很好的聚类效果。基于此,可知数据流聚类挖掘与传统的静态数据聚类即有很大的不同,具体分析如下:
首先,簇个数无法假定。由于数据流的不断变化,自然簇的个数也会相应地随之变化,因此无法预知簇的实际个数。
其次,聚类成任意形状的簇。在很多数据集,如网络入侵检测数据集中,聚类的分布情况通常是不均匀、且无规则的,因此能够发掘任意形状的聚类对于数据流聚类的应用则是至关重要的。
最后,处理噪声数据的能力。在众多数据流应用场景中,总会受到一些意外因素,如传感器网络中电池供电不足的影响等,这些均是数据流中产生的一些随机的噪声数据, 如何能够分辨并处理这些噪声数据也是数据流聚类中的一大难题。
2. 1数据流模型
流数据可以看作随时间不断变化的数据集合[5]。流数据集合为{ X1,X2,X3,,XN} ,其中Xi包含两个数据项,一个是数据ai,另一个则是数据读入的时间点( 时间戳) ti,即Xi = < ai,ti > 。而流数据将随着时间不断地发生变化,这就不可避免会有噪声数据出现于其中,可将其称为异常数据和孤立点数据。这些数据与研究中正常的数据行为模式并不一样,因而如何识别孤立点噪声数据也是数据流挖掘领域亟需解决的重点问题之一。
2. 2窗口模型
在数据流聚类分析方法中,通常都基于时间窗口来进行。窗口模型一般可分为三种: 界标窗口模型,滑动窗口模型和衰减窗口模型。其中,界标窗口模型则包括直方图方法、抽样方法、小波方法、哈希方法等。下面对这三种模型作以分别探讨。
在界标窗口模型中,其中之一的直方图技术就是将一个大的数据集分割成若干个小数据集。该技术能够直观地反映大数据集的轮廓梗概,因此在商业数据库中得到了广泛应用。另外,对于抽样方法来说,顾名思义,就是从大的整体数据集中抽取样本来代表整个数据集,并在样本查询中获得结果。而小波分析方法则与傅里叶变换相似,小波分析是将数据输入的模拟量,变换成一系列的小波参数,而大部分能量仅仅包含于少数几个小波参数中,因此选择利用少量的小波参数就能够还原出原始的信号。
分类之二的滑动窗口模型提出了一个时间窗口的概念。 设有数据流DS = ( a1,a2,a3,,an) ,其中的ax是数据项< Xi,Xt> ,Xi是数据流中的数据样本点,Xt则是进入滑动窗口的时间点。W为窗口大小,tn是任意的时间点。只有时间窗口{ tn - w + 1,,tn} 内的数据才得以处理,而窗口外的数据则予以忽略。可用图1表示滑动窗口模型,具体如图1所示。
实际情况是,在数据流挖掘领域,决策者所关注的多是近期的数据分析情况,而应用滑动窗口模型对于处理最近期的数据信息则最为适用。
分类之三的衰减窗口模型是利用衰减函数f( t) =2- λt进行衰减的。其中,t是变化的时间,参数 λ > 0。该模型是以衰减方式来消除历史数据行为对当前聚类结果的影响,λ 取值越大,衰减程度越大,历史数据对当前的影响就越小。
2. 3在线- 离线聚类方法
Aggarwal等人在2003年提出CLUSTREAM数据流聚类算法[6]。该算法不仅引入了微簇和时间帧结构两个主要概念,并且将数据流聚类过程分为两个阶段: 在线部分( 微聚类) 和离线部分( 宏聚类) 。其中,在线部分对到达的数据进行处理和统计,并周期性地存储统计结果,而离线部分就将这些统计结果与用户的输入请求相结合,由此而得到最终的聚类结果。同时,算法对数据流信息采用不同的时间粒度进行存储和处理,即金字塔时间窗口( pyramidal time window) 的概念。算法的基本步骤可以简单描述如下:
STEP 1: 对于初始到达的N个数据点采用K - means算法进行聚类,生存q个微簇;
STEP 2: 对于新到达的数据点Xi,判断其是否能够被前q个微簇吸收; 如果可以,则将其加入到距离最近的微簇中,否则就建立属于其自身的一个新微簇;
STEP 3: 根据用户提供的两个参数: 时间幅度h和预定义需要形成簇的个数k,生成相应时间段的微簇集合;
STEP 4: 用K - means方法聚类,生成聚类结果。
在这里,前两步属于在线聚类,后两步则属于离线聚类过程。
Clustream算法完全能够适应数据流快速到达,有序无限以及单遍扫描的特点,并且还能够挖掘出数据流的潜在演化特征。但是由于算法所采用的相似度标准是距离,这也就造成了该算法只能够产生球形的聚类结果。而且当数据流中存在噪声数据时,算法将会表现出不稳定性,而因为噪声数据无法被现有的微簇所接受,噪声数据就会创建新的微簇, 进一步地,随着噪声数据的增加,微簇数量也随之增多。与此同时,算法又将限制微簇数量,由此一些微簇就必须要进行相应的合并或者删除,这就不可避免地降低了算法聚类结果的准确度。
而后,针对Clustream算法的这些不足,学者们又相继提出了多种解决办法。2004年,Aggarwal等人提出了HPStream ( High - dimensional Projected Stream Clustering method) 算法框架[7]。HPStream做出的主要改进有两方面: 一是算法中使用投影聚类的方法来处理高维数据流的聚类问题; 二是使用一个衰减簇的概念来代替Clustream中提出的微簇,以保存历史数据,从而利用衰减因子来实现不断衰减历史数据对整体聚类影响的不断衰减。
在已有研究的基础上,曹峰等人又提出了一种基于密度的进化数据流聚类算法DenStream算法[8],同样这也是一种在线- 离线两阶段处理方法。该算法主要提出三个概念: 核心微簇,潜在核心微簇和离群微簇。算法实现可描述为: 当接收到一个新的数据点时,算法首先判断这一数据是否可以被潜在核心微簇( p微簇) 接收,如果不可以,再尝试将其合并到距离最近的离群微簇( o微簇) 当中。如果合并后的离群微簇半径大于阈值,则将此离群微簇转化为潜在核心微簇。离线部分主要采用DBSCAN算法的变形来实现聚类。 算法微簇维护的流程图如图2所示。
D - Stream算法是一个典型的基于网格和密度的数据流聚类算法,同样地,该算法也将聚类过程分为在线和离线两部分[9]。在线时,连续读入多维的数据元素,将数据元素映射到一个对应的离散密度网格之中,而后在离线部分需计算这些网格的密度,再将这些基于密度的网格进行聚类。
黄德才等在文献[10]中提出一种MCStream算法,这是一种基于密度的混合属性数据流聚类算法。算法在微聚类中使用面向维度的距离来度量对象之间的相似度,在宏聚类中则使用M - DBSCAN( 一种改进的密度聚类算法) 对微簇进行聚类。该算法能够快速有效地处理混合属性数据流聚类问题。
3未来发展趋势
FlockStream算法是将Denstream算法与一种多代理群智能Flocking模型相结合而加以设计并最终实现的。该算法采用分散的、自下而上的自我组织战略对相似的数据点进行聚类分组,数据点与仿生模型中的boid相关联并应用启发式策略进行聚类,在聚类效果上占有很大的优势[11]。该算法将仿生模型与数据流聚类算法相结合。获得了比较好的聚类效果。
2011年API管材类标准信息 第6篇
套管、油管、管线管和钻柱构件用螺纹脂推荐作法
Recommended Practice on Thread Compounds for Casing, Tubing, Line Pipe and Drill Stem Elements
石油天然气工业套管、油管、管线管和钻柱构件用螺纹脂的评价与试验
Petroleum and natural gas industries-Evaluation and testing of thread compounds for use with casing, tubing, line pipe and drill stem elements
(包括2011年4月勘误)
提供了套管、油管和管线管连接用螺纹脂及旋转台肩式连接用螺纹脂的试验要求、推荐作法和方法。该推荐作法中所列试验是用来评价在实验室条件下螺纹脂的临界使用性能和物理化学特性。本版API RP 5A3等同采用ISO 13678。
第3版, 2009年11月发布
API RP 5A5/ISO 15463:2003
新套管、油管和平端钻杆现场检验推荐作法
Field Inspection of New Casing, Tubing, and Plain-end Drill Pipe
石油天然气工业新套管、油管和平端钻杆现场检验
Petroleum and natural gas industries-Field inspection of new casing, tubing, and plain-end drill pipe
给出了油井管现场检验和试验用具体要求和推荐方法, 包括现场检验经常用到的作法和技术, 某些作法亦适用于工厂检验。本标准涉及检验人员资质、检验方法及设备校准的描述、各种检验方法的标准化程序, 还涉及缺欠的评估和检验过的油井管的标记。本标准适用于油井管的现场检验, 不作为验收或拒收的依据。
第7版, 2005年6月发布
API Spec 5B
套管、油管和管线管螺纹的加工、测量和检验规范
Threading, Gauging, and Thread Inspection of Casing, Tubing, and Line Pipe Threads
本规范包括API螺纹校对量规的尺寸和标记要求, 其它产品螺纹和螺纹量规, 以及用于检验管线管、圆螺纹套管、偏梯形螺纹套管和直连型套管连接用螺纹的仪器和方法。螺纹锥度、螺距、牙型高度、牙型角及牙侧角的测量方法适用于每英寸 (25.4mm) 牙数不多于111/2牙的螺纹。所列不带公差的螺纹尺寸仅作为连接设计的依据, 不作为测量验收或拒收的判据。
第15版, 2008年4月发布, 2008年10月1日生效
API Spec 5B*
套管、油管和管线管螺纹的加工、测量和检验规范中译本
第15版, 2008年4月发布, 2008年10月1日生效
API RP 5B1
套管、油管和管线管螺纹的加工、测量和检验推荐作法
Threading, Gauging, and Thread Inspection of Casing, Tubing and Line Pipe Threads
(包括2004年9月补充件)
包括按照规范5CT、5D和5L生产的套管、油管和管线管用螺纹的加工、测量和检验方法, 以及套管、油管和管线管用量规规格及鉴定。
第5版, 1999年8月发布
API RP 5C1
套管和油管的维护与使用推荐作法
Care and Use of Casing and Tubing
包括套管和油管的使用、运输、贮藏、搬运和修理。
第18版, 1999年5月发布, 2006年8月再次确认
API TR 5C3/ISO 10400:2007
套管、油管及用作套管或油管的管线管公式和计算及套管和油管使用性能表技术报告
Technical Report on Equations and Calculations for Casing Tubing, and Line Pipe used as Casing or Tubing;and Performance Properties Tables for Casing and Tubing
石油天然气工业套管、油管、钻杆和管线管性能公式和计算
Petroleum and natural gas industries-Formulae and calculations for casing, tubing, drill pipe and line pipe properties
该技术报告阐明了计算本标准给出的各类管子性能所需的公式和模板, 包括
誗管子使用性能, 如轴向强度、抗内压和挤毁性能;
誗最低物理性能;
誗产品组装力 (力矩) ;
誗产品试验压力;
誗与试验标准相关的临界产品尺寸;
誗试验设备临界尺寸;
誗试样临界尺寸。
本版API TR 5C3等同采用ISO 10400。本版API TR 5C3代替API Bul 5C2 and 5C3。
第1版, 2008年12月发布
API RP 5C5/ISO 13679:2002
套管和油管连接试验程序推荐作法
Recommended Practice on Procedures for Testing Casing and Tubing Connections
石油天然气工业套管和油管连接试验程序
Petroleum and natural gas industries-Procedures for testing casing and tubing connections
建立了石油天然气工业用套管和油管连接的最低设计验证试验方法和合格判据。这些物理试验是某一设计验证过程的一部分, 并为连接符合制造商声明的试验载荷和极限载荷提供了客观依据。
第3版, 2003年7月发布
API RP 5C6
管子焊接接头推荐作法
Welding Connections to Pipe
为管子接头在工厂或现场焊接提供了标准的行业作法。技术内容中包括对焊接工艺评定、焊工资格鉴定、材料、试验、成品焊接和检验的要求。另外, 包含了订货建议。
第2版, 2006年3月发布
API RP 5C7
油气井用挠性油管操作推荐作法
Coiled Tubing Operations in Oil and Gas Well Services
提供了挠性油管的设计及操作推荐作法。
第1版, 1996年12月发布, 2007年12月1日再次确认
API Spec 5CRA/ISO 13680:2010*
套管、油管和接箍毛坯用耐蚀合金无缝管规范
Specification for Corrosion Resistant Alloy Seamless Tubes for Use as Casing, Tubing and Coupling Stock
石油天然气工业套管、油管和接箍毛坯用耐蚀合金无缝管交货技术条件
Petroleum and natural gas industries-Corrosion-resistant alloy seamless tubes for use as casing, tubing and coupling stockTechnical delivery conditions
本标准规定了两级产品规范等级套管、油管和接箍毛坯用耐蚀合金无缝管的交货技术条件。本版API Spec 5CRA修改采用ISO 13680。本规范包含API会标附录。
第1版, 2010年2月发布, 2010年8月1日生效
API Spec 5CT/ISO 11960:2004
套管和油管规范
Specification for Casing and Tubing
石油天然气工业油气井套管或油管用钢管
Petroleum and natural gas industries-Steel pipes for use as casing or tubing for wells
(包括2006年4月勘误)
规定了钢管 (套管、油管、平端套管衬管和短节) 和附件的交货技术条件。本标准适用于符合API Spec 5B的下列接头:
誗短圆螺纹套管 (STC) ;
誗长圆螺纹套管 (LC) ;
誗偏梯形螺纹套管 (BC) ;
誗直连型套管 (XC) ;
誗不加厚油管 (NU) ;
誗外加厚油管 (EU) ;
誗整体接头油管 (IJ) 。
第8版, 2005年7月发布, 2006年1月1日生效
API Spec 5CT/ISO 11960:2004*
套管和油管规范中译本
第8版, 2005年7月发布, 2006年1月1日生效
API Spec 5DP/ISO 11961:2008
钻杆规范
Specification for Drill Pipe
石油天然气工业钢质钻杆
Petroleum and natural gas industries-Steel drill pipe
本标准规定了用于石油天然气工业钻采作业的带有加厚管端和对焊接头的钢制钻杆的交货技术条件, 包括3个产品规范等级 (PSL-1、PSL-2和PSL-3) 。本标准包括下列钢级钻杆:
誗E级钻杆;
誗X级、G级和S级高强度钢级钻杆。
本标准还可用于带有ISO或API标准未规定的钻具接头的钻杆。本标准以API Spec 5D and API Spec 7为基础, 等同采用ISO 11961。本规范包含API会标附录。
第1版, 2009年8月发布, 2010年8月1日生效
API Spec 5DP/ISO 11961:2008*
钻杆规范--中译本
第1版, 2009年8月发布, 2010年8月1日生效
API Spec 5L/ISO 3183:2007
管线管规范
Specification for Line Pipe
石油天然气工业管道输送系统用钢管
Petroleum and natural gas industries-Steel pipe for pipeline transportation systems
(包括2009年1月勘误1、2009年2月补充1和2010年3月补充2)
规定了石油天然气工业管道输送系统用两种产品规范等级 (PSL 1和PSL 2) 无缝钢管和焊管的制造要求。本版API Spec 5L修改采用ISO 3183。本规范包含API会标附录。
第44版, 2007年10月1日发布, 2008年10月1日生效
API Spec 5L/ISO 3183:2007*
管线管规范中译本
第44版, 2007年10月1日发布, 2008年10月1日生效
API RP 5L1
管线管铁路运输推荐作法
Recommended Practice for Railroad Transportation of Line Pipe
提供了适用于API 5L规定的钢质管线管 (外径大于等于2-3/8in (60.3mm) 、长度大于任意单根的长度) 铁路运输的推荐作法。包括带涂层和不带涂层的管子, 但不包括装载过程防止涂层不被破坏的作法。
第7版, 2009年9月发布
API RP 5L2
非腐蚀性气体输送用管线管内涂层推荐作法
Recommended Practice for Internal Coating of Line Pipe for Non-Corrosive Gas Transmission Service
提供了非腐蚀性天然气输送用内涂层。它仅限于新管在安装前内涂层的涂覆。
第4版, 2002年7月发布, 2007年12月1日再次确认
API RP 5L3
进行管线管落锤撕裂试验推荐作法
Recommended Practice for Conducting Drop-weight Tear Tests on Line Pipe
作为API Spec 5L的参考文献, 提供了用于进行落锤撕裂试验测量管线管出现裂纹或断裂韧性的一种推荐方法。
第3版, 1996年1月发布, 2003年9月1日再次确认
API RP 5L7
管线管无底漆熔结环氧粉末内涂层推荐作法
Recommended Practice for Unprimed Internal Fusion Bonded Epoxy Coating of Line Pipe
提供了管线管熔键环氧树脂内涂层的材料、应用、试验和检验推荐作法。
第2版, 1988年6月发布, 2004年12月1日再次确认
API RP 5L8
新管线管现场检验推荐作法
Field Inspection of New Line Pipe
包括检验人员资格鉴定、检验方法的描述、各种检验方法的仪器校准和标准化程序, 缺欠评价和已检新管线管的标记, 以及新平端管线管现场检验和试验的推荐程序。该推荐作法还专门介绍了管线管现场检验的操作和技术, 某些部分可能对工厂检验不适用。
第2版, 1996年12月发布, 2003年9月1日再次确认
API RP 5L9
管线管熔结环氧粉末外涂层推荐作法
Recommended Practice for External Fusion Bonded Epoxy Coating of Line Pipe
提供了适用于石油天然气工业输送气、水和油的管子标准。包括无缝和焊接管线钢管。无缝和焊接管线钢管包括标准重量级和特厚级带螺纹管线管;标准重量级平端管、普通重量级平端管、特轻级平端管、特厚级平端管和双倍特厚级平端管;以及承口和插口及过出油 (TFL) 管线管。
第1版, 2001年12月发布, 2004年12月1日再次确认
API Spec 5LC
耐腐蚀合金管线管规范
Specification for CRA Line Pipe
包括无缝、离心铸造和焊接耐腐蚀合金管线管;奥氏体不锈钢、马氏体不锈钢、双相不锈钢与镍基合金管线管;标准重量级、普通重量级、特轻重量级、特厚级和双倍特厚级平端管线管;以及生产厂工艺、物化要求和试验方法。本规范正文和表格中的公制单位用斜体加带圆括号表示。
第3版, 1998年7月发布, 1998年12月31日生效, 2006年8月1日再次确认
API Spec 5LCP
挠性管线管规范
Specification for Coiled Line Pipe
提供了适用于石油天然气工业输送气、水和油的管子标准。此规范包括规格在0.5in (12.7mm) 至6.625in (168.3mm) 范围的连轧焊接钢管。本规范不包括制造厂外管端对接而成的管子。
第2版, 2006年10月发布
API Spec 5LD
耐腐蚀合金外覆或内衬钢管规范
Specification for CRA Clad or Lined Steel Pipe
包括提高耐腐蚀性能的无缝、离心铸造、焊接外覆管线钢管和内衬钢管。此规范中外覆和内衬管线钢管由外部基体金属和管子内部的耐腐蚀合金层组成。基体材料应符合API Spec5L, 5LC中的修改部分除外。该规范还提供了适用于石油天然气工业输送气、水和油的提高耐腐蚀性能的钢管标准。
第3版, 2009年3月发布, 2009年9月1日生效
API Spec 5LD*
耐腐蚀合金外覆或内衬钢管规范中译本
第3版, 2009年3月发布, 2009年9月1日生效
API RP 5LW
管线管内陆及海上船舶运输推荐作法
Recommended Practice for Transportation of Line Pipe on Barges and Marine Vessels
适用于API Spec 5L中钢质管线管的内陆和海上运输, 但其中的个别条款仅涉及海上运输或仅涉及内陆运输。
第3版, 2009年9月发布
API RP 5SI
购方代表在供方处的监督和/或检验推荐作法
Purchaser Representative Surveillance and/or Inspection at the Supplier
建立了一套购方、供方及购方代表之间在由购方代表进行监督和/或检验方面签订协议的总的指导原则。它是购方要求API产品所使用的一般性文件, 旨在为行业提供指导。本推荐作法陈述了购方、供方和购方代表在从订单或生产前会议安排到供方交付购方产品的整个过程的产品监督和/或检验方面的关系和责任。
第1版, 2006年1月发布
API Spec 5ST*
连续管规范美国惯用单位制和国际单位制单位
包括表A.5所给代号和壁厚, 钢级为CT70、CT80、CT90、CT100和CT110的所有碳钢和低合金钢连续管的制造、检验和试验。该连续管可用作油气井作业的工作管柱、完井管柱和静力压柱。可按本规范订购连续管。连续管采用连制工艺制造。本标准不包含长度小于200ft (61m) 的无缝管或焊接管的对接。
第1版, 2010年4月发布
API Std 5T1
缺欠术语
Standard on Imperfection Terminology (包括2003年9月补充1)
提供了钢管常见缺陷的英语、法语、德语、意大利语、日语和西班牙语定义。
第10版, 2003年9月发布
API 5TR SR22
增强抗泄漏长圆螺纹套管SR22补充要求技术报告
Technical Report in SR22 Supplementary Requirements for Enhanced Leak Resistance LTC
包含增强抗泄漏LTC (SR22) 连接的补充要求和在API Spec5CT、API Std 5B、API 5B1和API RP 5C1标准中生产检验这些连接有关的变化。经购方与制造商协商, SR22补充要求应适用于按API Spec 5CT制造的连接。
第1版, 2002年6月发布
API RP 5UE
管子缺欠的超声评价推荐作法
Recommended Practice for Ultrasonic Evaluation of Pipe Imperfections
提供了可用来验证缺欠深度或尺寸的方法。包括用波幅比较技术 (ACT) 和波幅距离差技术 (ADDT) 进行新管超声验证检验推荐程序, 用于 (1) 管体表面开裂缺欠的评价, (2) 电阻焊、电感应焊或激光焊焊管焊区表面开裂缺欠和表面下的缺欠的评价, (3) 电弧焊管焊区表面开裂缺欠和表面下的缺欠的评价。
第2版, 2005年6月发布
API Spec 7-1/ISO 10424-1:2004
旋转钻柱构件规范
Specification for Rotary Drill Stem Elements
石油天然气工业旋转钻井设备第1部分:旋转钻柱构件
Petroleum and natural gas industries-Rotary drilling equipment-Part 1:Rotary drill stem elements
(包括2007年3月补充1、2009年8月的补充2和2011年4月补充3)
本标准包括下列产品:
誗上部和下部方钻杆阀;
誗四方钻杆和六方钻杆;
誗钻柱转换接头;
誗钻铤;
誗钻井和取芯钻头。
钻柱构件用旋转台肩式连接和螺纹测量在API Spec 7-2中规定。本版API Spec7-1修改采用ISO 10424-1。本规范包含API会标附录。
第1版, 2006年2月发布, 2006年9月1日生效
API Spec 7-1/ISO 10424-1:2004*
旋转钻柱构件规范中译本
第1版, 2006年2月发布, 2006年9月1日生效
API Spec 7-2/ISO 10424-2:2007
旋转台肩式螺纹连接螺纹加工及测量规范
Specification for Threading and Gauging of Rotary Shouldered Thread Connections
石油天然气工业旋转钻井设备第2部分:旋转台肩式螺纹连接螺纹加工及测量
Petroleum and natural gas industries-Rotary drilling equipment-Part 2:Threading and gauging of rotary shouldered thread connections
(包括2010年12月补充1)
规定了石油天然气工业用旋转台肩式连接的要求, 包括螺纹和螺纹量规的尺寸要求、测量方法、量规规范以及螺纹检测仪器和方法。这些连接主要用于钻柱构件。有关各方可协商确定特殊公差要求、检定、试验、检测和精整等补充规范。本标准适用于下列优先选用的旋转台肩式连接:
誗数字型 (NC) ;
誗正规型 (REG) ;
誗贯眼型 (FH) 。
这些旋转台肩式连接均可溯源到有关国际组织提供的量规计量校准系统。本版API Spec7-2等同采用 (有一些编辑性修改) ISO 10424-2。Spec7-2代替原先包含在Spec 7中的螺纹加工和测量部分。本规范包含API会标附录。
第1版, 2008年6月发布, 2008年12月1日生效
API RP 7A1
旋转台肩连接用螺纹脂试验的推荐作法
Testing of Thread Compound for Rotary Shouldered Connections (ANSI/API RP 7A1-1992)
对旋转台肩连接用螺纹脂摩擦性能试验提供了建议。第1版, 1992年11月发布, 2005年3月1日再次确认
API RP 7G
钻柱设计和操作极限推荐作法
Recommended Practice for Drill Stem Design and Operating Limits
(包括2000年5月勘误件和2003年11月补充件)
包含对钻柱构件的设计和选择的建议, 同时考虑了井眼角度控制、钻井液、重量和旋转速度。图和表给出了新旧钻杆、与新旧钻杆配合使用的新钻杆接头、钻铤和方钻杆的尺寸、力学性能和使用性能。同时包含旧钻杆、旧油管柱和旧钻杆接头检测的推荐标准。
第16版, 1998年8月发布, 1998年12月1日生效
API RP 7G-2/ISO 10407-2:2008
钻柱构件检验推荐作法
Recommended Practice for Inspection of Drill Stem Elements
石油天然气工业旋转钻井设备第2部分:钻柱构件的检验与分类
Petroleum and natural gas industries-Rotary drilling equipment-Part 2:Inspection and classification of drill stem elements (包括2009年10月勘误)
本标准规定了旧钻柱构件检验和试验的每个级别的检验和程序要求。本标准规定了检验中通常用到的作法和技术。本标准还规定了检验人员的资格、检验方法和仪器校准的说明、以及各种检验方法的标准化程序。包括缺欠的评价和检验过的钻柱构件的标识。本版API RP 7G-2等同采用ISO10407-2。
第1版, 2009年8月发布
API Spec 11B*
抽油杆、光杆和衬套、接箍、加重杆、光杆卡子、密封盒和抽油三通规范
Specification for Sucker Rods, Polished Rods and Liners, Couplings, Sinker Bars, Polished Rod Clamps, Stuffing Boxes, and Pumping Tees
提供了石油天然气工业用抽油杆举升方法用钢制抽油杆、光杆衬套、接箍、纤维增强塑料抽油杆、加重杆、光杆卡子、密封盒和抽油三通的设计要求和指南, 含有API会标的使用。本规范不包含抽油杆指南、密封盒用密封件, 也不包含这些产品的安装、操作和维护。
第27版, 2010年5月发布, 2010年11月生效。
API Spec 11B*
抽油杆、光杆和衬套、接箍、加重杆、光杆卡子、密封盒和抽油三通规范中译本
第27版, 2010年5月发布, 2010年11月生效。
API RP 11BR
抽油杆维护及操作推荐作法
Recommended Practice for Care and Handling of Sucker Rods
本推荐作法规定了钢制抽油杆的维护和操作, 包括选用指南、许用应力、合适的上扣、腐蚀控制及旧抽油杆检验。
第9版, 2008年8月发布
API RP 15CLT
复合内衬钢管推荐作法
Recommended Practice for Composite Lined Steel Tubular Goods
为多相流体、烃类气体、烃类液体和水的处理及输送使用的复合内衬碳钢井下油管的设计、制造、质量评定和应用提供指南。本推荐作法中的原则同样适用于管线管。典型复合内衬油管为在钢铁基质内含有纤维增强聚合物衬里, 保护钢铁基质避免腐蚀。API及特殊螺纹接头都适用, 特别是采用腐蚀隔离环来保证相邻衬里端部间的腐蚀抗力。
本文件包含对材料选择、产品质量评定、安全和设计因素的定义的建议。还包括质量控制试验和最低性能要求。适用于直径达10in (250mm) 、作业压力达10 000psi (69MPa) 、最高温度达300℉ (150℃) 的复合内衬碳钢系统。本文件的原则可容易扩展以适应制造商开发的超过本范围的产品。
第1版, 2007年9月发布
API Spec 15HR
高压玻璃纤维管线管规范
High Pressure Fiberglass Line Pipe
(包括2004年12月补充件、2007年2月和2008年1月勘误)
提供了安全可靠的、在尺寸和功能上可互换的高压玻璃纤维管线管, 其额定标准压力为以250psi (1.73MPa) 为增量从500psi (3.45MPa) 到5000psi (34.5MPa) 。本规范局限于机械连接。
第3版, 2001年8月发布
API Spec 15HR*
高压玻璃纤维管线管规范中译本
第3版, 2001年8月发布
API Spec 15LE
聚乙烯 (PE) 管线管规范
Polyethylene (PE) Line Pipe
提供了适用于油气生产工业地下、地上和换衬器使用的输送油、气和非饮用水的聚乙烯管线管标准。对性能、设计、材料检测、尺寸和公差、标志、搬运、存放和装运给出了要求和指南。
第4版, 2008年1月发布
API Spec 15LR
低压玻璃纤维管线管规范
Low Pressure Fiberglass Line Pipe
包括直径不大于24in (609.6mm) 、循环工作压力不大于1000psi (6.89MPa) 的纤维缠绕法和离心铸造法制造的玻璃纤维管线管和管件。另外, 由制造商选择, 管子额定静工作压力也可达到1000psi (6.89MPa) 。推荐通过循环压力额定值选择购买管子和管件。标准压力额定值范围为:以50psi (0.34MPa) 为增量从150psi (1.03MPa) 到300psi (2.07MPa) (基于循环压力) ;以100psi (0.69MPa) 为增量从300psi (2.07MPa) 到1000psi (6.89MPa) (基于静压力) 。
第7版, 2001年8月出版, 2002年2月1日生效, 2008年5月1日再次确认
API Spec 15LR*
低压玻璃纤维管线管规范中译本
第7版, 2001年8月出版, 2002年2月1日生效, 2008年5月1日再次确认
API RP 15S
可绕式增强塑料管线管的质量评定
Qualification of Spoolable Reinforced Plastic Line Pipe
为用于油田出油管线的可绕式增强塑料管线管的设计、制造、质量评定和应用提供指南, 包括多相流体、烃类气体、烃类液体和水的输送。这种产品典型地包括连续的塑料衬里, 增强材料为玻璃增强环氧基可绕式复合管或芳族聚酰胺纤维增强热塑性管。它们是可盘卷来存放、运输和组装的连续出油系统。用于海上, 其他要求可适用。
第1版, 2006年3月发布
API RP 15TL4
玻璃纤维管的维护与使用推荐作法
Care and Use of Fiberglass Tubulars
提供了油田用玻璃纤维管的运输、搬运、安装和修复方面的信息。还包括粘接、修补程序和检验作法。
第2版, 1999年3月发布, 2008年5月1日再次确认
API RP 17B/ISO 13628-11:2007
柔性管推荐作法
Recommended Practice for Flexible Pipe
石油天然气工业海底生产系统的设计和操作第11部分:海底和海上立管用柔性管系统
Petroleum and natural gas industries-Design and operation of subsea production systems-Part 11:Flexible pipe systems for subsea and marine riser applications
本推荐作法为陆地、海底和海上用柔性管和柔性管系统的设计、分析、制造、试验、安装和操作提供指南。本推荐作法是对API Spec 17J和17K的补充, 这些规范规定了非粘接和粘接柔性管的设计、选材、制造、试验、标记和包装的最低要求。本推荐作法适用于柔性管总成, 包括柔性管体组件及管端装配的管件。此外, 本推荐作法适用于包括附件在内的柔性管系统, 可用于低硫和酸性环境生产, 包括输出和注入;适用于用作出油管、立管和跨接管的静态和动态柔性管系统;不包括海上装载系统用柔性管及节流管汇和压井管线或控制线用柔性管。本版API RP 17B等同采用ISO 13628-11:2007。
第4版, 2008年7月发布
API Spec 17J/ISO 13628-2:2006
非粘接柔性管规范
Specification for Unbonded Flexible Pipe
石油天然气工业海底生产系统的设计和操作第2部分:海底和海上用柔性管系统
Petroleum and natural gas industries-Design and operation of subsea production systems-Part 2:Flexible pipe systems for subsea and marine applications
本标准规定了按统一标准和准则设计和制造的安全、尺寸和功能可互换的柔性管的技术要求, 参照现有的适用法规和标准规定了柔性管设计、选材、制造、试验、标记和包装的最低要求。柔性管及附件的使用指南见API RP 17B。本标准适用于非粘接柔性管总成, 包括柔性管体组件及管端装配的管件。本标准不涉及粘接结构的柔性管。不适用于柔性管附件。可用于低硫和酸性环境生产, 包括输出和注入, 生产产品包括油、气、水和注入化学剂;适用于用作出油管、立管和跨接管的静态和动态柔性管;不适用于节流管汇和压井管线用柔性管。本版API Spec 17J等同采用ISO 13628-2:2006。本标准包含API会标附录。
第3版, 2008年7月发布, 2009年1月1日生效
API Spec 17K/ISO 13628-10:2005
粘接柔性管规范
Specification for Bonded Flexible Pipe
石油天然气工业海底生产系统的设计和操作第10部分:粘接柔性管规范
Petroleum and natural gas industries-Design and operation of subsea production systems-Part 10:Specification for bonded flexible pipe
本标准规定了按统一标准和准则设计和制造的安全、尺寸和功能可互换的柔性管的技术要求, 参照现有的适用法规和标准规定了粘接柔性管设计、选材、制造、试验、标记和包装的最低要求。本标准适用于粘接柔性管总成, 包括柔性管体组件及管端装配的管件。本标准不涉及非粘接结构的柔性管或柔性管附件;适用于包括非金属增强层的柔性管。本版API Spec 17K等同采用ISO 13628-10:2005。本标准包含API会标附录。
第2版, 2005年11月发布, 2006年5月1日生效
API Std 1104
管道及相关设备的焊接
Welding of Pipelines and Related Facilities
(包括2007年7月勘误和补充、2008年12月勘误2) 包括应用于压缩机、泵和输送原油、石油产品、液化气、二氧化碳和氮的碳钢和低合金钢管线的对接、角接、承插焊接的气焊和电弧焊, 当适用, 还包括分支系统的焊接。适用于新建和在役设备的焊接。焊接可采用手工电弧焊、埋弧焊、非熔化极气体保护焊、熔化极气体保护焊、药芯焊丝电弧焊、等离子弧焊、氧乙炔焊接、闪光对焊中的一种或多种焊接方法, 采用手工、半自动、机械、自动焊一种或多种焊接技术。通过定位焊或热滚压焊接或其组合获得焊缝。
标准还包括射线、磁粉、液体渗透和超声探伤程序, 以及采用射线、磁粉、液体渗透、超声和目视检查等方法测试或检验产品焊缝缺陷的验收标准。
第20版, 2005年10月发布
API Std 579-1/ASME FFS-1
适用性标准
Fitness-For-Service
规范了石化工业用压缩设备适用性评价技术。适用性定义为证明含缺欠在役设备结构完整性的能力。本标准作为API510、570和653的补充要求, 旨在 (1) 在老设备继续运行的同时确保工厂员工及公众的安全; (2) 提供技术先进的适用性评价程序使不同服务提供者达到一致的预测寿命; (3) 帮助优化现有设备维护和操作以保持老设备的可用性和增强其长期耐用的经济性。
本标准评价程序可用于如下产品的适用性评价和重新定级:根据ASME锅炉与压力容器规范设计建造的压力容器, 根据ASME B31.3管线规范设计建造的管道系统, 以及根据API650和620设计建造的地面储罐。本评价程序可对给出损伤状态的带压力设备的当前完整性和设计剩余寿命进行评价, 也可适用根据本标准中给出的其他规范和标准建造的带压力设备。
第2版, 2007年6月发布
标准数据类 第7篇
由于计算机网络通信的迅速发展以及地理上分散的公司、团体和组织对数据库更为广泛的应用需求,20世纪80年代,在集中式数据库系统成熟技术的基础上产生和发展了分布式数据库系统(Distributed Database System)。分布式数据库系统符合当今信息系统应用的需求,符合当今企业组织的管理思想和管理方式。
数据分配问题是影响整个分布式数据库系统性能的关键因素,数据分配的主要目标之一是数据处理的本地性,即尽可能把数据片段分配在使用它们的应用所在的站点上,从而减少远程访问,由此产生的数据冗余又会带来数据一致性问题。只有数据片段分配的合理,整个分布式数据库系统的性能、效率、数据的可用性和可靠性才会处于良好的状态。研究该问题的最终目的是找到一个使有远程访问代价和局部处理代价组成的总代价最小的分配方案[1]。因此有必要对数据分配问题进行深入研究。
类电磁机制算法是由Birbil和Fang于2003年受电磁场中带电粒子之间的吸引-排斥机制启发提出的[2]。该算法具有寻优机理简单、所需资源少、收敛速度快等特点,是一种典型的启发式随机搜索技术,具有很强的鲁棒性,能适应不同领域的优化问题求解,并且在大多数情况下都能得到比较满意的解[3]。
1 数据分配
设有一个由站点集S=(S1,S2,,Sm)构成的网络,该网络上运行一个事务T=(T1,T2,,Tq),存储着一个数据片段集F=(F1,F2,,Fn)。按照一定的方式将每个片段Fi的不同副本分配到不同的站点Sk上,分配方案表示为A(F,S,T),这就是所谓的数据分配问题[4]。
传统的数据分配策略分为非冗余分配和冗余分配两种:
(1) 非冗余分配策略:每个数据片段只映射到一个站点上,即没有数据副本存在。
(2) 冗余分配策略:每个片段映射到一个或多个站点上,可能有多个数据副本,这就涉及到检索时选择哪一个副本及更新时保持数据一致性问题,因此冗余分配策略比较复杂。
一般来说,应采用冗余分配策略,否则就和集中式数据库一样,体现不出分布式数据库系统的优越性。冗余分配可以提高数据的可用性和可靠性,减少网络通信代价,提高查询效率。
假设有x个站点,y个数据片段,那么在考虑冗余分配的情况下,总的分配方案数将随着x和y的增大呈几何级数增长,因此数据分配问题是一个NP完全问题[5]。即使在实际情况中一般只要求求出次优解,数据分配问题仍然是十分复杂的,一般来说都需要用启发式搜索方法来求解。
2 代价函数
本文采用的代价公式为[1]:
式中:TQ是检索数据数量;TU是更新数据数量。对于所有站点上发生的所有事务,其总的检索数据量TQ为:
式中:Ti为事务;Fj为数据片段;Sk为站点。Sf为在站点Sk上的事务Ti所访问的数据片段Fj的副本所在的站点,若站点Sk本地有数据片段Fj的副本,则Sf等于Sk,否则Sf为使Vtran(Sk,Sf)达到最小值的站点。Vtran(Sk,Sf)为站点Sk与站点Sf间的通信代价系数,FRE_Q(Ti,Sk)为由站点Sk发出的事务Ti执行检索操作的频率,SEL_Q(Ti,Fj)为事务Ti对数据片段Fj的检索访问百分比,Size(Fj)为数据片段Fj的大小。
对所有站点上发生的所有事务,其总的更新数据量TU为:
式中:Sf为在站点Sk上事务Ti所访问的数据片段Fj的任一副本所在站点,即所有拥有数据片段Fj副本的站点。FRE_U(Ti,Sk)为由站点Sk发出的事务Ti执行更新操作的频率,SEL_U(Ti,Fj)为事务Ti对数据片段Fj的更新访问百分比。Ti,Fj,Sk,Vtran(Sk,Sf)和Size(Fj)的含义与式(2)中相同。
3 用类电磁机制算法对分配问题进行求解
3.1 种群初始化
本文中采用二进制编码,将问题空间的参数表示为基于字符集{0,1}构成的位串。每个数据段的一种分配方案用一个位串表示,位串长度与站点数相等。假设分布式数据库系统中共有m个站点,那么每个位串长度为m,其中第i(i=1,2,,m)位为“1”表示将数据片段分配给第i个站点,为“0”表示不分配。
确定编码后,要进行种群初始化,从可行域中随机抽取n个粒子xi={x1,x2,,xn},计算每个粒子的目标函数值f(xi),其中粒子xi即某种分配方案对应的二进制编码,目标函数值f(xi)即粒子xi的代价函数。然后选出目标函数值最优的点记为xbest。
3.2 进行局部搜索
局部搜索用于获取粒子的有效局部信息。对初始种群x(0)进行局部搜索,重新计算种群中每个粒子的目标函数值f(xi),i=1,2,,n,并找到目前函数值最优的粒子[6]仍记为xbest。
3.3 求电荷以及合力
根据库伦定律,空间中带点微粒之间的作用力大小与微粒之间的距离平方成反比,与带电电量成正比。
由此类推,在每一次迭代中都需要通过各个粒子的目标函数值来决定每个点的电量。但是,每个粒子的电量并非不变,而是随着迭代次数的增加发生变化[7]。
电量的计算公式是:
式中:qi是第i个粒子所带电量。通过该公式可以看出:粒子的目标函数值越小其所带电量越多。
确定粒子的电量之后,对粒子xi和粒子xj比较它们的适应值之后决定作用力的方向。施加在粒子xi上的合力计算公式如下:对于∀i:
式中:Fi是第i个粒子所受合力。以两个粒子为例,目标函数值较优的粒子吸引目标函数值较差的粒子,目标函数值较差的粒子排斥目标函数值较优的粒子。xbest具有最优的目标函数值,在算法中充当绝对吸引粒子,吸引种群中的所有粒子,被其他所有粒子排斥。
3.4 沿合力方向移动粒子
计算出粒子所受合力之后,就要沿着合力的方向以一个随机的步长移动粒子,步长λ在[0,1]上均匀分布。
新的位置如下:
移动过程中,其可行移动范围由向量RNG给出,RNG=(v1,v2,,vn)。
3.5 算法终止条件
可选用两种算法终止条件:
(1) 通过最大迭代次数控制算法,当算法迭代次数达到最大值时,则终止搜索;
(2) 通过全局最优解控制算法,当全局最优解经过若干次迭代之后一直保持不变,则算法终止搜索。
4 结 语
在大量阅读及深入比较分析的基础上,本文提出了基于类电磁机制算法的分布式数据库数据分配策略。本文提出的分配策略利用了类电磁机制算法的高并行性,鲁棒性,简单易行,实现方式规范,能够在深度优先搜索和广度优先搜索之间维持很好的平衡,以及具有不受优化函数连续可导等性质约束的优良性能。
摘要:针对目前分布式数据库数据分配方法存在的代价公式复杂,算法执行效率较低或所求结果与最佳方案相差较大等问题,本文提出了一种基于类电磁机制算法的数据分配策略。旨在寻找高效的分布式数据库数据分配方法。结果表明:本文提出的分配策略与传统数据分配策略相比具有较高的效率,且与最佳方案更为接近。可应用于陕西省防雷管理信息系统中分布式数据库的建设。
关键词:分布式数据库,类电磁机制算法,数据分配,分配策略
参考文献
[1]李想.分布式数据库数据分配策略研究[D].大连:大连理工大学,2009.
[2]姜建国,龙秀萍,田旻,等.一种基于佳点集的类电磁机制算法[J].西安电子大学学报:自然科学版,2011,38(6):167-172.
[3]范彦芳,马宁,李香芳,等.分布式数据库在气象业务中的应用研究[J].农业网络信息,2009(2):31-33.
[4]王三虎.基于遗传算法的分布式数据库数据分配研究[J].西安石油大学学报:自然科学版,2012,27(2):102-105.
[5]RAN G,EPHRAIM K,RONY O.Placement of networkresources in communication networks[J].Computer Net-works,2003,43:195-209.
[6]尚云,何雪妮,雷虹.求全局最优的类电磁机制算法[J].计算机应用,2010,30(11):2914-2916.
标准数据类 第8篇
IEC 61850定义了标准的配置模型和信息模型[1,2,3,4],该模型已被广泛应用。文献[5,6]针对制造报文规范(MMS)通信映射方式的数据结构、数据流和实现架构,分别提出了保护信息管理系统和智能电子设备(IED)基于IEC 61850的建模方法,具有重要参考意义。
随着智能变电站的推广应用,工程调试和维护复杂的问题日益突出[7]。变电站主要设备是一次设备,它组成了输送和分配电能的功能实体。然而,在系统集成时,国内过于重视IED的一致性测试,忽略了系统规格建模,导致变电站配置文件(SCD)普遍缺少一次设备描述,模型描述不完备。2011年完成了国家电网公司智能变电站和主站共享建模科技项目的研究,在SCD基础上,补充一次设备模型定义,建立一次设备与二次设备逻辑节点之间的关联关系,通过共享建模技术,将变电站配置模型转换成公共信息模型(CIM),同时生成图形和通信配置信息,直接应用于主站系统,基本满足源端维护要求[8,9]。
IEC 61850对二次设备产生了很大影响,但给一次设备带来的变化却较小,因此,虽然变电站内部通信发生了巨大变化,但功能需求相对不变。IEC 61850 与传统规约不同,它不仅定义了数据,还定义了与数据密切相关的服务。变电站自动化系统若能直接采用统一配置模型生成数据库,保持数据和服务的完整性,无需人工映射,将大大简化工程的调试和维护。随着IEC 61850模型不断扩充更新,这种需求尤为迫切[10]。但是,国内变电站自动化系统集成厂家为了兼容常规变电站,一般在IEC 60870-5-103 的基础上,扩充IEC 61850数据库模型定义。因此,各厂家的数据库模型结构是私有的,通常采用映射方式建立标准配置模型与私有数据库模型之间的映射关系,不仅工程调试复杂,同时难以保证信息的完整性。
本文提出了基于IEC 61850通用数据类的数据库信息模型的设计方法,旨在解决站控层设备模型维护复杂、信息不完整的问题,实现标准模型的复用和自动导入、导出。
1 设计方法
在软件工程中,“开闭原则”是一项最基本的原则,即“对扩展开放,对修改关闭”,这也是软件复用的基础。本文严格遵循这一原则,设计了通用的数据库建模方法,信息模型采用IEC 61850定义的通用数据类(CDC),设备模型采用IEC 61970-301定义的CIM,在信息模型与设备模型之间建立关联关系。数据库信息模型由SCD模型文件自动生成,设备模型由CIM自动生成,其中CIM通过共享建模技术由SCD转换生成[9]。基于CDC的变电站数据库建模流程如图1所示。
1.1 通用数据类
IEC 61850定义了包含逻辑设备(LD)、逻辑节点、数据对象(DO)、数据属性(DA)的层次化对象模型。IEC 61850-7-3定义了38个CDC类,国内扩充定义了1个CDC类(STG,字符串定值),总计39个CDC类。CDC类包含的数据属性,其类型包括基本数据类型、简单的复合数据类型,以及嵌套的CDC类。CDC类的数据属性既有强制性的,也有可选的。数据属性的名称及其数据类型必须符合IEC 61850定义,否则须在数据类型模板中扩充定义。
1.2 信息模型结构
为了实现通用数据库设计,本文定义了4类数据库表,分别是模型类、模板类、数据类和通信类。其中,模型类17个表、模板类8个表、数据类41个表、通信类1个表,总计67个表。信息模型的关系型数据库结构如图2所示。
模型类定义了IED的模型结构,包括智能电子设备表(IED)、访问点表(ACC_POINT)、逻辑设备表(LG_DEV)、逻辑节点表(LG_NODE)、数据对象表(DAT_OBJ)、数据集表(DATSET)、功能约束数据属性表(FC_DA)、功能约束控制块表(FC_CB)、报告控制块表(RPT_CB)、日志控制块表(LOG_CB)、事件控制块表(GSE_CB)、采样值控制块表(SMV_CB)、定值区控制块表(SG_CB)、外部引用表(EXT_REF)、静态目录表(STATIC_DIR)、动态目录表(RUNTIME_DIR)、基本数据属性索引表(BDA_INDEX)、量测索引表(MEAS_INDEX)。其中,静态目录表的记录通过SCD文件自动生成,动态目录表的记录则在运行时通过服务动态创建,基本数据属性索引表和量测索引表用于数据检索。基本数据属性索引表包含自身的引用(ref),还有检索关键字域,即所属IED(ied_id)、所属LD(ld_id)、所属LN(ln_id)、所属数据对象(do_id)、所属CDC对象(cdc_id),分别与IED,LG_DEV,LG_NODE,DAT_OBJ,CDC对象表建立关联关系。量测索引表包含自身的引用(ref),所属IED(ied_id)和量测ID(meas_id),分别与智能电子设备表和数据采集与监控(SCADA)应用的参数类表建立关联关系。这里的参数类表是指遥信、遥测、保护信号等表,是SCADA应用的一部分。
模板类定义了数据类型的模型结构,包括逻辑节点类型表(LN_TYPE)、数据对象类型表(DO_TYPE)、数据属性类型表(DA_TYPE)、数据对象定义表(DO_DEF)、嵌套数据对象定义表(SDO_DEF)、数据属性定义表(DA_DEF)、基本数据属性定义表(BDA_DEF)。
数据类是通用数据库的核心,变电站IED的实例化数据展开后生成CDC类对象,存储在相应的CDC表记录中。数据类包括单点状态表(CDC_SPS)、双点状态表(CDC_DPS)、整数状态表(CDC_INS)、枚举状态表(CDC_ENS)、保护启动信息表(CDC_ACT)、方向保护启动信息表(CDC_ACD)、安全违规计数表(CDC_SEC)、二进制计数器读数表(CDC_BCR)、直方图表(CDC_HST)、测量值表(CDC_MV)、复合测量值表(CDC_CMV)、采样值表(CDC_SAV)、分相测量值表(CDC_WYE)、相间测量值表(CDC_DEL)、序列表(CDC_SEQ)、谐波值表(CDC_HMV)、分相谐波值表(CDC_HWYE)、相间谐波值表(CDC_HDEL)、单点控制表(CDC_SPC)、双点控制表(CDC_DPC)、整数控制表(CDC_INC)、枚举控制表(CDC_ENC)、二进制步进位置控制表(CDC_BSC)、整数步进位置控制表(CDC_ISC)、模拟过程量控制表(CDC_APC)、二进制模拟过程值控制表(CDC_BAC)、单点定值表(CDC_SPG)、整数定值表(CDC_ING)、枚举定值表(CDC_ENG)、对象引用定值表(CDC_ORG)、时间定值表(CDC_TSG)、货币定值表(CDC_CUG)、模拟定值表(CDC_ASG)、曲线定值表(CDC_CURVE)、曲线形状定值表(CDC_CSG)、设备铭牌表(CDC_DPL)、逻辑节点铭牌表(CDC_LPL)、曲线形状描述表(CDC_CSD)、整数阵列表(CDC_INT_ARRAY)、点阵列表(CDC_POINT_ARRAY)、方块阵列表(CDC_CELL_ARRAY)、字符串定值表(CDC_STG)。数据类表都有通用的数据属性,包括ID号(id)、英文名(code)、中文名(name)、所属IED(ied_id)、所属LD(ld_id)、所属LN(ln_id)、所属DO(do_id)、引用(ref),可定义数据实例的描述、外键和索引。此外,还定义了层次化描述数据属性,包括装置名(ied_name)、逻辑设备实例名(ld_name)、前缀(prefix)、逻辑节点类(ln_class)、逻辑节点实例名(ln_inst)、逻辑节点名(ln_name)、数据对象名(do_name),方便查询。这样,每个CDC类实例数据在数据库记录中的描述都整齐、规范。
以上数据库表的设计,除了静态目录表、动态目录表、基本数据属性索引表、量测索引表提供检索查询外,其他表域的名称和数据类型严格参照IEC 61850-6 和IEC 61850-7-3定义,根据IED、逻辑设备、逻辑节点、数据对象的层次关系,通过表中的ID号域(ied_id,ld_id,ln_id,do_id)定义各表之间的关联关系(如图2虚线所示)。此外,模板类的逻辑节点类型、数据对象类型、数据属性类型及其定义,与逻辑节点、数据对象、数据属性实例数据通过类型名建立关联关系。数据库信息模型能够直接由SCD配置文件生成,实例数据可通过字符串格式的引用检索,数据库信息模型也能直接导出生成SCD配置文件,无论是编程,还是工程调试和升级维护,都可以简化。
由于IEC 61850仅发布了MMS通信服务映射方式,因此通信类目前定义了1个表,该表为MMS规约表(IEC 61850_MMS_INFO),其数据属性包括装置描述、通信地址、订阅参数、非缓冲报告控制块(URCB)实例、缓冲报告控制块(BRCB)实例等。若IEC 61850发布新的通信服务映射方式,如IEC 61850-8-2 Web服务映射,可参照此表,增加其他的数据属性,定义IEC 61850_WEBSERVICES_INFO表。
1.3 复合数据的描述方法
复合数据包含于CDC类中,构成实例化对象的嵌套数据对象(SDO)、DA、基本数据属性(BDA),其中DA和BDA属于简单的复合数据,SDO是嵌套的DO,也是某个CDC类的一个实例。为了方便建库,需将CDC类实例中的DA和BDA展开成基本数据类型,嵌套的SDO则以INT64类型的索引值保存,其实际数据作为一条新记录存储,通过do_id 建立与其父DO的关联关系。为了便于访问数据,本文采用对象引用的检索方式,封装了表域名与IEC 61850数据名之间的映射关系,保留功能约束。CDC表的记录数据包括3个部分:索引、命名描述以及IEC 61850数据。索引部分用于检索数据,描述部分用于提取数据对象的引用,IEC 61850数据用于实际存储。根据IEC 61850的定义,数据对象引用可以描述为ld_name/ln_name.do_name,其中do_name采取了必要的数据冗余,可通过其余3项组合而成,即$prefix$ln_class$ln_inst,其中$表示取字符串值。每条数据对象记录中,字符串格式的引用是关键词。
1.4 数据库访问接口
根据上文定义的表结构,可设计C++类,用以封装表中的域数据和对象访问接口。这些接口包括记录的增加、删除、修改、查询,以及关联设备的查询等。通过封装类和主键值,可以实现数据库表记录和内存对象数据之间的双向访问。
数据库访问接口的UML类图见图3。
下面以CDC对象的访问为例,介绍接口调用方法。对应每个CDC类,本文封装了一个类,它们派生于cdc_base 基类。cdc_base类派生于dbo_adapter数据库对象接口类,其中封装了CDC对象数据的读写接口。table_operate类封装了数据库与对象之间的访问接口。实际编程时,先定义一个table_operate对象,并设定特定的数据库接口,例如SQLite3、达梦、Oracle等,然后添加需要操作的CDC对象,最后调用read,write,modify,delete通用接口执行数据库操作。以上对象检索方式都基于字符串格式的引用,非常直观、方便。
为了支持多种数据库平台,可开放底层接口封装在基础接口类中。若需增加新的数据库接口,可从接口类派生子类,实现其中虚拟的接口函数。打开数据库时,需要加载具体的访问接口,才能对特定的数据库进行操作。
为了方便访问,本文定义的接口接受字符串格式的对象引用参数,查询并获取对象数据。例如,某开关位置信号为P5021ACTRL/Q0CSWI1.Pos.stVal,调用接口函数,首先解析对应DO的引用,即P5021ACTRL/Q0XCBR1.Pos,然后从DAT_OBJ表中检索对象INT64类型的索引值,从该索引值中可以解析DO的类型,即可知道表名(CDC_DPS)和记录索引。通过上面的对象访问接口,可以生成对象实例,提供应用程序操作。以上过程封装在一个接口函数中。
除此之外,在以上接口的基础上,还设计了通过数据对象引用查询关联SCADA应用模型的信号和设备,通过设备查询关联信息模型中的逻辑节点等访问接口,方便上行和下行通信数据的检索。
2 数据库的自动生成方法
以上建立的数据库可通过编程实现由SCD文件直接生成数据库表记录。自动生成的表包括:设备模型表、信息模型表、SCADA模型表、前置模型表。本文只讨论信息模型表的自动生成方法,设备模型和应用模型只做简单描述。
设备模型采用IEC 61970模型,一是因为IEC 61850 一次设备模型的定义没有IEC 61970完善,二是为了适应调度和变电环节技术融合的发展趋势。文献[9]提供了SCD模型文件生成CIM模型文件的方法。一次设备模型通过LNode与二次设备模型(信息模型)建立关联关系。
SCADA模型和前置模型属于应用模型。SCADA模型自动创建的记录主要包括遥信、遥测、遥控等信号表,可以通过读取SCD文件中的数据集,解析相关内容自动生成。前置模型自动创建的记录主要是IEC 61850_MMS_INFO通信表记录的创建,可以通过解析IED的通信参数、报告控制块等参数生成。
实际生成数据库时,先建立设备模型,然后建立信息模型,最后建立SCADA模型和前置模型等应用模型。生成信息模型时,先生成模板类数据库表,然后生成模型类部分数据库表,最后生成数据类数据库表和数据对象相关的模型类数据库表。
信息模型中模板类表的自动生成较为直接,但因其嵌套复杂,又要为后续实例化的生成提供模板类型检索,因而处理较为复杂,需要创建模板类型映射。模型类的IED,LG_DEV,LG_NODE,RPT_CB,DATSET,FC_DA等数据对象以外的表可通过解析SCD相关内容直接生成。生成DATSET表时,需要同时在MEAS_INDEX中创建记录,以便检索信号。
数据类数据库表的生成需要建立复杂的关联和嵌套关系。编程时,需要通过使用的逻辑节点类型模板,查询数据对象定义;通过数据对象类型模板,查询数据属性定义;通过数据属性类型,查询基本数据属性定义。如此嵌套反复,才能自动生成CDC类数据对象记录。生成数据对象的同时,需要建立数据对象的索引,即在DAT_OBJ和BDA_INDEX中增加记录。
上述过程完成后,需要建立信息模型与SCADA应用模型之间的关联关系。例如,若SCD文件中的设备配置了关联的LNode,则先获取SCADA应用模型的设备ID,将其写入逻辑节点表记录中的dev_id域,便可在数据库中建立逻辑节点与SCADA设备表的关联关系。所有FC_DA表中的记录,都是报告数据集中的数据,也是SCADA要采集的信号。须生成SCADA遥信、遥测等表记录,并将其记录索引值写入MEAS_INDEX表的meas_id域,建立关联关系,以便检索信号。
3 技术验证
为了验证国家电网公司组织开发的新一代智能电网调度技术支持系统基础平台(以下简称“调度平台”)可以应用于变电站自动化系统,项目组承担了调度变电一体化监控系统软件的前期研发工作。在调度平台上开发了信息模型访问接口和MMS通信进程mms_client,搭建了变电站监控系统软件测试环境,完成了通用数据库信息模型的验证工作。测试环境包括系统配置工具、D-5000平台主机和测控装置。首先采用系统配置工具绘制变电站主接线图,输出变电站SCD统一配置模型,转换生成变电站电网模型文件(CIM/E)模型,导出电网图形文件(CIM/G)。通过模型导入工具,导入CIM/E,生成D-5000调度变电一体化平台的设备模型;通过本文实现的信息模型导入工具,导入SCD模型,生成D-5000调度变电一体化平台的信息模型;通过图形导入工具,导入CIM/G,生成主接线图。mms_client进程打开IEC 61850_MMS_INFO表,读取全部记录,解析IED通信地址和报告控制块等参数,自动订阅装置报告。在装置上模拟产生数据变化,mms_client解析报告后通过MEAS_INDEX表检索关联的设备,通过消息总线发送变化数据给SCADA应用,SCADA分析处理后刷新实时库,并在界面上显示最后变化的数据。整个流程以往至少需要1周的调试时间,采用本文的建库方法后1 h即可完成。
上述测试系统基于D-5000平台的实时数据库,本文编写了1.4节中所述的IEC 61850信息模型的访问接口。另外,为了验证不同的数据库平台,同时开发了SQLite3嵌入式数据库访问接口,完成了以上信息模型的测试。实验表明,本文所述的数据库信息模型通用性强、接口开放、对象查询方便,可显著提高工作效率。
4 结语
本文设计并实现了基于IEC 61850通用数据类的数据库信息模型及其接口的实现方法,提出了信息模型、设备模型、应用模型3层架构,主要优点如下。
1) 信息模型遵循IEC 61850,设备模型遵循IEC 61970,实现了标准模型的复用,且信息最为完整。
2) 能够直接由SCD配置文件自动生成数据库,也可以由数据库自动生成SCD配置文件,与具体变电站模型无关,明显减少了工程调试周期和维护成本。
3) 建立了基于通用数据类的数据库信息模型,设计了基于字符串格式的数据对象引用的检索方式,提供开放的访问接口,适用于不同的数据库平台。
参考文献
[1]IEC61850-6Communication networks and systems in substations:Part6configuration description language for communication in electrical substations related to IEDs.2006.
[2]IEC61850-7-2Communication networks and systems in substations:Part7-2basic communication structure for substation and feeder equipment—abstract communicationservice interface(ACSI).2004.
[3]IEC61850-7-3Communication networks and systems in substations:Part7-3basic communication structure for substation and feeder equipment—common data classes.2004.
[4]IEC61850-7-4Communication networks and systems in substations:Part7-4basic communication structure for substation and feeder equipment—compatible logical node classes and data classes.2004.
[5]章坚民,朱炳铨,赵舫,等.基于IEC61850的变电站子站系统建模与实现[J].电力系统自动化,2004,28(21):43-48.ZHANG Jianmin,ZHU Bingquan,ZHAO Fang,et al.Modeling and implementation of the subsystem in substations[J].Automation of Electric Power Systems,2004,28(21):43-48.
[6]何卫,唐成虹,张祥文,等.基于IEC61850的IED数据结构设计[J].电力系统自动化,2007,31(1):57-60.HE Wei,TANG Chenghong,ZHANG Xiangwen,et al.Design of data structure for IED based on IEC61850[J].Automation of Electric Power Systems,2007,31(1):57-60.
[7]辛建波,吴素农.智能变电站建设过程中值得关注的几个问题[J].江西电力,2010,34(3):1-9.XIN Jianbo,WU Sunong.Several issues concerned in the construction of smart substation[J].Jiangxi Electric Power,2010,34(3):1-9.
[8]陈爱林,乐全明,冯军,等.代理服务器在智能变电站和调度主站无缝通信中的应用[J].电力系统自动化,2010,34(20):99-102.CHEN Ailin,YUE Quanming,FENG Jun,et al.Application of IEC61850proxy server in seamless communication between smart substation and control center[J].Automation of Electric Power Systems,2010,34(20):99-102.
[9]陈爱林,耿明志,张海东,等.智能变电站和主站共享建模的关键技术[J].电力系统自动化,2012,36(9):72-76.CHEN Ailin,GENG Mingzhi,ZHANG Haidong,et al.The key technology of model harmonization between smart substation and control center[J].Automation of Electric Power Systems,2012,36(9):72-76.
标准数据类 第9篇
一、各家关于类词缀的论述与界定
最早明确提出“类词缀”(类语缀)的吕叔湘(2005)说:“说它们作为前缀和后缀还差点儿,还得加个‘类’字,是因为它们在语义上还没有完全虚化,有时候还以词根的面貌出现。”赵元任(2005)提出了“新兴前缀”和“新兴后缀”,值得一提的是,这两个概念是吕叔湘的译本中所采用的,所以与其所提出的“类词缀”应大致相当。郭良夫(1985)提出了“新兴的前缀”和“新兴的后缀”,并把它们看作是复合词里的实语素,但认为它们“在语义上日趋虚化,只有标志词的语法功能了”。沈孟璎(1995)在谈类词缀问题时,提出“新的词缀化倾向”,并指出其特征是“语义上虚实各异,表现语义趋于概括和抽象,意义泛化,语义偏离。但在形式上有定位性,语义词性上的类化性,构词能产性,派生词的三音化”。任学良(1981)提出有“准词头”和“准词尾”,他认为在演变成词头或词尾的过程中关键是词义虚化,但有些词词汇意义已经虚化,却还没有完全消失,所以才姑且称为“准词头”“准词尾”。陈光磊(1994)又将“类词缀”称为“准词缀”“副词缀”或“预备词缀”,认为类词缀就是类乎词缀的语素,它在复合词里的结合面相当宽,是一种半实半虚的语素。也就是说,它是正在转变但尚未最后完成虚化的词缀。汤志祥(2001)也提出了“纯词缀”“准词缀”和“类词缀”,但与其他人不同的是,他所谓的“类词缀”大致相当于我们所说的词根语素,它的意义没有虚化,本身能自由地独立运用,相反它的“准词缀”倒与我们的“类词缀”相当,这是所采用的术语名称的不同。张斌(2002)也提到了“类词缀”,认为有些语素的自由度已降低,正在呈现定位黏着的趋势,意义也已经类化,正在成为一种类词缀。张小平(2003)指出了类词缀确立的三个前提条件,并认为只有“―性、―化”才是严格意义上的典型的类词缀。近年来,关于类词缀的研究方兴未艾,邵敬敏(2003)也将词缀分为“典型的词缀”和“类词缀”,其依据的标准是定位性原则同时参考语义的虚化程度。杨锡彭(2004)也指出“类词缀必须是定位的不成词语素”。王洪君(2005)则从句法音系接面的角度指出,与词根相比,类词缀和词缀都具有单向高搭配性、结构类型个别化、类化性、意义泛化及定位性等特点;与词缀相比,类词缀多与双音节和多音节类搭配,词缀则只能与单音字和部分双音词相配,同时类词缀的新生类推潜能较词缀要强得多。这样她就将三者区别开来,指出类词缀是一个重要的单位类别。钱玉莲(2006)基本沿用旧说,指出:“所谓类词缀,就是跟词缀相似的词素。它比词缀的虚化程度差一些,又没有词根意义那么实,在复合词里的结合面相当宽。”其实,各家关于类词缀的性质的认识大体是一致的,只是在其范围确定方面存在着极大差异。例如有人就曾对部分著作或文章做过统计,其中所列出的类词缀少的只有四五个,多的则有七十多个(张小平,2003)。笔者在这里只举“―性、―化”一例稍作说明。大部分著作都将“―性、―化”看作类词缀,如吕叔湘《汉语语法分析问题》、陆志韦《汉语的构词法》、刘月华《实用现代汉语语法》、汤志祥《当代汉语词语的共时状态及其嬗变》、陈光磊《汉语词法论》、郭良夫《词汇》以及钱玉莲的《现代汉语词汇讲义》等等,而且张小平将它们看作是最典型的类词缀。也有将其看作是词尾或后缀的,前者如丁声树(1979)的《现代汉语语法讲话》,后者如马庆株先生(1995)的《现代汉语词缀的性质、范围和分类》一文。值得一提的是,第五版的《现代汉语词典》也新增了“―性、―化”作为后缀。由此可以看出“―性、―化”发展的明显的词缀化倾向,但在为其归类时人们又有迟疑,不同的人依据的标准不同,侧重点不同,就可能将其归为不同的类别。
二、关于类词缀的判别标准问题
综合以上各家对类词缀的界定,我们大致可以看出学者们为给类词缀确定一个明确的范围,都试图建立一套标准,但是由于各人侧重的标准不同,因此在一些语素的归类方面不免会出现偏差。笔者综合了各家对类词缀的界定并结合其它方面的研究资料,认为不同学者关于类词缀的判别标准主要体现在以下几个方面。
(1)从意义上看,词义发生了虚化,但尚未完全失去其词汇意义。
大部分学者都认为这应是判断一个语素是否为类词缀的最主要的标准。因为类词缀最明显的特征就在于与典型的词缀相比,它还保留了一定的词汇意义,而与词根相比,其词汇意义(有的学者称为实在意义)已发生了部分虚化。但问题是意义标准的可操作性不强,这主要表现在以下两个方面:
首先,虚化的程度不易确定。因为词缀大多是由古代汉语的实词或词根虚化而来的,而整个实词虚化的过程是一个连续统,所以必然存在一个虚化的程度问题。那么,实词究竟虚化到何种程度才成为词缀或类词缀,自然是“仁者见仁,智者见智”。正如孙银新(2003)所指出的:“一涉及意义标准,就会遇到分类时在对标准的理解和把握上有宽严不等的问题。”的确,意义标准可以说是最有争议的标准之一,不止是在确定类词缀的问题上,其他方面如划分词类时究竟应不应该考虑意义也一直是语法学界的老大难问题。
其次,关于“词汇意义的虚化”,究竟何为虚化,不同的学者有不同的看法。有人认为虚化应包括类化和泛化,所以便将“―手、高―、―吧”之类归入类词缀的范畴;而又有人认为应坚持“从严不从宽”的原则,明确指出意义的虚化决不等同于意义的类化和泛化,所以只有“―性、―化”可以作为严格意义上的类词缀的典型代表。此外,还有人认为由于意义虚化难以确定,可操作性差,提出“应把意义虚化的说法改成‘脱离本义’”(于秒2005)。笔者认为这种提法仍很值得商榷。因为文中作者明确指出这种“脱离本义”包括两个方面,一是无词汇意义,二是背离了本义而属于非基本义,即引申义。首先,如果说一个语素没有了词汇意义就可以将其定为词缀,那么“白菜”中的“白”是不是也可以定为词缀了,因为“白”的语素义明显已脱落,但问题是我们没有人会将其当作词缀来处理。其次是关于引申义的问题,我们知道,汉语中一词多义的现象是非常普遍的,而且引申可以说是一词多义形成的重要机制,汉语中大多数的实词或词根都具有引申义,这是基于语言的经济原则而产生的。如果照文中作者的观点,背离了本义而产生了非基本义就成为类词缀的话,那么,汉语中大多数的实词或词根就都要归入类词缀范畴,这显然不合适。而且,作者还举了两组词来加以说明:
A人民性纪律性临时性共同性
B性变态性丑闻性解放性教育
作者认为A、B两组中的“性”都是词缀,对于A组中的“性”我们姑且将其看作是词缀或类词缀,但把B组中的“性”也看作是词缀就不太符合我们的语感了。而且,《现代汉语词典》(修订本)及第五版《现代汉语词典》都为B组中的“性”列一义项:有关生物的生殖和性欲的,并且第五版词典还明确将其注为名词(姑且不论其正确与否)。以上都表明将B组中的“性”看作词缀并不那么合适。由此可见,意义虚化标准虽然往往是我们最先考虑的标准,但它不能独立地来决定一个语素究竟是词缀还是类词缀,我们最多也就将其看成是一条最重要的参考标准。
(2)从形式上看,趋向于定位黏着。
汉语中的纯词缀如“老、儿、子、头”等基本上都具有定位性,而且定位性相对来讲可操作性较强,因此许多学者就将定位与否看作判断词缀或类词缀的重要标准。胡裕树主编的《现代汉语》(2005)就直接将词缀称为“不定位语素”,朱德熙(1999)也说“词缀都是定位语素,因此所有的不定位语素,我们都不把它看作词缀”。对于类词缀,的确大部分都趋向于定位黏着,如上面我们所举的“―性、―化”等例。但定位性同样不能孤立地作为一条判别标准,一是因为许多词根语素也都具有定位性,如“惦―:惦念、惦记……”“―艇:小艇、游艇……”等;二是既然纯词缀多具有定位性,类词缀也趋向于定位黏着,那么二者之间也就不好说有明显的界限了。换言之,单独的定位标准不能为词根、类词缀及词缀之间划出一条泾渭分明的界线。
(3)从功能上看,具有类化性和能产性。
我们这里所说的类化性指的是词缀或类词缀往往具有标记词性的作用,如加有后缀“儿”的词大部分是名词,只有少数几个如“玩儿、颠儿”是动词。类词缀也往往具有类化性作用,如有的学者认为加有类后缀“―性”的词多是名词,加有“―化”的多是动词。能产性指的是类词缀的构词能力较强。需要指出的是,王洪君(2005)特别区分了两种构词能力,一是构造已有词语的能力即组合能力;二是构造从未出现过的新词新语的能力,她称之为新生类推潜能。笔者认为类词缀构造新词的能力远比纯词缀要强,如“阿、子、儿、头”等纯词缀的组合能力很强,由它们构成的词绝对数量已很大,但在构造新词时却显得力不从心。类词缀不同,它具有很强的新生类推潜能。如“式”,汉语中许多VP和NP结构的后面都可以加“式”构成新词,有些甚至在一些新词新语词典中都未收录,如婚前结婚式、神前结婚式、西服背心式等等。但即便如此,类化性和能产性仍不能孤立地作为判断标准。尽管可以说类词缀的类化性比词根要强得多,但有些词根语素也存在着类化性,如“雨(yǔ)―”“―刀”构成的词均为名词;而且类化性无法区分词缀与类词缀。其次关于能产性则更不能看作是判断标准了,因为大部分词根语素都具有很强的构词能力,这一点只要对比一下几版不同的《现代汉语词典》就可以了解。也正因如此,能产性这条标准才更多地受到学者的批判。
(4)从语音上看,语音稍有弱化。
笔者认为这条标准同意义标准一样,也是“仁者见仁,智者见智”的,其主观性较强。例如张小平(2003)就曾指出:“一般情况下,汉语中的前缀一律读中音,除少数叠音后缀外,中缀和后缀都读轻声。其实汉语里与虚化关系比较密切的就是由原调到轻声的变化。……像‘―性、―化’等与原调值相比,我们很容易体会出它们在组合中的语音弱化倾向。”但于秒(2005)却又说“纯词缀确实在语音上有所弱化,但很多类词缀,如‘性’(人民性、瞬时性)、‘化’(现代化、西欧化)等,在语音上并未弱化”。由此可见,语音弱化标准也是因人而异的。
(5)各成分之间没有明显的句法结构关系。
这是有些学者提出的判断类词缀的标准之一。复合词与派生词之间最大的区别就在于前者有明显的句法结构关系而后者则没有。这条标准用来判断纯词缀与词根之间的界限比较适用,但用来区别类词缀与词根就显得有些力不从心。例如,有人就认为在“中性、酸性”等词中,“性”在《现代汉语词典》中具有实在的意义,同合成词中的前一个语素必然发生意义上的联系,所以它们应是限定式。其实这很容易理解,因为类词缀的词汇意义毕竟没有完全虚化,所以保留的那部分意义或多或少地显示出与另一语素的关系是很正常的。因此,笔者认为这条标准说到底与意义标准是相通的。
根据以上我们的分析可以看出,任何一条标准都不能孤立地作为判断类词缀的标准。那么是不是所有的标准综合起来就可以确定一个语素是否为类词缀了呢?也不尽然。如“员”也有人将其归为类词缀,但很显然它并不完全符合上面几条标准。即便是“―性”“―化”,在语音的标准上也还存在分歧。笔者认为,以上五条充其量可以看成是参考标准,我们没有必要将它们作为一种硬性的规定,然后把语素一个个放进去试,全都符合的就是类词缀,不符合的就要被剔除掉。如果这样的话,就极易陷入经典范畴理论的窠臼。其实,以上五条完全可以看作是类词缀的属性和特征,每个被我们看作是类词缀的未必享有以上的全部特征。以下我们试着分别运用经典范畴和原型范畴理论来分析现代汉语类词缀。
三、从认知语言学的经典范畴理论看现代汉语类词缀的判别标准问题
经典范畴又称古典范畴或传统范畴理论,最初是由古希腊哲学家亚里士多德提出的。该学说的基本假设是:范畴由范畴成员共同拥有的一组充分必要条件来界定;特征是二元的(范畴中的成员要么具有要么不具有该特征);不同范畴之间有着明确的界限;同一范畴内的成员地位是平等的,没有典型与不典型之分。
我们可以将类词缀看作一个范畴,因为它也是我们对客观事物分类的结果。如果以上的五条标准是缺一不可的,那么上面所提出的五个判断标准就是用来界定该范畴的一组充分必要条件。要判断一个语素是否属于类词缀的范畴,就要运用这个特征框架,看它是否完全具有以上五条特征。这样类词缀这一范畴中的所有成员就是平等的,没有隶属程度的差别,该范畴与词根和词缀范畴之间就有着明确的界限。但问题是,如果是这样,恐怕任何一个语素都不能进入类词缀的范畴了。由此看来,与其纯粹地将以上五条看作是判断标准,不如说它们是类词缀成员所具有的属性和特征。经典范畴理论是一种形而上学的范畴观,不符合辩证法的观点。所以到了20世纪50年代,维特根斯坦提出了家族相似性理论,在此基础上,拉波夫、罗施等人建立了原型范畴理论。
四、运用原型范畴理论分析现代汉语类词缀
原型范畴理论是在对经典范畴批判的基础上提出来的。该理论认为,范畴与范畴之间的界限是模糊的;范畴不是由一组充分必要特征来界定;同一范畴内的成员地位是不平等的,有典型成员和边缘成员之分,其中的典型成员即我们所说的“原型”(事实上是原型的实例),而边缘成员则往往会混入其它范畴类别。
(1)从共时的角度来看,构词成分不是一种特征范畴,而是原型范畴。各个构词成分之间的界限是不清晰的。我们从人们对某些语素的不同的归类中就可以看出来(如性、化),这也反映了人们的认知中存在的模糊性。陈维振、吴世雄(2002)曾指出:“区别一个范畴时,没有任何一个属性是必要的。”以上我们提出的五种属性都是类词缀的成员所具有的属性,但是其中任何一个属性都不是必要属性,这也就是为什么它们任何一个都不能孤立地作为判别标准。其中没有一个属性是类词缀的所有成员共同具有的,它们只有彼此之间才存在着共同性。有的成员可能具有较多的属性,因而在范畴中较为典型,是典型成员。但有些成员则可能具有较少属性,因而处于边缘地带,是非典型成员。例如“性、化”除了语音弱化标准有分歧外,它们起码具备了其余四条特征,因而是较为典型的成员。其次,就以上的五种属性来说,也存在着典型与不典型之分,其中的意义标准虽然不好把握,但又往往是人们最先考虑的标准,最具有典型性;定位黏着和类化性是较为典型的特征;而能产性对于类词缀来说则不那么典型。从共时的角度来看,构词成分这一原型范畴大致可用下图来表示(其中的虚线表示界限模糊不清,小圆圈表示各自的典型成员):
(2)从历时的角度来看,现代汉语的类词缀大多是由古汉语的实词或词根虚化而来的。汉语是非形态语言,实词虚化的过程是一个连续统。凌剑春(2007)说:“人们在对客观的这个连续体进行范畴化时,得到的相邻的两个阶段之间总会有一个中间范畴,具备两个范畴的某些特征,这种现象的存在就导致了两个相邻范畴的模糊性,产生‘边界模糊现象’。”以上这段话可以说解释了范畴之间存在模糊性及类词缀出现的原因——人们认知上的模糊,同时也说明了为什么有些语素难以归类,因为究竟相似到何种程度才能叫作“类词缀”也是因人而异的。杨锡彭(2004)曾举“者”一例,说“第三者”中的“者”是意义实在的(标记为者1),“学者、读者、长者……”的“者”比者1要虚化一些(标记为者2),“笔者”的“者”意义是虚化的(标记为者3)于是就有了下列的连续统:
以上所举的“者”是历时演变在共时平面上的显现,三个“者”从意义角度来考虑,虚化程度不同(者1<者2<者3)。注意这里的“者”虽标为者1、者2、者3,但事实上是同一个“者”,只是意义虚化的程度不同,为了方便才加以区别。我们不知道将来的者1、者2是否会再继续虚化,但可以得出如下结论:“者”会由词根范畴中的典型成员逐渐演变为类词缀和词缀范畴的典型成员。我们用下图来表示:
三个范畴之间的界限依然是模糊的,有交叉地带,其中“者”在演变过程中越靠近右边越接近词缀范畴的典型成员,越靠近左边越接近词根范畴的典型成员。由此可见,在从词根到词缀中间没有一条明显的界限,其间呈现连续的演化态势,其中有些边缘成员的属性还有待确定,这也就为类词缀的出现提供了契机。
结语
标准数据类范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


