语音信息范文
语音信息范文(精选12篇)
语音信息 第1篇
1 系统介绍
1.1 系统组成
本系统采用的语音检索系统结构[1],如图1所示。
对话系统搜索模型首先将游客的语音查询信息输入自动语音识别器(Automatic Speech Recognizer ASR),该模块将由声学模型(Acoustic Model AM)和语言模型(Language Model LM)组成。语音识别器用于实现语音到文本的转换(Speech to Text),ASR产生最好的一个识别文本结果。系统根据识别的文本调用搜索模块SQL Server引擎进行数据搜索。将符合条件的一个或多个数据信息进行显示,并将搜索结果语音播报给用户。
1.2 系统采用技术
1.2.1 语音识别
语音识别部分主要由两个部分组成:语音训练阶段与语音识别阶段,如图2所示,语音训练阶段是利用语料库中的语音信息,抽取其美尔倒谱参数MFCC的语音特征值,该参数考虑了人耳对声音信号的因素,能够较好的反映;以隐马尔科夫模型HMM为语音模型,依据数据统计原理,建立起语音参考模板。在训练阶段完成后,即可进入识别阶段,识别阶段将用户的语音信号抽取MFCC语音特征,为该语音创建识别模板。最后,将参考模板与识别模板进行对比,通过识别匹配原则寻求识别模板与参考模板中最相近的一个模板,从而实现语音信号的识别,实现从语音到文本的转换。
1)MFCC特征参数:美尔频标倒谱系数考虑了人耳的听觉特性,将频谱转化为基于Mel频标的非线性频谱,然后转换到倒谱域上。由于充分考虑了人的听觉特性,而且没有任何前提假设,MFCC参数具有良好的识别性能和抗噪能力。本系统采用42维的MFCC(12维的倒谱参数,1维的对数能量,1维的pitch和一、二阶倒谱参数)。
2)HMM声学模型:HMM是一种双重随机过程,而之所以称为隐藏式是因为其中有一组随机过程是隐藏的,看不见的,在语音中就如同人类在发声的过程中其发声器官状态是看不见的,好比喉咙、舌头与口腔的变化是不可能从可观测的语音信号序列看出来的。而另一组随机过程观测序列(Observation Sequence),本系统采用6状态的HMM表示的汉语音素模型,它是由状态观测概率(State Observation Probability)来描述在每个状态下观测到各种语音特征参数的概率分布。HMM的状态观测概率函数式bj(ot)是采用高斯混合密度函数GMM(Gaussian Mixture Model)来计算连续概率密度,因此每一个声音单元(本系统采用音素)皆有一组连续的HMM(GHMM)。
3)N-Gram的语言模型:本系统采用基于统计方法的适合大词汇量连续语音识别的Trigram统计语言模型,进一步提高文本识别率。为下一步检索提供更为优质的文本检索信息。一个词的N-gram的语言模型如式:
整个句子的概率表示为:
式中w1,w2,,wm表示组成整个句子中出现的每个词,参数n为n-gram统计语言模型的阶数,其值取决于模型的精度和复杂度,通过实验表明,n值越大,则对句子中单词之间的依赖关系描述得越准确,此时模型的精确度越高,但模型的复杂度也越大。本系统采用n=3,也即Trigram。于是,训练数据的句子中每个词出现的概率只与其前两个词有关,表示为:
在计算时,上式表示为:
c(wi-2,wi-1,wi)表示为该词序列出现在训练文本中的次数。但由于统计数据的稀疏性,必然会有c(wi-2,wi-1,wi)=0的可能。为此,应采用平滑技术(back-off和interpolated插值)来调整序列在训练文本中的分布概率。本系统采用插值方法。其表达式为:
λ为插值系数,对于给定的p(wi|wi-2,wi-1),可以在训练语料上运用Baum-welch算法计算得到插值系数λ(0<λ>1)。
4)Viterbi Search识别算法:系统采用Viterbi搜索方法获取最好的音节系列,作为识别的文本。
系统的训练与识别部分均采用HTK(HMM Tool Kit)[6]实现。HTK是一套功能强大的语音识别工具,可以将大量的语音用HMM训练后,加以识别。所以本系统采用HTK为识别核心。语料库中收录宾馆名称、宾馆价格、宾馆星级、宾馆地址的语音资料,并将其对应文本进行手工音素注音。训练阶段是实现语音的MFCC特征与文本音素依HMM的对应过程,完成HMM音素模板的建立。在识别运用部分将要识别的语音文件进行MFCC提取后与HMM音素模板,利用N-gram的语言模型,进一步完善识别文本。最后利用Viterbi Search算法,找出一个最相似的音节序列,进而确定文本。
1.2.2 语音理解/搜索(Spoken Language Understanding/search)
语音理解的目的是将用户的表述转换成相对应的语义。在语音搜索中所指的“相对应的语义”就是对数据库查询的关键词信息。由于用户在查询时所说的语句不可能严格按照语法要求,是一种口头的表述,如当用户选择宾馆名称查询时,按照要求用户只需要说明宾馆名称如“连云宾馆”即可,但用户可能会说“我想问一下连云宾馆,谢谢!”,而不只是“连云宾馆”。这样,就会造成识别文本与查询文本的错误对应。为此,本系统采用语音信息提示,告诉用户查询的语音表达方式,如按宾馆查询时,提示信息为“请说宾馆名称”,按宾馆星级查询时,提示信息为“请说出要查询的宾馆星级,1~5的数字”等。在文献[4]中,还提出了其它语音理解的解决方案。由于本系统只是一个初级性的语音检索,固没有采用像基于词类的N-Gram,填词法等语音理解技术。
1.2.3 语音合成
为了使结果查询采用多媒体方式输出,以提供更自然的人-机交互,系统实现能够将查询文字信息传化成连续的语音(TTS,Text to Speech),以提供高质量、智能化的语音服务的重要技术。首先将文字输入到TTS系统中,TTS系统在收到文字后,根据原有在语料库中的语音档案进行连音,调整长度,大小及声调的动作。本系统采用微软推出的TTS软件包,作为汉语合成时还要考虑声调因素。实现过程如图3所示。
TTS引擎属于Windows API外挂函数,它是一个Speech API程序。安装TTS引擎后,自动将类库文件Vtxtauto.tlb安装在Windows系统目录里的Speech目录下,从而将其导入语音库“Voicetext Type Library”中。形成库文件后,我们可以将TTS引擎作为一个外部工程从语音库中引入VB、VC等32位应用软件的可视化环境,在视图中的对象浏览器窗口观察分析TTS引擎所封装的类、类的成员函数、方法及各属性的意义,并在所开发的软件中嵌入TTS,编写出独具个性的语音合成软件。
2 系统设计说明
本系统采用VC++进行语音检索Voice Hotel系统的界面设计,其系统操作说明如下:
1)开始执行Voice Hotel,会以语音提示使用语音查询的方法。语音会提示在哔声后开始3秒录音,哔声响起,开始进行录音,此时,对着麦克风说出要查询的方式:“宾馆名称”、“宾馆价格”、“宾馆星级”、“宾馆地址”;如图4表示,说出“宾馆名称”。
2)经过系统识别后,激活相应的查询方式,语音回报用户要求的查询方式,并提示查询表述方式,准备进行查询关键字的语音录入;如图5所示。
3)语音提示在哔声后开始录音,哔声响起,对着麦克风说出要查询的关键字;如图6所示。
4)经系统识别后,将会在相应的查询方式处显示识别结果,并在检索结果处显示查询符合要求的结果,利用语音合成技术,将其识别结果及查询结果进行语音播报。如图7表示,识别结果为:金龙,进行结果显示。
3 实验数据及结果
由于本语音识别系统是采用最接近的句子作为识别结果,被识别系统资料的充足与否,平均每句的字数,都会影响正确率。系统采用字正确率作为系统测评指标的标准:。系统采用的训练数据说明,如表1所示,测试结果如表2所示。
从表2可知,本系统的识别率达到大约85%,基本达到一个初级语音查询的要求。
本系统的开发出基于语音和文字两种查询与输出的多媒体查询系统,它优于传统资料查询的文字输入、输出的方式,显示出人-机交流更加自然的特点。系统中核心的部分即为语音识别与语音合成部分。就该系统识别率而言,由于本语音识别系统采用最接近的句子当作为识别结果,被识别系统资料的多少,平均每句的字数,都会影响正确率。训练语音资料信息如下:其测试结果如下:实验数据表明,本系统的平均识别率约为85%。
4 结论
本文已实现了一个较为完整的语音宾馆查询系统,关键技术为语音识别与合成。由于系统只是一个初级的语音检索系统,所以在语音理解部分采用的是对用户的语音查询表述进行了严格的限制,今后可近将针对语音理解部分作进一步研究,以实现更自然的口语查询的目的,同时提高系统识别率。并提供多查询接入方式如电话方式的查询以及更加丰富输出结果如显示宾馆的地理位置等。
参考文献
[1]Ye-Yi Wang,Dong Yu,Yun-Cheng Ju and Alex Acero,An Introduction to Voice Search,IEEE Signal Processing Mag.[J],pp.30-38,May2008
[2]Yu D,Ju Y C,Wang Y Y,Zweig G,et al.Automated directory assistance system:From theory to practice[J].in Proc.Interspeech,Antwerp,Belgium,2007:2709-2712.
[3]Natarajan P,Prasad R,Schwartz R M,et al.A scalable architecture for directory assistance automation[J].in Proc.IEEE Int.Conf.A-coustics,Speech,and Signal Processing,Orlando,FL,2002:121-124.
[4]Yu D,Ju Y C,Wang Y Y,et al.N-Gram Based Filler Model for Robust Grammar Authoring[J].in Proc.ICASSP,2006(1):565-568.
[5]马强.嵌入TTS技术开发语音合成软件[J].电脑开发与应用.2004,17(4):18-19,22.
语音式农村信息服务系统的设计论文 第2篇
关键词:农村信息服务 语音式 公共电话交换网;
一、引言
为大力推进农业和农村的发展,提高农村信息服务的水平,近年来,国家出台了一系列推进农村信息服务的政策和指导性文件,为了积极响应这号召并解决农村的实际问题,建立适合于我国农村现状的信息服务系统已刻不容缓。本文重点讨论的以公共交换电话网为基础,充分融合和发挥通信技术、数据库技术和语音处理技术之所长,建立一套服务于农村的信息系统,使农村可以方便的使用该系统发布和获得农业信息,促进农业和农村的发展。
二、建立语音式农村信息服务系统的意义
当代社会,传统的信息交流模式与现代信息交流模式并存,会议、报纸、广播、电视、电话、网络等各种信息载体各显其能,特别是计算机网络在信息交流中的作用与日俱增,于是,许多地区相应建起了一批农村信息服务站,各级地方政府或当地村民也投入了一定的人力、物力和财力。在信息服务站计算机、打印机、互联网等设施俱全。应该说初衷是好的,但也有其不尽人意之处。以基于计算机网络的农村信息站其不足之处有以下几方面:第一,建设成本高。在农村建设一个信息站暂不考虑房屋使用和水电费用,假设按每一个信息站有6-10台计算机计算,设备费用也需要两、三万元。第二,目前,我国人口教育水平发展仍然不平衡,农民人口知识文化水平普遍低于城市,多数农民对信息技术知识掌握较少,不能熟练计算机,不能独立运用互联网进行信息检索,这给农民独立的信息站获取信息带来了麻烦 NULL)
其中,“流水码”作用该表的主键,由系统自动产生。“电话号码”在服务器接受呼叫时由电话语音卡通过来电显示进行识别并写入表中,该系统使用电话号码作为用户的标识,因此用户使用该系统时不需要进行用户注册,可随时拨叫随时使用。“交易类型”字段的域为“出售”和“求购”,“数量”字段记录对于农作物表示斤数,对于牲畜表示头数或只数。这里考虑到农民日常生活中习惯于使用“斤”作为质量单位,因此该系统中没有选用国际单位制的千克。“交易类型”和“数量”均在应用程序的控制下由电话语音卡识别用户按键发出的DTMF信号取得。“日期时间”字段记录此记录生成的日期和时间,由服务器自动,由计算机系统时间取得。系统操作及维护人员无需了解掌握系统底层信息交换的原理及过程只需通过服务器端的应用程序便能实现日常的管理与维护工作,包括信息的浏览、添加、修改、删除、条件查询、数据转储与恢复等操作。
2. 系统用户端的组成及功能
语音信息 第3篇
【关键词】初中英语 语言教学 现代信息技术
一、引言
在网络信息技术日益发展的现状下,国内各大学校在教学方法上也有了很大程度的变化。为了适应潮流的发展,将现代信息技术融入教学工作中具有非常重要的价值作用。初中英语语音教学是一项非常重要的工作,能够培养学生听、读、写的能力。为了提高初中生英语水平,在初中英语语音教学过程中充分融入现代信息技术便是一种不错的方法,这也是本文对两者有效融合进行论述的根源所在。
二、将现代信息技术融入初中英语语音教学的重要性分析
1.能够使语音发音不标准问题得到有效避免。在以往初中语音教学过程中,一般由教师作示范,然后学生跟着教师一起学,此类语音教学较为传统,不能与时俱进,也难以提高学生学习的积极性。例如,教师在语音教学过程中,发音不标准,便会进一步造成学生发音不标准。显然,这对英语语音教学质量的提升是极为不利的。倘若在初中英语语音教学中融入现代信息技术,则能够使语音发音不标准等问题得到有效避免,进一步为英语语音教学质量的提升提供充分有效的保障依据。
2.让教学方法实现多元化。以往在初中英语语音教学中所采取的教学方法显得较为单一,同时无论在时间上,还是在空间上,均会有一定的约束感,并且学生的学习兴趣很难得到有效提高。但现代信息技术融合了多项功能,充分利用现代信息技术学生既可以在学校进行英语语音学习,又可以在家里进行英语语音学习,从而使学习不受时间与空间的限制。并且,还可以借助现代信息技术下载相关学习资料,为英语语音学习质量的提升奠定良机。
三、初中英语语音教学与现代信息技术有效融合策略探究
1.借助信息技术使教学、训练实现一体化。在英语语音教学涉及的48国际音标,国内初中通常采取分散式教学法,这主要考虑到学生的适应能力。本人认为,分散式教学法周期较长,难以使学生及时有效地对完整的音标加以掌控。因此,采取集中教学方法显得极为重要。在集中教学过程中,需融入合理的训练,在借助现代化信息技术,如通过PPT制作,使学生对国际音标既直观、又形象地赏析。与此同时,可通过软件让学生下载相关语音资料,这便于学生随时随地进行学习,如应用最为普遍的Flash软件。基于整体层面分析,在初中英语语音教学过程中融入信息技术,需使教学与训练实现一体化,这样才能够使学生既快速又高效也掌握音标的正确读取等。
2.借助信息技术使音标、拼读、语句教学实现有机融合。初中英语语音教学过程中,音标教学、拼读教学、语句教学,都显得极为重要。倘若在初中英语语音教学中融入现代信息技术,则需要使上述三类教学实现有机融合,这样才能够使现代信息技术的价值作用充分展现出来。在英语课堂教学中营造良好的教学氛围显得极为重要。本人认为,在实际教学过程中,可将部分与教学内容相关的重点句型融入其中,同时融入交际用语,使学生与学生进行面对面的交流,借助一些有效的教学方法,如绕口令、脱口秀等。以绕口令为例,便可以通过信息技术中的多媒体,播放绕口令原句——“A big black bug bit a big black bea.”、“Wheres the big black the big black bug bit?”上述句子可以让学生跟着读,可以使短元音[i]与爆破音[b]的训练更具有效性。多媒体的融入,使得学生的学习兴趣大大激发,显然值得在初中英语语音教学中采纳及应用。
3.借助信息技术培养学生的语音语感能力。对于学生来说,学好语音是后续实现与人面对面交流的重要保障依据。为了使学生快速掌握语音学习,培养学生的语音语感能力显得极为重要。在这方面,可借助语音识别技术,通过波形比较学生发音是否标准,然后让学生认清自己的优缺点,进一步取长补短,达到完善自我的目标。与此同时,学生可以通过上述提到的绕口令,使自身的语感能力得到有效培养。还可以学唱英文歌曲,通过信息技术软件下载与初中英语语音学习内容及目标相适应的英文歌曲,使学生充分掌握英语的旋律,进一步提升语音语感能力。
四、结语
通过本文的论述,认识到在初中英语语音教学过程中融入现代信息技术具有多方面的价值作用。由于初中英语语音教学是一项系统化的教学工作,因此需借助信息技术,使教学、训练实现一体化,同时使音标、拼读、语句教学实现有机融合,另外使学生的语音语感能力得到有效培养。相信从以上方面加以完善,现代信息技术的作用将能有效发挥出来,进一步为初中英语语音教学质量的提升奠定坚实的基础。
参考文献:
[1]吴飞.现代信息技术在初中英语教学中的应用研究[J].科教文汇(中旬刊),2014,11:169-170.
[2]闫腾腾.初中生英语语音学习现状分析及对策[J].海外英语, 2014,21:111-112.
公路信息语音情报板研究与设计 第4篇
1、公路语音情报板简介
公路信息语音情报板承载着公路的各种信息, 包括里程、路况、地名、事故多发处、行驶引导、起止点、前方到达地等。这些信息通过设备, 发送给司乘人员, 使其及时得到相关的信息指导车辆的行进。
公路信息语音情报板有两大部分组成, 一是信息发送一是信息接收。信息发送设置在公路上, 接收装置放置在车里。当车辆走进发布范围内, 即可以接收到发送装置发来的信号, 打开播放器, 并开始播放发来的信息。指导车辆运行, 介绍公路的情况、当地的风景、旅游点、风俗等。司乘人员不必特别的关注路旁的信息牌就可以得到必要的信息, 这样即便是大雾天气、夜晚行驶也不发愁找不到信息牌。使得出行更方便, 旅途更充实。
公路信息语音情报板系统的基本构成
由一台服务器、路由器、防火墙、语音情报板发射和接收装置、光纤、移动通信卡构成的网络等。
公路信息语音情报板有固定和动态两种模式, 固定语音情报板的内容不变, 不需要连接控制中心。动态语音情报板通过光纤连接到控制中心, 随时根据实际情况更改信息牌的内容。
发射装置由接收端口、单片机控制电路、存储器、定时控制电路, 高频功率发射模块, 天线等组成。
接收部分由单片机控制电路、存储电路、天线、变频电路、放大电路、功放, 扬声器等组成。
公路信息语音情报板系统示意图
公路信息语音情报板设置
1.1 公路语音情报板位置的设置
固定公路信息语音情报板设置在需要提示的地方, 如叉路口、危险地段, 急弯连续转弯等其内容与所在地段相匹配, 位置容易选择。动态语音情报板含有车流信息、事故报告等内容, 原则上平均分配, 通行状况设在在车流变化的节点处较为适宜。路况动态语音情报板设置在道路入口、行政交界处、大的岔路口等。
1.2 公路语音情报板内容的设置
内容力求简洁明了, 尽量使用少的文字表达多的信息。道路指示类:用直行到X地, 左到X地右到某地。急转弯处用右30度急转左38度急转等。动态部分根据情况设置
1.3 工作方式的设置
工作方式有自动工作模式, 选择工作模式, 延时工作模式等根据不同的内容, 不同的要求选择不同的工作模式。
2、公路信息语音情报板设计
2.1 硬件部分
A、覆盖范围设计:公路信息语音情报板发射的覆盖范围, 决定车辆接收距离, 覆盖范围大, 车辆可以在较远的地方就接收到信号。提前知道情报板的内容。但是覆盖范围太大, 在公路信息语音情报板密集路段, 可能出现信号的重叠。造成干扰。所以要根据实际情况选择一个合适的覆盖范围。那么多大的范围合适呢?按平均车速80km/小时计算, 人对声音反应时间一般是一秒之内, 在对声音的内容进行分析用一秒的时间, 然后到动作, 合计在三秒左右, 三秒钟车辆行进了3X80000米/3600=23米, 在距离公路信息语音情报板30米前就应该接收到语音信号, 为了确保驾驶员能够有足够的反应时间一般选择50米的覆盖范围。
B、天线设计:天线增益大小, 天线角度大小, 现场环境阻挡情况下面就如何提高语音情报板的覆盖距离从以下几个方面加以注意:1.检查天线的周围是否架设有其他们的天线或者其他对天线有阻挡的装饰、建筑物等, 它他可能对天线的接收和发射产生影响, 影响的覆盖效果。因此语音情报板天线应尽可能架高、开阔。2.语音情报板天线应尽量垂直于地面, 安装要牢固, 防止被风吹歪, 以免造成天线垂直极化的变化, 影响语音情报板的覆盖范围。语音情报板采用自动过滤噪声具有自动避让功能的电路, 避免同频率同时发送而干扰, 工作稳定可靠。
C、公路语音情报板电路设计 (篇幅所限图纸从略)
(1) 固定情报板设计
固定情报板有两种, 一种是定时发送, 每到一定的时间段或者间隔一定的时间发射一次。一种是检测发射, 即检测到有车辆到来时, 触发器动作向外发射。定时发射电路简单但是针对性差, 适于作道路指向, 景区介绍, 前方地名介绍等。检测发射, 设备相对复杂但是针对性强, 节约电能, 适于作转弯路段、穿村路段、易塌方、易落石等危险路段的提醒。
固定情报板, 由单片机控制、车辆检测、信息接收、数据存储、信号放大、功放输出等组成。单片机用于控制信号车辆检测、信号存储, 接收模式, 分析判断信号大小, 根据判断界定情报牌的边界。固定语音情报板的语音信息是事先由输入设备输入的, 由存储电路保存着这些语音信号。当车辆路过时, 车辆检测电路发现车辆得到来, 接收车辆进入有效距离的触发信号, 触发电路动作, 将存储的语音信号经数模转换, 将数字语音信号转变成模拟信号。送放大器把信号放大。同时控制发射部分工作, 推动功放发射输出, 向外发射电波。
(2) 动态情报板设计
由单片机控制、车辆检测、信息接收、数模转换、信号放大、功放输出等组成。单片机选用Microchip Technology (美国微芯科技公司) 的6引脚封装单片机.机内有精确4 MHz内部振荡器、33条指令、两级堆栈、拉/灌电流为25毫安的I/O、低功耗休眠电流 (100纳安) 、2至5.5伏特的宽电压工作范围、一个8位定时器、一个看门狗定时器、在线串行编程技术、上电复位、节能休眠模式。可在嵌入电路板后编程。该单片机接收端口通过网线网卡连接到存储器, 用于控制信号车辆检测、信号存储, 接收模式, 分析判断信号大小, 根据判断界定情报牌的边界。动态语音情报板的语音信息是控制中心用网络通过光纤传送过来的。由接口电路处理, 将接收控制信号和语音数字信号转换成语音情报板适合的幅度和形式。由存储电路保存语音信号。当车辆路过时, 车辆检测电路发现车辆得到来, 由触发电路动作开启发射。定时控制地址指针移动, 当移动完成后将指针所在处存储器的内容取出, 存储的语音信号经数模转换, 将数字语音信号转变成模拟信号。编码。送放大器把信号放大, 推动功放发射输出。经天线把信号发送到空中。
(3) 车载接收部分
单片机控制电路控制信号的存储和播放模式的转换, 接收器可以实现筛选收听顺序收听选择收听。播放模式有自动播放、选择播放和延时播放等模式。自动播放模式是自动的播放所有语音情报板的内容, 信号顺序经数模转换电路转换成模拟信号送放大器、功放, 驱动扬声器发出声音。选择播放可以根据操作者的操作进行播放, 当认为不需要时可以跳过, 延时播放时当司乘人员没有时间收听情报板的内容, 但是又需要的信息, 可以推迟到某个时间在播放。
天线接收空中的电磁信号, 送放大电路将信号放大, 解码, 存入本地存储器, 信号分析电路根据信号强度判定接收对象, 同时屏蔽弱信号, 保证主信号在无干扰, 控制器将接收的内容送显示器供司乘人员选择, 调谐电路微调接收频率。信号经高频放大电路、变频电路、中频放大电路、检波电路, 将高频信号还原成音频信号, 经音频放大电路、功放电路输出到扬声器。
2.2 软件部分
软件部分分为单片机控制软件和公路信息语音情报板系统软件。单片机软件由汇编语言完成, 主要是嵌入到发射部分和接收部分的硬件中。用于接受指令控制情报板的动作等于硬件相关的操作。
公路信息语音情报板系统软件由高级语言编制, 放在服务器中主要完成接收各种道路信息分析判断信息所放的位置, 形成播报的内容, 由控制中心对各个语音情报板的信息注入等工作。宏观控制道路的语音情报板的显示。
3、结束语
语音情报板是一种新型的道路信息传送设备, 它丰富了交通信息的获得方式, 简单的直接的用语音给公路使用者传达信息。避免了现有情报板在雾天、大雨天气等不便于观看的情况下不能获得交通信息的弊病, 使智能化交通更加完善。
摘要:语音情报板是现代化智能交通的需要, 它丰富了交通信息的获得方式。简单直接的用语音传达信息。在雾天、雨天等不便于观看的情况下也能准确的获得交通信息。使智能化交通更加完善。
语音信息 第5篇
语音偏误标记与语音对比-谈泰国学生语音习得问题
基于在泰国的教学实践,文章归纳了泰国学生区别于其他国家学生的语音偏误标记,并借助汉语和泰语的.语音共时层面的对比,分析泰国学生在汉语语音习得过程中由于母语负迁移和目的语干扰所造成的“化石化”难点,并提出了有针对性的解决方案.
作 者:陈晨 李秋杨 CHEN Chen LI Qiu-yang 作者单位:陈晨,CHEN Chen(湘潭大学,外国语学院,湖南,湘潭,411105)李秋杨,LI Qiu-yang(中央民族大学,语言文学系,北京,100081)
刊 名:云南师范大学学报(对外汉语教学与研究版) 英文刊名:JOURNAL OF YUNAN NORMAL UNIVERSITY TEACHING AND RESEARCH ON CHINESE AS A FOREIGN LANGUAGE EDITION 年,卷(期): 6(2) 分类号:H195 关键词:语音偏误标记 汉泰语音对比 化石化浅析英语语音教学中的英汉语音差异 第6篇
【关键词】英汉 语音差异 语音教学
【基金项目】本文系贵州省教育厅教改重点项目“汉英语音课改革与实验研究”(12333)研究成果。
【中图分类号】H311【文献标识码】A 【文章编号】2095-3089(2016)07-0097-02
语音是语言的基本物质外壳和表达手段,英语与汉语作为目前应用最广的两种语言,在语音学方面有一定共性,在语音系统、音位系统及节奏韵律方面都有一定相似之处,明确英汉语音的差异对于更好的学习不同语言有重要意义,有助于解决英语语音学习这个难点,减少发音错误。因此明确英汉语言差异有助于更好的指导英语语音教学工作的展开,对于提升英语语音教学质量有重要价值。下面对英汉语音差异及英语语音教学进行分析探讨。
1.英汉语言对比
汉语音韵学主要由声母、韵母和声调组成,音节开口为声母,声母之后为韵母,韵母包括元音及辅音,其中韵母组成部分主要为元音,但并不等于原因,声母主要由辅音充当,汉语字音开口无辅音的话,被称为零韵母。
1.1英汉元音对比
元音是气流振动声带,在口腔没有受到阻碍而形成的一类音节,各种不同的元音音质是由舌位的高低、前后以及双唇的园展撮不同形状所造成的。元音的不同是由共鸣腔造成,决定元音发音的主要有三个方面,舌头往前伸还是往后缩;嘴唇撮起来还是展平,嘴张的大小或者舌头的高低,嘴张得越大舌头位置就越低,相反张得越小舌头位置越高。英语元音系统主要由12单元音和8双元音构成,元音20个分别为前元音/i:/、/i/、/e/、/?覸/;中元音/?誻:/、/?藜/、/?蘧/,后元音/u:/、/u/、/?蘅:/、/?鬑/、/a:/;汉语韵母系统则主要由6个单韵母、13个复韵母及15个鼻韵母构成,韵母39个以a、o、e……ong、iong等为主。按开头元音发音口形可分为开口呼、齐齿呼、合口呼、撮口呼,比如开元音/i:/、/a/、/o/、/e/,双元音/ia/、/ie/,闭元音/u/、/ua/等。要注意两种语言中相似但是不同的元音,尤其要注意汉语中所没有的英语元音,在英语元音发音中注意松紧的对立,注意到长短的区别,避免将汉语中没有松紧、长短区别的较长较紧元音发音习惯带入。要注意英语双元音由第一个元音划到第二个元音算一个单位,具有前长后短、前重后轻、滑动明显等特点,避免汉语双元音习惯的带入。
1.2英汉辅音对比
辅音作为英汉语言的重要构成部分,在发音中占据重要地位,辅音是盛强中气流受阻所形成的一类发音,其音质同发音部位、发音方式密切相关。汉语辅音以声母为主共计21个,英语辅音28个,主要以齿龈音t、d、s、z,腭音sh、ch,舌根音k、g、ng,唇音p、b、m,唇齿音f、v,齿间音th等为主,后根据发音时声带是否振动还有清浊之分。英语的强弱辅音与汉语的送气、不送气辅音,英语辅助浊音多清音少,清浊或强弱的区别在于英语中具有辨别意义的功能,但是送气、不送气的区别不影响意义,汉语辅音清音多于浊音,送气与不送气起着区别意义的作用。比如齿龈音/s/思、四,/z/资、自,/c/、/ts/次、此,腭音/?蘩/、(sh), /r/、/?廾/以及流音/r/,舌根音/h/喝,河,和,/t?蘩/、/d?廾/,(ch)和/d?廾/、(zh)等。汉语中的z不同于英语中的/z/,英汉辅音中r和/r/、h和/h/、w和/v/发同音,汉语中的j、q、x、zh、ch较为特殊,英语中的/d?廾/和/t?蘩/发同音,英语辅音群如/st-/、/kl-/、/-pt/、/-tl/不能在其中加元音。
另外,还要注意英汉语言在音节结构上的区别,音系学层面来看,语音要素在汉英语中具有不同价值,音高、音长、音强、音质四要素均各有特色,汉语对音高敏感,是声调语言,英语对音强敏感,是重音语言,在发音训练中一定要把握好音高与音强的区别,从而做到准确发音。
2.英汉语音差异下英语语音教学探究
2.1提升英语教师语音素养
要立足于英汉语音差异强化教师语音素养及教学技能的提高培训。要针对一线教师常见英语语音问题展开培训,以高度浓缩语音教学内容为主,从音长、口型和舌位示范音素发音入手进行练习,并在词和语境中的音变进行训练,着重于中英易混音素和英语特色音素的指导和训练。从louder,longer and higher三方面结合音乐韵律进行节奏训练,在语境中体会六种不同语调表达的意义差异,利用重音、连读和停顿体现节奏的强弱和意义的变化。
教师语音培训中要以各类丰富多彩的活动为主线,从音素、音节、重音和节奏的教学方法入手,引导教师们举一反三,通过设计不同的语音教学实践活动提升参与性与积极性,并指导教师运用所学结合英语教材设计语音教学片断,并进行展示和评价。
2.2创新语音教学方法
语音是语言教学的基础,英语学习中只有学好语音、打好基础,才能够更加轻松的完成日后的英语学习,教师要巧妙设计多种创新教法,积极运用各种辅助教具配合科学有效的方式完成英语语音教学。比如教师可利用Missing card将所授音标进行展示,利用互动游戏让学生识记音标并调动学习兴趣,在掌握音标的基础上训练学生英语思维和发音,使其集中注意力,真正做到学中玩、玩中学。教师可以组织Finding the good friends等类似游戏,进行英语清辅音或浊辅音的训练应对及短元音或长元音的训练应对,练习学生对比发音的同时培养其快速反应能力,要积极设计多种音标操练游戏,利用简单易操作的游戏激发学生学习英语语音的兴趣。
教师可通过设计面对面发音或者传递口型等互动活动,让学生们仔细观察不同英语发音的唇形、口型及发音部位,及时发现自己及他人错误,纠正不良发音习惯,真正以学生为主体做到会学。利用口型传递让学生对音素之间口腔张合度、唇型、舌位及舌位高低的变化和差异有一定认识,配合面对面发音的机械练习进一步增强学习趣味性与娱乐性,配合教师引导掌握英语准确语音。此外,英语绕口令、角色扮演等也是有效教学方法,比如“Can you can a can like a caner can can a can? ”简单的绕口令可以让学生了解到英语发音中意群、连读等的重要性,帮助学生建立发音学习的兴趣,让发音器官更加灵活,帮助学生辨音和发音。角色扮演可引入英语原声电影欣赏等方法,通过听电影原声模仿台词让学生进行语调练习,以经典的电影作为听力教材,利用正宗地道的英式或美式口语展开模仿练习,从而把握语调与情感,运用所学的语音知识如语调、重音、连读、爆破等进行模仿发音,在实践中发现更多更加适合自己学习语音的方法,除此之外学唱英文歌曲、对话练习等也是有效手段。
2.3强化英语语音训练
英语语音教学中要通过强化语音训练帮助学生克服各种错误的语音现象。要严格把好音标关,音标是学好英语的前提,音标基础的好坏决定了语音、语调的好坏,打好语音基础对于提高学生的听力水平和英语口语会起到事半功倍之效,因此必须着力培养学生英语口语正确发音习惯,为长期英语学习打下良好基础。
要引导学生加强英语朗读技巧的训练和培养,教师要引导学生有意识地输入诸如语句重音、节奏、弱化、连读以及语调等知识并加以模仿,极大程度上减小自身发音和标准英语口语发音的差异。通过不断的训练,掌握英语语调的调式,了解不同语调调式所代表的差异化意义;通常情况下,可以用降调、升调、降升调来划分英语基本调式,一般在陈述句、特殊疑问句、祈使句、感叹句等句型中运用降调,如“She is beautiful.”“How smart he is.”,用于表述事实,或者表达肯定语气。在请求、道歉、打招呼等句型中则主要运用升调,如“Is she a good girl?”“You like English?”,表达一种建议、责怪或者怀疑等。而在含有对比意义的陈述句、表达反驳意义的陈述句中则主要运用降升调,如“Mary isnt my wife. But…”将对比、含蓄或者言外之意表达出来。此外,为进一步提升英语语音训练效果,还要帮助学生增进对英语背景文化知识的了解,使其学会地道纯正的英语口语表达,通过深入了解英美国家文化和生活习惯,提供给学生一个真实的语言环境,将英语国家的习俗文化渗透到学习过程之中,培养学生的英语思维能力,从而更有利于其养成正确的英语表达习惯,练就纯正英语语音及口语表达。
3.小结
综上所述,英汉语音差异的存在对语音学习造成一定影响,要立足于英汉语音差异,积极采用多种有效手段改进语音教学,减少学生语音发音错误,提升发音准确性,以促进英语语音教学的进步。
参考文献:
[1]钱虹.迁移理论视域下的英汉语音对比及英语语音教学浅析[J].台州学院学报,2015(1):20-23.
[2]张玉鹏.语音对比与英语语音教学[J].安阳工学院学报,2015(5):101-104.
[3]廖立夏,王蔚嘉.高校英语语音课中的英美发音差异教学研究[J].教育,2015(2):208-208.
[4]刘晓然.英语专业基于合作学习的语言教学与传统语音教学的对比研究[J].齐鲁师范学院学报,2015(2):32-36.
[5]李斯斯.基于母语负迁移现象的英语语音习得研究[J].长春教育学院学报,2015(3):88-89.
作者简介:
语音信息 第7篇
报业数字交互语音媒体作为报业运营的一种数字新媒体,报业一定会把握好这个新媒体的政治属性和文化属性,创造良好的社会效益。在保证社会效益的同时,报业还必须关注这个新媒体的经济属性兼顾其经济效益。事实上,经济效益的好坏往往是这个新媒体能否健康发展的决定因素。
呼叫中心一般都是一个企业或单位的“成本中心”,如何使这个“成本中心”变为“利润中心”,本文就数字交互语音媒体的信息服务和赢利模式进行探讨。
数字交互语音媒体的特点和提供的服务
社会公众对信息和知识的需求是多种多样的。数字交互语音媒体以满足社会信息和知识需求为出发点和落脚点,这就要求数字交互语音媒体依据自身条件,为社会提供多种多样的信息和知识服务。
数字交互语音媒体推出一项完善的服务功能是一个艰巨复杂、日积月累、循序渐进的过程,但真正踏踏实实做起来也远没想象的困难。为开展一项业务,首先要搜集整理学习并掌握这项服务的相关理论和知识,按照数字交互语音媒体的架构,建设该项业务所需的信息和知识仓储系统、知识转换系统和交互系统,其次是对座席人员进行系统培训。
囿于条件所限,对那些一时难于建设信息和知识仓储系统的业务,我们可以充分利用互联网的资源来开展。对有些业务,数字交互语音媒体还可以充分利用丰富的社会资源,与社会专业部门或职能部门合作共建来开展。
虽然数字交互语音媒体可以提供很多信息和知识服务,但它也有其自身的局限性。比较突出的是,它对提供系统信息和知识服务是比较欠缺的。我们很难想象人们通过它来学习数学、语文或其他任何一门系统知识。数字交互语音媒体的优势在于信息和知识的查询、业务咨询、信息中介等。我们对数字交互语音媒体应该扬长避短,依据自身优势来开展服务。
对繁繁总总的事物,人们都要进行梳理和分类。对数字交互语音媒体提供的服务我们也想进行详细的分类,但由于数字交互语音媒体的服务是包括人与人直接实时互动的信息服务,一次信息服务可能会包括很多类型的信息服务,这使分类变得十分困难。比如有人询问某一公司的招聘情况,这是一次典型的查询服务。由于该公司招聘行为已结束,他极可能会问是否还有其它公司在招聘,座席人员据他的要求提供一些相近的招聘情况后,还提供一些非常有建设性的就业参考。根据具体情况,座席人员甚至可能给他提供一些关怀。其实上面这样一次完整的信息服务,包括了信息查询、业务咨询、业务指导、人文关怀、中介服务和广告服务等等。
机械地划分信息和知识服务类型的意义并不大,问题的关键是数字交互语音媒体要能为公众提供符合他们需求的、高质量的、全面的、综合的、系统的信息和知识服务才是问题的根本所在。
数字交互语音媒体面向社会可提供的主要服务有:新闻信息查询、公众信息查询、法律咨询、综合调查服务、广告投放效果追踪、行风评比、社会投诉、旅游咨询、公交车次航班查询、政策法规查询、健康医疗咨询、票务服务、饭店和酒店查询及预订、家庭装修咨询、求职招聘、房产中介、家政服务、产品咨询、商家销售咨询、分类广告、影院放映信息查询、诗词查询、字词查询、英语语句翻译、谜语谜底查询等等。数字交互语音媒体还可以提供很多纯公益性的社会服务,如寻亲热线、失物招领等。遇到重大活动或遭遇突发事件,数字交互语音媒体还可以作为政府或社会的热线电话。
赢利模式
国内今晚报、扬子晚报、河北日报、文新集团、现代快报等多家报社的呼叫中心或数字交互语音媒体都探索了大量的可操作的赢利模式,如通信费分成、电信增值、电话销售和配送、座席外包等等,并取得了良好的效果。
每个报社自身的实际情况千差万别,每个报社所处的环境各式各样,适合某一报社的赢利模式多种多样,非要给出一个统一的、固定的赢利模式是不现实的。数字交互语音媒体的赢利关键在于创新,下面我们举三个简单的例子来说明如何从业务活动中觅出商机,愿能给大家带来一些启发。
业务咨询类
随着人民生活水平逐步提高,很多家庭的住房得到改善,家庭装修成为人们生活当中一项重要的活动。家庭装修涉及风格的选择、整体设计、材料的遴选和采购、施工等方面,它是一个复杂的“系统工程”。
家庭装修市场上,瓷砖可谓琳琅满目,价格迥异,质量也参差不齐。劣质瓷砖不仅质量差,有些瓷砖的辐射可能超过国家标准影响民众的健康。对这些琳琅满目的瓷砖,一般家庭一时是无法甄别其良莠的。所以社会和公众对家庭装修咨询是有殷切的需求。
数字交互语音媒体把家庭装修的综合知识、家庭装修产品的质量、价格、销售网点、售后服务等情况搜集整理,建立家庭装修咨询的信息和知识仓储系统,对座席人员进行了系统培训后,就可以开展惠民便民的家庭装修咨询。
在某次家庭装修咨询中,民众询问瓷砖相关情况。依据仓储系统的支持,座席人员为民众提供瓷砖质量等级、销售价格等详细情况,并把适合当地条件的、符合当前家庭装修趋势的、性价比高的产品作为建议性的意见提供给民众。
从上面咨询的过程中可以看出,在为百姓提供优质的咨询服务过程中,数字交互语音媒体可以挖掘出很多商机。只要我们的服务能得到老百姓认可和拥戴,那么瓷砖的生产厂家、销售网点,甚至家庭装修施工单位都会愿意与数字交互语音媒体合作,实现双赢。如果报社拥有家庭装修公司,甚至可以把业务延伸到家庭装修服务。
一般情况下,数字交互语音媒体可面向社会提供健康咨询、法律咨询、产品咨询、出行旅游咨询等业务。在向社会提供这些咨询的同时,可以向社会推介信誉好、质量好、服务好的医院、律师事务所、产品生产经营厂家、旅游公司等,在架起供需双方交流沟通桥梁的同时,还可以收获相当的经济效益。
中介服务类
中介在社会中起着合理调控社会资源、促进社会资源利用最大化的重要作用,是我国市场经济中非常重要的组成部分,是非常有发展前途的朝阳产业。中介最突出的作用就是桥梁和纽带作用,而这正与数字交互语音媒体的优势相契合。数字交互语音媒体可开展求职招聘、劳务、家政、房地产、二手交易等中介信息服务,下面我们以求职招聘中介信息服务为例来说明。
相对于报纸的招聘或求职广告,数字交互语音媒体的求职招聘信息中介服务具有明显的优势,一是它提供的求职招聘是24小时的实时服务;二是无论招聘方或是求职方,只要拨通电话说明需求后,他获得的是数字交互语音媒体提供的人性化的主动服务,而不需要花很多时间在报纸上搜寻信息并进行遴选和甄别;三是在计算机信息系统的支持下,它提供的服务是针对性很强的个性化服务;四是由于数字交互语音媒体是信息产业链的最上端,相对于报纸广告,它的费用低但效益高。考虑到求职招聘的市场规模,只要服务做得好,即使只从招聘方收取合理的费用,这项业务的经济效益也会十分明显。
当前国内规模化、综合性的中介公司还不多,报社可以根据自身情况和发展的目标,在数字交互语音媒体平台的支持下,有选择地直接开展一些中介业务,拓展报业的产业链条。
公众信息查询类
民众需要了解和获取的公众信息很多,但到目前为止,社会上没有一个机构可以提供较为全面的公众信息查询服务。数字交互语音媒体开展公众信息服务既可以便民惠民,也可以从中寻觅商机。
我们以影院放映信息查询为例子。晚饭后我们想到某电影院看场电影,先要查询电影院的电话,可查询到的极可能是影院的办公电话,且下班后早已无人值守,最后几经周折才能查询到影院的放映信息。如果数字交互语音媒体能提供影院放映信息服务的话,它的电话号码家喻户晓,而且是24小时随时可以提供咨询,优势自不待言。在实践中我们发现,只要我们牢固树立为民服务的意识,把服务做好,影院是非常乐意提供合适的费用进行合作。
产业拓展
数字交互语音媒体拓展产业链有两个扎实的基础,一是报业拥有丰富的信息资源,二是报业具有巨大的品牌价值,三是报业拥有别人不可复制的媒体群优势。
数字交互语音媒体在做好各类信息服务的同时,必然会聚集大量的、实用的、有价值的信息。这些信息除了自己本身拥有价值外,它可以衍生出很多的价值,大量汇聚的信息可以成为报业产业发展的倍增器。
国内报业集团的品牌价值一般都是以10亿人民币为单位计算,但这巨大的品牌价值在合理有效物化之前都是虚拟的。品牌只有与产品生产、销售或服务等业务活动有机结合起来,并完成其营销过程,品牌价值才能得到体现。
数字交互语音媒体的经营活动中,要充分利用报业的社会影响力和公信力,对那些有益社会的、积极的、能带来经济效益的、有助于报社品牌提升的业务活动都要大力扶持和支持,实现报社品牌价值的转换。
数字交互语音媒体在做好信息和知识服务的同时,依据数字交互语音媒体的技术优势、信息优势,结合报业拥有的媒体群优势,大力推进报业产业链拓展,以信息化带动报业产业链的延伸和扩大,比如开展实际的业务咨询、配送、社会服务、中介、票务等业务活动。
数字交互语音媒体的发展
如上面所述,数字交互语音媒体从开展的业务中都可以挖掘出很多商机,但要实现规模化的赢利,需要做到以下几点:
1、数字交互语音媒体从外部看,它必须要具备这样的特征:它提供的信息和知识既是准确的、可信的、细化的、概括的,又是优化的、系统的、全面的。
2、从内部看,数字交互语音媒体必须以服务社会和民众为其根本宗旨,以先进的理念和文化为依托,开拓创新,以健全高效的体制和机制按其发展规律来运营发展。
3、报业必须高度重视数字交互语音媒体的发展,把它当成报业新兴媒体、新产业、新经济增长点来培育发展,尤为重要的是大力促进报纸、网站和数字交互语音媒体相互协作和支持。
数字交互语音媒体和平面媒体具有很多共性,只要我们能越来越多地向社会提供及时、准确、有价值的信息和知识,对社会的贡献越来越大,在社会政治经济生活中的影响越来越大,获得的经济效益就会愈来愈好。
结束语
基于信息安全考虑的语音滤波器设计 第8篇
语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等新兴领域应用的核心技术之一, 它主要包括语音通信、合成、识别和语音增强等方面。然而人们在获得语音信号的同时, 不可避免地会受到各种噪声或其他说话人的语音干扰。同时, 随着人们对信息安全要求的提高, 在混合语音信号中提取出真语音信息的需求也随之增加, 为此, 语音分离技术的运用也就广泛增加。混合语音信号的分离是该技术的研究初衷, 也是信号处理领域中的一个难题, 涉及问题很多, 方法各异。本问所要研究的内容就是制作滤波器来实现信号的跟踪分离。在比较各种自适应算法后, 本文选择了LMS算法的自适应滤波器进行设计。
2. 相关研究
2.1 自适应滤波器
自适应滤波器的结构是多样的。广义上讲, 任何可以针对信号的实际情况对系统结构作出调整的滤波器都是自适应滤波器。这里给出一种常用的自适应滤波器算法原理:
它用输入信号的线性组合, 去逼近输入信号, 然后, 根据逼近误差, 利用自适应算法调整各个加权系数, 使得输出的误差信号在最小均方误差意义上达到最佳。其中:被称为输入信号, 它是系统接收到信号。一般情况下, 它是由有用信号和干扰信号两部分组成, 即被称为参考信号, 它一般包含有干扰信号的某些信息, 但是不含有有用信号的信息。这里N个参考信号的取得方法因各种应用不同而异。
2.2 自适应滤波器的最佳权系数
由以上分析可以看到, 自适应滤波器的关键问题就是如果根据误差信号, 计算出最佳的加权因子。最佳加权系数计算如下:
为了求出使得均方误差最小的加权矩阵w, 可以将上式对每个分别求偏导并令其等于零, 求解联立的N个方程, (或者也可以将均方误差对矢量w求导) , 可以得到:
2.3 LMS自适应算法
LMS自适应算法的基本思想, 是通过逼近搜索, 经过多次迭代运算不断修正加权系数, 使得系统逐渐达到最佳。
2.3.1 最速下降法
最速下降法是求解函数极值点的一种快速修正方法。它从某个起始点起, 按照函数的导数的大小调整极值搜索的步长和方向, 逐步找到极小点。这种算法对二次型最为有效。其基本公式为:
假设时刻计算出的加权系数为 (这个值不一定在最佳点上) , 在此基础上搜索公式应该为:
这里的是一个参数, 称为收敛因子。
2.3.2 LMS算法
上面的最速下降法公式在使用中还有一些问题需要解决: (1) 这里存在则求统计平均计算, 不容易实现, 一般将其直接用本身代替。 (2) 相应的将对求偏导的过程也直接改为对进行:
所以:
这个等式表示了一个不断用现在时刻的输入信号x (t) 和误差信号的值, 对加权值进行不断调整的过程。通过不断的跟踪, 最终使得系统达到最佳。因为这里用误差直接代替误差的平均值, 所以相应的系统性能并不能够完完全全地达到最佳, 而是按照一定的规律在最佳参数附近扰动。扰动的幅度由收敛因子决定。在LMS自适应算法中, 收敛因子的取值对系统的性能有着很大的影响:
如果取值大, 在搜索过程中的速度也会加快。但是, 收敛以后系统参数受误差的影响也会增大, 系统的滤波性能也会下降。如果取值小, 收敛以后系统参数受误差的影响也会变小, 系统的滤波性能也会有所改善。但是在搜索过程中的收敛速度会变慢。可见, 系统的滤波性能与收敛速度之间是一对矛盾。在实际应用中, 收敛因子应该根据实际需要选取, 不可过大或者过小。在实际应用中, 还有一种改进的LMS算法。它在系统运行的初期采用较大的收敛因子以加快收敛速度, 后其则采用较小的收敛因子以改善系统的滤波性能, 由此调和两者之间的矛盾。
3. LMS算法实现同步跟踪滤波器设计
3.1 设计概述
LMS算法是在Matlab试验平台上进行试验验证的, 根据上述LMS算法的原理编写了Matlab程序在此需要说明的是滤波器的各个输入量的对应关系。在滤波器结构中讲到系统接收到的信号:
a) d (t) 作为为滤波器的输入信号, 它是由有用信号和干扰信号两部分组成, 即d (t) =s (t) +n (t) ;
b) 为参考信号,一般包含系统接收到的信号中,某一成分的信息;
c) y (t) 自适应滤波器的输出信号, 当滤波器进入稳定状态时, 它就是d (t) 中所对应的信号估计值;
d) e (t) 是自适应滤波器的输出误差信号, 当滤波器进入稳定状态时, 它给出了d (t) 中另外成分的估计值。
在试验中以上几个信号的意义解释如下:d (t) 为滤波器的输入信号即系统接收到得信号包含s (t) +n (t) , 其中s (t) 为大语音信号起保护作用的信号, n (t) 为小信号语音为被保护的语音信号, 在信道中只能听到大信号语音s (t) ;为参考信号, 是大信号语音在本地的存储实际上就是s (t) 发送前的信号;y (t) 为估计出的大语音信号s (t) ;e (t) 及为分离后的语音信号。
3.2 自适应滤波器的改进设计
上一节所介绍的滤波器的设计在初步试验阶段能够完成对测试语音的追踪分离, 但本地信号与接收信号的时延可能是成百上千个采样点, 上面提到滤波器的阶数必须大于时延采样点的个数才能完成矫正追踪。但是滤波器的阶数不可能达到数千, 这样的设计显然存在不合理的地方需要改进, 本节即讲述如何解决这个问题完成对语音信号的追踪分离。
解决滤波器阶数不能过大问题的方法就是把时间的矫正与幅值的矫正分开进行。先采集一段数据, 数据长度大于时延长度, 计算相关性找出相关峰的位置记为时延大小;对齐时延后再送入滤波器矫正幅值的大小即可, 此时滤波器的阶数取30就足够了。
其中:d (t) 为接收信号;s (t) 为本地参考信号;a*s (t-t0) 为本地参考信号的延时降幅;n (t) 为噪声;e (t) 为滤波输出残留信号。
改进后LMS算法的测试, 制作两个相同的信号人为的引入时间幅度的差别, 例如:信号1:12345.wav信号2:12345.wav幅值衰减一半并延时2000采样点。令信号1信号2分别做自适应算法的两个输入信号1作为本地输入, 信号2作为接收信号。测试分离效果, 效果如下图1所示:
分离的效果很好, 证明LMS算法对此种信号的追踪效果很好能够调整好时间与幅度的差别。
4. 结束语
本文针对目前对语音分离技术的需求的增加, 设计了一种基于LMS算法的自适应滤波器。LMS算法的阶数对自适应跟踪效果的影响自适应算法的阶数必须大于时延的采样点数, 但时延的采样点数一般是比较大的, 所以必须在在自适应滤波之前先做相关性的检测以找到时延的大小对齐接收到得语音与本地语音。文章还对设计算法进行了改进, 以得到更好的分离效果。
摘要:语音分离技术的运用需求愈来愈广泛, 有其是在人们对信息安全技术需求不断增加的情况下。本文设计了一种基于LMS算法的用于语音分离的自适应滤波器, 并通过仿真结果对算法进行改进设计, 以达到更好的分离效果。
关键词:语音分离,自适应滤波,LMS算法
参考文献
[1]陈锴, 卢晶, 徐柏龄基于话者状态检测的自适应语音分离方法的研究.声学学报, 2006, 5.
[2]兰瑞明, 唐普英.一种新的变步长LMS自适应算法.系统工程与电子技术, 2005, 27 (7) :1307-1310.
语音信息 第9篇
随着科学技术的发展和电子设备智能化程度的提高, 一些电子产品除了使用传统的键盘和显示器件作为人机交互操作界面之外, 还借助于语音作为反馈信息, 以体现智能化和人性化的设计。本文以AT89S51单片机和语音芯片ISD1760为核心, 设计了一种温度和湿度语音播报系统, 完成了数据的实时播报, 实现了测量过程的智能化和自动化, 以适应各种对测量服务要求比较高的场合。
2、语音芯片ISD1760简介
ISD1700系列是Nuvoton公司推出的最新款语音芯片, 用来替代已经停产的ISD1400系列及ISD2500系列芯片, ISD1700系列不仅在录音时间上有更多的选择 (时长为20s-240s) , 而且在功能上除了集成了其它类型芯片的所有录放功能外, 还增加了一些更加人性化的提示功能及对存储空间的精确操作功能, 且音质也有了明显的提高。
ISD1760使用灵活方便, 功能较为强大, 主要包括内置的多信息管理系统, 两种操作模式 (独立模式和SPI模式) , 以及可定制的信息操作指示音效。芯片内部包含有自增益控制器、麦克风前置扩大器、扬声器驱动器、振荡器与内存等。该芯片使用模拟处理存储方式, 音频数据直接存储在固体存储器中, 无需数字压缩, 提供更优质的语音服务, 没有常见的背景噪音, 可录音十万次, 且电路断电后语音内容不会丢失, 保存时间可达一百年。
在独立按键工作模式下, 录放音电路简单, 操作方便, 功能完备, 可以仅通过/REC、/PLAY、/ERASE、/FWD、/FT、/VOL和/RESET引脚实现相应操作, 就可以实现录音、放音、擦除、快进、直通放音、音量控制和复位等功能。这些操作仅通过按键控制而无需编程。此模式下, 还具有声光提示的功能:若在使用芯片前设置了按键提示音效功能, 按下不同键时还可发出不同的声音, 同时LED闪烁。
本系统采用ISD1760的SPI工作模式, 其中单片机作为主机, ISD1760作为从机, 通过四线SPI协议进行主从机的串行通信。ISD1760提供了多达23条控制指令, 控制字一般为2~3个字节, 最多可达7字节。通过使用这些控制命令可以对ISD1760进行精确的控制, 甚至可以精确到一个存储单元。ISD1760内部有各种状态寄存器, 可以通过MISO引脚读出芯片当前的状态。
3、硬件设计
语音信息播报系统主要由键盘输入模块、液晶显示模块、传感器模块和语音播报模块四部分组成。系统框图如图1所示。键盘输入模块选用独立按键, 用于功能选择, 选择播报温度还是湿度数据;液晶显示模块选用JHD162AC, 用于显示当前的温度和湿度;传感器模块选用单总线数字温度传感器DS18B20和湿敏电阻CHR01;用于测量实时的环境温度和湿度;语音模块选择ISD1760。系统工作时, 由温度和湿度传感器采集的温湿度信号送AT89S51单片机, 经过单片机处理后由液晶显示模块显示实时数据;当有键按下时, 单片机根据键值的不同, 控制语音芯片ISD1760播报当前的温度或湿度数据;同时设置温度和湿度的上下限, 当实际的温湿度值超过设定值时, 自动播报温湿度数据并报警。
本系统采用AT89S51单片机的P1口模拟SPI总线控制ISD1760, 硬件接口电路如图2所示。从图中可以看出, 单片机和ISD1760之间仅用四线连接, P0.7脚接ISD1760的片选引脚/SS, 控制ISD1760是否选通;P0.5脚接ISD1760的串行数据输入端MOSI, 语音芯片从该管脚读入控制命令字和放音地址;P0.4脚接ISD1760的串行数据输出端MISO, 单片机从该引脚接收语音芯片返回来的信号, P0.6脚接ISD1760的串行时钟输入端SCLK, 作为ISD的时钟输入。SP+、SP-端外接喇叭。
单片机和JHD162AC的接口采用串行方式, 只用4条数据线, 以节省单片机的资源, P1.4~P1.7为数据线, P2.5~P2.7为控制线;单片机与DS18B20的接口采用单总线形式, 数据总线接单片机的P2.0脚;单片机通过测频查表测湿度, 利用P3.4脚测量湿度传感器模块的输出频率得到对应的阻抗, 再利用温度传感器测得的温度值, 查表得到当前的相对湿度数据。硬件接口电路如图3所示。
4、软件设计
主程序首先完成对温度传感器DS18B20、ISD1760和液晶显示的初始化, 启动温度转换, 读取温度数据, 测频、查表得到湿度数据, 并显示;然后判断控制语音播报的按键是否被按下, 若按下温度播报按键, 则播放当前温度数据, 若按下湿度播报数据, 则播放当前速度数据。
其中, 湿度的计算过程如下:单片机开启定时器T1定时, 同时启动T0计数;T0计数溢出每中断1次 (累计脉冲个数大于65536) , 则计数次数加1;T1定时1s结束后, 由计算公式
65536×计数次数+TH0×256+TL0
即可得到振荡电路的输出频率值 (用符号freq表示) 。
根据模块电路中振荡电路的频率公式可得湿度传感器CHR01的阻抗
Rh= (30695639/freq-33) /2 (单位:百欧姆)
再利用温度传感器DS18B20测得的温度数据查表 (表格见参考文献) , 即可得到相对湿度的数据。
其中单片机模拟SPI总线控制ISD1760的程序如下:
5、结束语
ISD1760是ISD1700系列语音芯片中的一款。在用不带SPI串行总线接口的51系列单片机来控制ISD1760时, 用I/O口模拟SPI接口, 相对会复杂一些。实际应用中, 模拟元件 (AGC电阻和电容、耦合电容等) 要紧紧靠近ISD器件, 元件的引脚要短, 把模拟和数字电源引脚接到电源端, 并在这两个电源端口添加一个高频去耦电容, 其等效串联电阻要小, 另外电源本身一定不能有噪声。
本文所设计并制作的语音信息播报系统结构简单, 使用方便, 音质优美, 经长时间运行试验, 效果良好。
参考文献
[1].于永学, 葛建.1-Wire总线数字温度传感器DS18B20及应用[J].电子产品世界, 2003 (12) :80-82.
[2].广州西博臣科技有限公司.CHR01-313.http://www.cbsen.com/down-loads.asp.
[3].Nuvoton Technology Corporation.ISD1700 Datasheet, 2008.
语音信息 第10篇
为面向“三农”搞好信息服务,进一步推进信息服务网络向乡村基层延伸,2007年农业部实施"十大行动"助推现代农业,提出“加强信息服务平台建设,建立国家、省、市、县四级农业信息网络互联中心”。
《农村实用技术电话咨询系统》是中国农业科学院科技文献信息中心多媒体室组织力量开发的,该系统由一个通用电话语音平台和一系列农业实用技术语音光盘组成,适用于各级农业主管部门和农业技术推广部门,是农业实用技术热线的好工具,是推动农村信息服务工作,是解决“最后一公里”的一个有益尝试。
目前,国内外在电话咨询系统的基础上引入农村信息Web服务还处于起步阶段。
2 实施内容和技术关键
“基于语音处理的农村信息Web服务系统”应该是一个集电话语音、计算机网络、数据库等技术的综合信息服务平台,主要由自动语音应答系统、人工坐席和数据库系统3部分组成。
(1)硬件体系
在现代计算机技术和通信技术的基础上集成语音板卡,如语音卡、传真卡、坐席卡、会议卡等板卡,解决不同资源之间的线路交换和网络传输,实现不同层次系统和人群之间语音处理、传真服务和视频会议及坐席转接功能等。
(2)系统数据
农民民生、农村政务、农业技术、农业生产和市场行情、农科知识、劳务行情和特产信息、旅游信息等是系统数据的来源,将各种渠道采集来的信息整理、分类综合和分析处理后审核,进而形成适于语音播放的数据,然后以数据库的形式存入农业信息语音咨询服务后台,以备提取使用。
(3)语音视频处理
农民用户使用普通电话机或手机,功能简单、造价低,自动化程度小,易于使用;后台呼叫中心引进了Web服务器、E-mail服务器、传真服务器、IP电话网关等;3G技术开启了移动通信的新时代,它将无线通信与国际互联网等多媒体通信结合在一起,能够处理图像、音乐、视频流等多种媒体形式,提供包括网页浏览、电话会议、电子商务等多种信息服务。
(4)技术关键
基于话音(主要有话音、信令、数据3种形式)的业务均可分为3层结构模型:业务交换层、业务支撑层、业务实现层。
其中业务交换层主要是处理话路、信令、数据的接入和处理,由排队机(或加上接入服务器)构成;而功能支撑层则是由一些逻辑子模块构成,这些子模块从业务中抽象出来的并与业务无直接关联,大量重用,如话务(员)管理、数据访问、Internet接入、自动交互语音应答、路由管理、短消息调度、语音压缩编码等;业务实现层则是在业务交换层和功能支撑层的基础上通过自动业务流程工具及人工业务应用接口界面函数(API)来构造直接面向应用和对象的具体业务流程,而与话路、信令的处理以及数据库访问无直接关联,如投诉、查询、咨询、受理、短消息、邮箱各种增值业务。
具体地,系统功能如图1所示。
3 工作基础和特色
基于语音处理的农村信息Web服务提倡“政府主导、农民参与、市场运营”的农村信息化的有效模式,具体地:
(1)政府支持
农村信息服务是以服务农民为主的社会公益性事业,所在市区农业部门高度重视,已列入议事日程,明确了目标任务,为了落实各项工作措施,主动联系课题组成员,希望组织力量认真研制开发,力争早日发挥最大效益。
(2)服务市场可行性
农民需要市场信息,也需要向市场发布信息,农民需要实时的技术指导和技术培训,更需要了解农村政策等。农民作为一个生产者,其信息需求不是一般网民的聊天、娱乐的消费而是生产的重要环节农民花几毛钱几块钱,就可以及时了解或发布重要信息,从而获得几十倍的收益,是积极性的。
(3)吸纳社会力量参与试点建设
项目实施单位,积极联系有关协作单位参与试点建设工作,特别是与电信部门的沟通与协作,在网络通道租用、号段资源分配及电话费用等方面,争取了电信部门的支持。主动与农科院联系,收集农民急需的科技、价格、供求等信息和电话咨询中反映的共性、热点问题。
(4)专业覆盖广
研究组所在院校学科门类齐全,计算机科学与技术专业与其他学科交叉融合协调发展,提供我市农业信息化全面解决方案,有大量成功案例和项目实施经验,能够全面把握客户需求,提供最有针对性的服务和解决方案,能够就近为客户提供及时的技术支持服务。
4 社会效益
开发“基于语音处理的农村信息Web服务系统”,以语音服务为主要手段采集农村信息,通过Web后台服务来整理、分类综合和分析审核,利用信息通信技术构建农村信息服务、市场营销平台,解决农村网络发展速度与层次不一、网上捕捉信息能力差的问题,实现跨地区农村综合信息服务和农村资源调度和交流,面向“三农”搞好信息服务,努力打通信息服务“最后一公里”。
参考文献
[1]周国民,丘耘,等.农业实用技术电话咨询系统的研究[J].计算机与农业,2002,8:13-15.
[2]张峻峰.农业语音信息咨询服务系统在农业信息服务领域中应用研究[J].计算机与农业,2003,8:21-22.
语音信息 第11篇
关键词:中国东北方言音 日语语音 相似性
一、引言
历史上,中日间的文化交流和友好往来,促使汉字直接或间接地传入了日本。在汉字传入日本的同时,汉字音也随之传入日本。日本人将传入的汉字作为自己的表记文字,并使这些汉字语音延续至今,从而创造了日本独有的语言文字体系。正是中日语言之间的历史渊源,使得它们之间存在着某种对应规律,因此二者的语音之间也必然存在着相似之处。近些年来,关于中日语言之间的对比研究正逐步兴起。其中,中日词汇对比一直是研究的热点,但关于语音方面的研究却为数不多。针对日语与汉语北方方言区下的次方言区的比较研究成果则更不多见。通过调查分析,可以发现中国东北方言在发音方面与日语具有相似之处。所以,本文拟从语音方面进行初步比较,希望能够为今后这一方面的研究提供帮助。
二、中国东北方言音与日语语音的相似性
1.平翘舌转化现象
“z、c、s”为舌尖前音,即平舌音。“zh、ch、sh”为舌尖后音,即翘舌音。舌尖前音声母与舌尖后音声母混淆是中国东北方言的一个显著特点。如表1所示。
表1:中国东北方言翘舌音与标准平舌音示例
汉字 中国东北方言读音 标准读音
怎 zhěn zěn
正月 zēng yuè zhēng yuè
充电 cōng diàn chōng diàn
睡觉 suì jiào shuì jiào
责怪 zhé guài zé guài
餐厅 chān tīng cān tīng
比赛 bǐ shài bǐ sài
打伞 dǎ shǎn da sǎn
此外,还有一些平翘舌发音的字易混淆,如“支援——资源,治理——自理,撤出——测出,身长——深藏,散光——闪光,市长——司长,诗人——私人,主力——阻力”等。
通过对日语常用汉字表中声母为“zh、ch、sh”的汉字进行考察(如表2所示), 可以看出汉语中翘舌音“zh、ch 、sh”在日语中的发音都向“sa”行或“ta”行转换, 从发音的角度来看都是非卷舌音。因此,二者之间存在着某些发音的相似之处。
表2:汉语翘舌音与日语平舌音示例
中国汉字音 日语汉字音 中国汉字音 日语汉字音 中国汉字音 日语汉字音
札(zha) さつ(satsu) 茶(cha) さ(sa) 砂(sha) さ(sa)
展(zhan) てん(ten) 产(chan) さん(san) 山(shan) さん(san)
折(zhe) せつ(setu) 车(che) しゃ(sya) 舌(she) した(sita)
珍(zhen) ちん(tin) 沈(chen) ちん(tin) 深(shen) しん(sin)
政(zheng) せい(sei) 成(cheng) せい(sei) 生(sheng) せい(sei)
支(zhi) し(si) 吃(chi) ち(ti) 师(shi) し(si)
周(zhou) しゅう(syuu) 出(chu) しゅつ(syutu) 收(shou) しゅう(syuu)
追(zhui) つい(tui) 垂(chu) た(ta) 水(shui) すい(sui)
2.鼻化现象
在中国东北方言中,与平翘舌现象同样明显的是鼻化现象。在中国东北,部分地区的方言习惯在零声母音节前添加一个明显的鼻辅音,这类添加的鼻辅音包括在开口呼音节前加一个前鼻辅音“n”。普通话中的“e、ai、ao、ou、an、en、ang”等7个开口呼零声母音节前常常被加上声母“n”,变成“n”声母音节,如“熬袄欧安俺岸恩昂”等。东北的偏远地区或者年纪大的人更习惯这样发音。另外,在开口呼音节前添加一个后鼻辅音“ng”的习惯用法,这一语音特点主要通过当地居民在日常交流中不经意间表达出来。
表3:中国东北方言中的鼻化音示例
汉字 中国东北方言读音 标准读音
矮 nǎi ǎi
挨着 nāi zhe āi zhe
熬粥 náo zhōu áo zhōu
棉袄 mián nǎo mián ǎo
安排 nān pái ān pái
饿 nè è
大鹅 dà né dà é
恶心 ně xīn ě xīn
俺们 nǎn men ǎn men
在日语中,“ga”行假名的辅音为“g”,但当其出现在词首以外的位置时,就要根据情况发成鼻音“n”。两种发音在单词中虽没有区别,但当“ga”位于句尾时,即以“すみませんが......ですが......”的形式出现时,发鼻音“n”能更好地起到缓冲语气的作用。在这一点上,中国东北方言和日语的发音规则是相同的。
3.塞擦音声母向塞音声母的转化现象
中国东北方言中有将擦音声母发成塞擦音声母的情况,如将“机械(xiè)”读成机“械(jiè)”;或将塞擦音声母发成塞音声母,如将“刹(chà)那”读成“刹(shà)那”;或将塞擦音声母发成塞音声母,如将“解(jiě)扣儿”读成“解(gǎi)扣儿”。这种改换个别字声母的现象在东北方言区普遍存在,只是各地方所涉及的字略有不同。声母为“j”的汉字在日语中也多读为“ka”行或“ga”行音,即发为以“g”为辅音的音。
表4:发“g”辅音的汉字示例
汉字 标准读音 中国东北方言读音 日语(括号里为罗马字发音)
解 jiě gǎi がい(gai)
解放 jiě fàng gǎi fàng かいほう(kai)
街 jiē gāi がい(gai)
上街 shàng jiē shàng gāi がい
4.硬腭化现象
中国东北方言中,“r”声母音节分别被“n”“l”“y(零声母1)”声母取代,这种取代一般与“r”同“u”“ui”等声母与韵母构成的音节有关。被“n”取代的字为“扔(rēng)”。被“l”取代的音节不多,常听到的有“儒(rú)生”,中国东北方言读作“儒生(lú)”;“花蕊(rǔi)”,中国东北方言读作“花蕊(lǔi)”。剩下的大部分都被“y”(零声母)音节取代。例如,“吵嚷(rǎng)”,中国东北方言读作“吵嚷(yǎng)”;“闷热(rè)”,中国东北方言读作“闷热(yè)”;“肥肉(ròu)”,中国东北方言读作“肥肉(yòu)”。但是当“y”遇到不能与之相拼的韵母时,韵母就会发生变化,例如“人(rén)民”,中国东北方言读作“人(yín)民”。
上文提到,东北方言中有些地方没有“r”声母字,它为“l”“n”“y(零声母)”所替代。在日语中,“r”属于齿龈边闪音/?/(或卷舌闪音/?/),具有“闪颤”的发音特点,并且日语中不存在“r”和“l”的对立,因此,很多外来语特别是英语中的以“r”为首的词汇在日语中都发音为“l”。这一发音规则与中国东北方言中发“r”的音被“l”取代的规则有相似之处。
三、中国东北方言音与日语语音存在相似性的原因
中国东北方言由于受地理条件、民族杂居以及其他各方言渗透的影响,在形成过程中,一方面继承并发展了汉语语音词汇,另一方面也吸收了其他方言中的语音词汇。其中,值得一提的是满语和移民人口带来的各地方言音对中国东北方言的影响。
(一)满语语音的影响
中国东北地区属于少数民族聚居区,以汉族为主体,满族、鄂伦春族、蒙古族、锡伯族、朝鲜族等少数民族构成了该地区的民族结构。其中,满族作为东北地区人口数量最多、分布最广的民族共同体,形成了自己的风俗习惯。满语随着满族人与汉族人的杂居共处与中国东北方言渐趋融合,有些语言甚至成为了当地居民日常生活中不可缺少的基本语言。满语作为阿尔泰语系的分支之一,有6个元音、19个辅音,名词无领属形式,动词无人称形式,句子结构为主宾谓,主从复合句较发达,通过大量虚词来表达语法意义,具有黏着语的特点。从这些特征来看,可以初步断定满语与日语属于同源语系,二者在构词及句子结构等方面都存在着诸多共性。受满语的影响,中国东北方言音与日语的语音存在诸多相似之处。
(二)移民方言音的影响
方言是语言发展的活化石,一种方言的变化发展不仅体现着该地区内部自然环境、人口结构等的变化,也体现着整个语言大环境的变化。在完全封闭的状态下,方言可能会沿着单一路线发展,不会呈现出太大的变化。语言是一个动态开放的体系,当方言处于与外来语言相连通的环境之中,它就很容易受到外来语言的影响而呈现出一种特殊的变化。在这种动态开放的体系之中,移民活动是最大的影响因素之一。当移民数量巨大、时间集中且聚居时,外来方言就必然会对原有的语言格局造成影响。由于历史上的劳动力掠夺、国家移民政策、人口流放、躲避战乱和自然灾害等原因,中国东北地区曾经是人口大量迁入的地区,这些移民的迁出地以山东为主,即著名的“闯关东”;其他地区还包括华北的幽燕之地,即今天的北京、天津、河北保定。安徽、河南洛阳、山西以及江苏连云港、云南等地也有大量人口迁入东北,伴随着人口迁移而来的是迁入人口的语言对当地原有语言的影响。在长期的共同生活中,迁入人口的方言渐渐融入中国东北方言之中,对其发音、词汇、语法、句子结构等都带来了一定的改变。而这些迁入人口的原有语言又与日语在语音等方面存在着一定的共性和对应关系。
四、结语
中日两国一衣带水,自古就有交流沟通,在这种交流沟通的过程中传入日本的中国汉字及其发音对日语语言文字体系的形成产生了深远的影响。近代以来,两国之间虽然有过战争摩擦,但随着世界大环境的改变,中日两国渐渐相互依存、相互合作,成为不可分割的两个主体。因此,对中日语言进行对比,尤其是语音方面的对比研究,不仅对研究中日两国的历史有着重要意义,在今天更是具有新的使命和意义。目前,关于中国方言与日语的语音比较研究还处于起步阶段,还有很大的空白需要我们去填补。因此,本文仅从中国东北方言与日语的语音相似性方面进行了比较,并追溯了中国东北方言在发音上的历史渊源和变化过程,希望能够对汉日两种语言在发音方面细致而深入的比较研究起到积极作用。
(本文系南京信息工程大学本科生优秀毕业论文(设计)支持计划项目资助。)
参考文献:
[1]蔡全胜.日语语音学[M].大连:大连出版社,2007.
[2]赵冬梅.《甄嬛传》和《大奥》中的女性人物对比分析[J].电影
文学,2013,(4).
[3]包婷婷.浅谈东北方言中的满语成分[J].甘肃高师学报,2008,
(3).
[4]何丰.湘方言与日语语音相似点的比较研究[J].长沙铁道学
院学报(社会科学版),2010,(2).
[5]赵冬梅.论室町喜剧狂言的艺术风格[J].安徽文学(下半月),
2014,(5).
[6]黎力.论重庆方言与日语在发音特征上的近似性[J].语文建设,
2013,(15).
语音信息 第12篇
一、“英语快乐听”是对英语传统听说教学模式的突破
1.“听”在提升语言能力方面的重要作用及常见障碍
听力是获取口语素材, 解决哑巴英语的起跑线。据统计, “听”在人们日常语言活动中约占45%, “说”占30%, “读”占16%, “写”仅占9%。然而, 外语教育专家发现, 学生在听说训练方面, 时间有限, 质量不高。仅依靠学校英语课堂的操练远远不够。听说方面的欠缺极大地阻碍了学生语言能力的提升。慢慢地, 随着知识难度的加深, 学生就会出现“听不清”乃至“听不懂”的状况。原因在于, 第一, 依赖母语。学生在听英语时先将听到的材料反映成母语, 借助母语理解和记住所听到的内容, 而不是直接去意识英语所指的概念, 从而延长反应时间。这一环节不但占用了时间, 造成大脑在忙于寻找声音的汉语对应信号时, 无法处理随后到来的英语信号, 而且由于慌忙中并未完全理解接收到的信息, 又导致了遗忘, 使无法处理的信号不断堆积, 致使听者精神紧张, 失去信心, 形成心理障碍。第二, 对照文本。学生听音时喜欢一边看原文材料一边听录音, 觉得这样听得清楚, 省时又少力, 或是听不懂就翻看原文。然而科学证明, 人脑对语言习得信息记忆的处理是有区别的。听力习得通过听觉神经输入, 阅读习得通过视觉神经输入。输入方式不同, 信息记忆的部位也不同。边看原文材料边听录音往往是阅读习得先入为主, 造成听懂的假象。如此训练最多只能起到校音的作用, 听力能力很难提高。第三, 词句的音与形、义分离。美国心理学家奥苏贝尔认为, 如果在认知结构中储有的单词仅有文字符号和意义部分, 那么, 感知到的有潜在意义的声音信号就无法被认出, 更无法理解。[1]词的音、形、义是相互依赖的整体, 不会读或读不准某个单词的听音者, 由于其认知结构中没有储存该词的声音资料, 自然不能准确、迅速地将声音信号内化为可理解的信息。词的音、形、义的分离是听力发展的一大障碍。
2. 语音教学尤其是听说训练方面存在的问题和现实困境
在基础教育阶段, 英语课程的目标是激发和培养学生学习英语的兴趣, 使学生树立自信心, 养成良好的学习习惯, 形成有效的学习策略。然而, 在现实的基础英语教学中, 普遍存在这样六大困境:第一, 听说训练时间有限。教师课堂上口语授课时间有限, 学生说英语时间有限, 针对个体学生的听说训练更有限;第二, 听说水平低。很多学生朗读、听力水平比较差, 对英语学习仍然局限于死记硬背单词和句子;第三, 不愿意说英语。学生在学习水平、个性特点和心理素质上存在较大差异, 不少学生在课堂上不愿意参与教学互动, 不愿意张口说英语;第四, 听力磁带等利用率低。英语教材的相关配套音响制品很多, 但学生能做到自主学习的很少;第五, 教师对学生课外学习情况无法管理控制;第六, 家长辅导学生英语普遍感觉很吃力。也就是说, 有限的课堂时间导致教师无法在课堂上开展有效的语音输入训练, 课堂外的训练只能靠学生自觉;学生自行训练通常也只能借助磁带或光盘等静态手段;教师无法得到教学效果的有效反馈。因此, 专业教学工具的缺乏成为语音输入教学方面的巨大障碍。
“英语快乐听”系统研发、使用后的反馈数据表明, 以传统语音电话为载体的语音教学平台的出现, 带来了全新的互动式英语教学模式, 改善、克服了上述种种英语语音传统教学的弊端。
3. 强调“师生互动”和“教师调控”在英语语音教学方面的作用
第一, 作业有声, 激发学生听说兴趣。“英语快乐听”系统的设计非常人性化, 听说训练完全在自由放松的私人环境下进行, 不受周围环境和他人干扰, 极大地激发了学生的自信心, 避免了课堂上张口的害羞感, 极大地发挥了学生听说训练的主动性。对于基础知识、基本能力没有达到课堂预期学习目标和效果的学生, 可以根据实际训练的成绩结果, 即时了解自身的真实学习状态, 可以通过语音平台不断循环复习 (反复听、说) , 自我提高, 以达到预期的学习目标。英语语音教学系统采用非常人性化的电话外呼机制, 保障“有声作业”的有效执行, 每天在教师设定的时间 (如傍晚7点15分) , 主动呼叫学生家庭电话, 每天10分钟, 让学生定时、定点、定量、高效完成, 符合人体生物时间规律。
第二, 高效统计, 提高教师批改实效。系统自动记录下每一位学生答题成绩, 自动统计并分析作业完成率、平均分统计等数据, 在计算机上通过量化的线形、柱形图等一目了然地呈现给任课教师, 帮助教师动态地掌握全班学生阶段性学习效果, 节约了抽背课文、平时测验算分等时间, 使大班环境下的英语教学更加有效。
第三, 因材施教, 真正实现教学相长。如何执行并监督学生完成情况并获得可持续性, 一直是课余教育的薄弱环节。放学后学生处于散漫放松状态, 学习主动性和学习质量都得不到有效监管, 而英语学科对听、读、说要求较多, 因此目前很多学校教师为监督学生在校外学习情况, 通常要求家长在家庭作业上签字, 有的还要求学生互相监督。这一方面使学生的自尊心受到伤害;另一方面, 许多家长无法判断作业的质量, 作业漏洞仍然存在。很多学生在学习遇到困难, 但无法及时获得帮助时, 都会产生学习上的挫折感。教师有责任对学生的课堂外学习活动给予适当帮助和适时调控。“英语快乐听”能够让教师及时掌握学生学习效果的差异, 依据具体问题有针对性地帮助学生克服困难, 促进了教育的机会均等和公平。例如, 教师从系统上判断出某学生近期在某个知识点上存在学习障碍, 可以对该学生进行重点辅导, 尽快帮助学生走出学习困境。教师也可以根据学生学习情况和学习能力的差异, 实施有针对性的学习指导, 为特殊学生提供特定的课程辅导。比如, 针对“吃不饱”的优秀学生, 可以增加其他难度较大的课外学习材料, 以促进学生个性化发展。再如, 学生普遍错在什么地方, 哪个问题回答得最好, 哪个内容学生不感兴趣, 有助于教师及时调整课堂教学策略, 设计更加科学和个性化的教学方案。
第四, 实用创新, 摈弃落后的听说训练手段。“英语快乐听”研发和推广的初衷, 是让教育科学与教育艺术在现代教育技术基础上进行整合, 以有效改变长期以来以教师讲授、课堂教学为基础, 劳动强度大、效率低的传统教育教学模式, 使教育完成从劳动密集型向技术密集型行业的历史性转变, 实现教育中人力、物力资源的多层次开发与合理配置, 从根本上解放教师的生产力和师生的创造力。“英语快乐听”由中国电信江苏电信科学技术研究院历时一年研发, 技术支持已较为成熟 (平台搭建好) , 语音资源库在不断完善并增容。该系统的资源库中有与教材、教学进度相匹配的同步听说训练, 有模拟听力试题, 有富有童趣的短小听力材料, 如童话故事、小对话、小幽默等, 还有各种听力理解题, 方便自测和自答。此外, 它还可以源源不断地更新和扩容。与磁带的录制成本高、运输不便、占空间、使用时无互动等相比, 该系统有着无法比拟的优越性。
二、“英语快乐听”开拓了安全、有效、公平的教育信息化的渠道
近年来, 成人英语培训的热潮不断升温, 大量英语专业培训机构开始积极采用互联网、计算机教学、语音处理技术等信息化手段, 成功案例也较多。然而在基础教育领域, 面向广大中小学生群体的大规模信息技术应用始终未能有较大突破。市场上大量存在的静态介质磁带、光盘, 仍然在很多方面无法满足师生的交互教学需求。江苏省教育厅早在2009年就做出了“构建基础教育信息化公共服务体系”的重要工作部署。“英语快乐听”项目开拓了教育信息化的渠道, 创新了教育信息化公共服务的形式, 实践了“实用才有市场, 简单才能普及”的理念。
1. 安全
作为家长和教师, 你赞成并放心少年儿童上网、进行网络学习吗?恐怕响应者寥寥。国家相关部门曾于2001年11月向社会发布《全国青少年网络文明公约》, 号召未成年人增强自觉抵御网上不良信息的意识。然而, 实际情况并非令人满意。2007年, 江苏省政府多家部门联合运营商, 针对省内青少年群体及其家长进行了深入的互联网应用状况调查。结果表明, 广大家长对于互联网等新型教学手段仍存在较大的排斥心理, 而学生在网络中会不同程度地受到不良信息的侵害。[2]“如何警惕青少年网游成瘾”已经成为师生和家长共同关注和持续探讨的问题。更为严重的是, 87%的家长表示自身无法很好地掌握计算机, 更谈不上对孩子进行有效监控管理。另一方面, 地处偏僻的村小和贫困地区的学校, 家庭用电脑尤其是宽带依旧是比较“奢侈”的东西, 许多农村孩子除了在学校上信息技术课外, 没有机会接触电脑和网络, 浏览网页、上传下载音频、视频等英语语音训练方面的文件更无从谈起。也就是说, 针对中小学生这一特殊群体的以互联网为基础的教学应用仍存在较大障碍。“英语快乐听”探索出最为安全的方式, 让少年儿童充分享受到科技发展所带来的教育变革。“英语快乐听”这一教学平台的出现, 充分发挥了电话终端普及、安全和便捷的特性。
2. 有效
“英语快乐听”强调在听的同时, 让学生反复跟读操练并即时传递学生的完成情况, 教师在线可点击了解任一学生的听说完成情况, 题库资源尽量采用判断、选择等听力考试的题型, 增加趣味性, 紧扣教材重难点, 进行同步练习, 扩展了课堂学习的容量, 丰富了教与学的互动形式。对江苏扬州地区使用此平台的2 179名学生家长和33名老师的问卷调查显示, 教师对英语快乐听的教学模式认可度较高, 有75%的教师对“英语快乐听”语音教学平台给予了好评, 79%的教师会随堂布置快乐听语音作业, 并将它融入日常教学管理;学生经过语音平台训练之后, 对英语语音更加敏感, 英语听说能力进一步增强, 上课注意力和课堂参与程度都得到了相应的提高;有53%的家长认为孩子的听说能力提高了, 有43%的家长认为孩子的英语学习兴趣增强了, 有75%的家长愿意接受包月收费。
3. 公平
“英语快乐听”仅仅是语音教学平台这么简单吗?显然不是。如所周知, 苏北乡村英语教师匮乏, 许多小学英语教学是由其他学科教师兼职完成的, 这些教师有的甚至不能读准26个英文字母。这与苏南等教育发达地区的孩子充分享受优质教育资源相比, 可谓是天壤之别。是否应该探索一种有效的手段, 一种长效的机制, 把发达地区的优质资源同步推送到偏远落后的地区?“英语快乐听”项目不仅在很大程度上将教师从低效率的教学劳动中解放出来, 而且更有意义的是, 通过教学平台设立课件资源的共享开发机制, 将众多一线优秀教师、专业机构的智慧整合起来, 通过平台课件的形式, 不断创造, 不断积累, 形成极为宝贵的教学内容资源体系, 通过电话终端输送到千校万户。无论城市还是乡村, 都能通过最便捷、最普及的信息通道, 获取优质教学资源。这对于改变广大教育薄弱地区优质教育资源的匮乏、优质教育资源分布不均的状况有重要意义。
参考文献
[1]奥苏贝尔, 等.教育心理学[M].北京:人民教育出版社, 1994.
[2]2007中国未成年人互联网运用调查报告发布http://news.qq.com/zt/2008/wcnhlwbg/
[3]李仁侠.英语听说教学改革——听说软件教学[J].文学教育, 2011, (11) :68-69.
语音信息范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


