电子信息类论文栏目提供最新电子信息类论文格式、电子信息类硕士论文范文。详情咨询QQ:1847080343(论文辅导)

人工耳蜗言语处理功能的移动通信端模块化电子信息实现

日期:2018年01月27日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:1362
论文价格:150元/篇 论文编号:lw201708301927187106 论文字数:35214 所属栏目:电子信息类论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis
第 1 章 绪论

1.1  研究意义 
人工耳蜗技术是多学科的融合,包括信号处理、计算机技术、电子技术、心里学、声学、生物医学、模式识别、材料学以及人工智能等。 正常人的听觉系统一般是由外耳、中耳、内耳、神经系统以及大脑皮层语音中枢等构成。其中外耳在声音感知过程中一般有两个作用:声源定位和声音放大。中耳内有三块听小骨,也有两个作用:一是调节中耳两端的声阻抗,使其能够互相匹配;二是保护内耳,对强烈的声刺激具有一定的缓冲作用。内耳是感知声音的关键器官,主要构成部分是耳蜗,它将声信号转变为电信号并刺激听神经从而产生听觉。 听觉系统中的任何一个环节出问题都可能导致听力受损,根据受损部位的不同,一般可以分为传导性听力损失和神经性听力损失两大类。前者是由于听觉系统中的神经通路受阻,从而导致声信号无法顺利到达耳蜗基底膜上的毛细胞所造成的。对于这类情况,可以通过佩戴助听器获得一定的听力补偿。神经性听力损失是由于耳蜗内的毛细胞或者听神经纤维遭到破坏,导致声信号无法顺利转换成生物电脉冲,故使用助听装置已经无济于事。其中听神经纤维受损的属于极少数,目前暂无有效的治疗方法,毛细胞受损的情况比较多,对于这类情况,可以通过植入电刺激听觉辅助设备(如人工耳蜗、听觉脑干植入等)来获得一定的听力。 人工耳蜗是功能性电刺激(Functional Electrical Stimulation, FES)技术成功应用于医疗康复工程中的典型案例。FES 技术是利用神经细胞具有电兴奋性的原理,通过外电流刺激神经细胞,使细胞中产生一个动作电位,该动作电位可以诱发神经兴奋[1]。人工耳蜗正是利用这个原理,跨过听觉通路中受损的环节直接用电流刺激听觉神经,从而产生听觉。 
.........

1.2 CI 技术历史进展及研究现状 
人工耳蜗是唯一通过电信号代替声信号来刺激残存的听神经,从而使全聋患者得以恢复部分听力的医学手段[15]。人工耳蜗技术之所以能产生并发展至今是基于耳蜗感音机理的位置理论。位置理论指的是耳蜗内基底膜上不同位置响应不同的声音频率。曾有人通过正弦信号对耳蜗听觉特性进行研究证明了该理论,并且表明从蜗底到蜗尖对应各位置的敏感频率依次从高频到低频(频率范围 16Hz~20k Hz)[16],如图 1-2 所示。依据耳蜗的敏感频率分布特性,它可以近似地被看作一组品质因数恒定的带通滤波器,可以根据位置分布对语音进行编码。国外对 CI 技术的研究起步较早,在上世纪六十年代,美国的科学家 William F. House就已经研制出了单通道 CI 产品,但是仅仅通过一个电极刺激少量的听神经并不足以提供给植入者足够的言语识别能力。随着各国科学家的共同努力,在 70 年代末,多通道CI 分别在奥地利电子工程师 Ingeborg Hochmair 和澳大利亚教授 Graeme Clark 领导下研制成功,并且在后来的十几年中逐渐走向市场。 目前世界上主要有三大电子耳蜗公司,分别是:  澳大利亚的科利耳(Cochlear)公司(代表产品:Nucleus 系列)、美国的 Advanced Bionics 公司(代表产品:Clarion 系列)和奥地利的 MED-EL 公司(代表产品:COMBI 系列)。其中 Cochlear 公司是基于墨尔本大学 Graeme Clark 教授的研究发展而来,作为首个从事 CI 技术研发的公司,它是世界上生产人工耳蜗历史最长的厂家,并且一直走在该技术的前沿。Cochlear 公司所取得的诸多研究成果一定程度上也体现了 CI 技术研究的历史进展及现状,如图 1-3 所示。 
.........

第 2 章 言语处理算法

2.1 CI 产品工作原理 
从根本上说,人工耳蜗就是利用声、电、磁转换原理,把声信号转换为电信号,并通过手术植入的电极阵列刺激残存听神经,使断开的听觉通路重新连接起来从而产生听觉。工作原理如图 2-1 所示。CI 产品主要包括体外机和植入体两部分(图 2-2 是 Nucleus 系列产品的实物图,其中左图为体外机,右图为植入体)。体外机包括:  ①方向性麦克风,负责收集周围的环境声并发送到言语处理器。②言语处理器,通过适当的言语处理算法对语音信号进行特征提取或者滤波,从而产生不同电极上对应的电刺激信号。新的言语编码策略(如 FSP编码策略)已经达到可以让耳聋者正常欣赏音乐以及准确分辨汉语四声的水平。③编码发射器,对接收到的电信号进行编码、调制,并通过发射线圈以射频传输的方式发送至位于皮下的植入体的接收/刺激器。④发射线圈,发送射频信号。 植入体包括:  ①接收线圈,用于接收射频信号。②解码器和刺激脉冲生成器,固定于皮下,对接收线圈传过来的信号进行解调、解码,然后通过刺激脉冲生成器生成相应刺激电极上的电脉冲信号,并通过导线传送到刺激电极。③电极阵列,电脉冲传至耳蜗内部电极阵列,沿着序列分布的电极刺激耳蜗内的螺旋神经节。电声信息沿听觉通路传至中枢神经产生听觉[41-44]。现有的电极设计既能最大程度地避免和减少插入造成的损伤,保证病人较好的听声效果,又能保证电极在人体内的长期稳定性。 
........

2.2  言语处理算法概述 
人工耳蜗的体外机中最重要的部分就是言语处理器,其主要功能是把麦克风采集到的声信号转换成耳蜗中对应电极上的电刺激信号,针对患者的不同状况可以选择多种言语处理算法,采用的算法不同电子耳蜗的实现方式和性能也就存在较大差异。 经过了几十年的持续发展,从开始的模拟电路到数字电路,从基于特征提取的算法到基于滤波器组的算法,言语处理器无论是硬件设计还是处理策略设计都逐渐趋于成熟。早期的言语处理算法(基于特征提取)是提取语音信号中的谱特征信息(如基频、共振峰等),然后根据这些特征信息生成相应电极上的刺激信号,采用这类策略的 CI 产品在实际应用中虽然在一定程度上可以帮助患者恢复部分听力,但效果十分有限。后来出现的基于滤波器组的处理策略是通过带通滤波将语音信号分为多个频段,每个频段对应一个通道,把每个通道信号的模拟或者脉冲波形作为相应电极上的刺激信号。 
........

第 3 章 言语处理模块在移动终端上的设计与实现 ......... 19 
3.1 CIS 算法的 ANDROID 平台实现 ........... 19 
3.2 基于 VOCODER 声码器仿真的效果评估 .... 30 
3.3 本章小结 ........ 34 
第 4 章 辅助训练模块的设计与实现 ........... 35 
4.1 语音识别背景知识简介 ...... 35 
4.2 语音识别模块的设计与开发 ............ 37 
4.2.1 语音识别 SDK 的选择 .... 38 
4.2.2 SDK 的接入 ............. 38 
4.3 重复播放模块的设计与开发 ............ 40 
4.4 本章小结 ........ 41 
第 5 章 实验验证及效果评估 ....... 42 
5.1 蓝牙传输 ........ 42 
5.2 言语模块 ........ 43 
5.3 辅助模块 ........ 46 
5.4 本章小节 ........ 47 

第 5 章 实验验证及效果评估

前面第三章和第四章分别介绍了言语处理模块和辅助训练模块的实现方法,本章主要是通过一系列的分析实验和听觉仿真实验,对所设计系统的可靠性进行验证。实验内容包括三部分:蓝牙传输、言语处理模块和辅助训练模块。 

5.1  蓝牙传输 

按照设计的完整流程蓝牙传输的内容应该是非线性压缩之后的电信号,但是由于没有现成的产品,我们用另一部手机作为接收端,模拟本设计中人工耳蜗体外机上的蓝牙模块。另外,在进行蓝牙传输时,不管是压缩之后的电信号还是普通的语音信号在数据类型上没有本质区别(都是 byte 数组的形式),而我们的目的只是验证蓝牙模块是否能正常收发数据并评估信号的延迟情况。 鉴于此,我们设计如下实验:选择男/女实验者各 1 名,分别以平常的语速和音量读附录 1 中的 80 个句子,边读边录音,然后不做任何处理直接发送到接收设备,让另 3名实验者去听,记录每位实验者的辨别正确率,并且用秒表记录从开始录音到听到声音的时间差。 实验结果:3 名实验者的辨别正确率如表 5-1 所示,可见蓝牙传输的信号质量非常好。另外,几次测试的延迟时间都是毫秒级,几乎可以忽略不计,因此这里未作精确统计。 

.........

总结 

很长时间以来,人工耳蜗产品一直被三大外国公司垄断,植入价格动辄十几万甚至几十万,虽然国产厂商诺尔康的出现打破了这种垄断格局,但由于成本较高,植入价格依然居高不下,令很多有需要的患者望而却步,不能得到及时治疗。而且现有产品都是通过体外机中的数字信号处理芯片进行言语处理,功耗较大,且运算能力有限,而电池技术还不够发达,一般电池大都只能用几个小时,因此需要经常更换电池,如遇外出还要随身携带备用电池,给植入者带来很大不便。另外通过图 1-1 可以看出,体外机中电池占了很大体积,既不美观,隐蔽性也差。 针对 CI 体外机的上述缺点本文提出了一种改进方案:取消现有体外机的麦克风和言语处理模块,将这部分功能移植到移动终端上来做;体外机中只保留原射频模块和一个新增的蓝牙模块,用于和植入体及移动终