据广州市公布的《2005年广州市交通发展年度报告》统计,2005年广州市机动车拥有量为177.4万辆;据《法制晚报》报道2006年5月份北京机动车保有量可突破300万辆。奥运时将突破330万辆;而据2006年GSM协会公布的一组数据称:GSM手机用户数量超过20亿,中国市场最大。以上三组不同的数据显示:越来越多的人在驾驶着机动车并通过GSM终端与外界进行通讯。
现阶段,许多机动车辆都安装了车载终端。它主要用于车载导航、车辆调度、车载监控等。而许多终端设备是依靠手工操作显示终端来完成的,如驾驶员查看车辆调度中心或朋友发来的重要短消息。查看导航终端的地图等。这样就导致司机开车时不能专心,其直接后果可能导致严重的交通事故。
语音交流是人类最自然的交流方式,如果车载终端的很多操作可由实时的语音来代替的话,将有利于减少交通事故的发生率。例如,GSM Modem收到短消息,司机不用手动查看。语音合成系统可以自动播报出来;可以实时地提示司机行驶的方向与路名;可以实时地将交通状况播报出来。让驾驶员了解当前交通状况,通过了解道路交通拥堵的实时信息,从而避开拥堵路段,更快到达目的地等。语音合功能成的车载终端可提高车载终端的智能性、车辆驾驶的安全性和舒适性,使用户使用起来更加方便,更具有人性化。
2 语音合成及GSM M0dem
2.1 语音合成技术
语音合成技术是利用计算机、智能系统等设备,按预定的程序和指令,人为产生音素、音节、词和句子的技术。
目前,语音合成技术已发展到能实时地将任意文本转换成连续可懂的自然语句输出,相应技术通常称为文语合成或文语转换(Text To Speech,简称TTS),涉及到声学、语言学、语音数字信号处理技术、多媒体技术等多个学科。文语合成的原理:根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合实际的语音。
2.2 语音合成模块
本设计采用安徽中科大讯飞信息科技有限公司研发的一款高端中文语音合成模块XF-S4240。该模块可通过UART、SPI和12C三种接口接收待合成的文本,直接合成为语音输出(Line out)。
该模块采用。InterSound4.0 KT系统作为模块内核,一个是轻量级中文连续语音合成系统。
XF-S4240模块的特点如下:支持任意中文文本的合成。支持英文字母的合成,遇到英文单词时按字母方式发音;支持四种内码格式:GB2312(简体中文编码)、GBK(国家标准扩展编码)、Unicode(字符编码)、Big5(繁体中文编码);具有双发音人:男声、女声;具有智能的文本分析处理算法,可正确识别和处理数值、号码、时间日期及一些常用的度量衡符号,具备较强多音字处理和中文姓氏处理能力;支持软件调节语速、语调、音量等。 2.3 GSM Modem