论文部分内容阅读
在最近几年里,穿戴式设备由于拥有新颖实用的功能和小巧玲珑的外观,而越来越受到人们的喜爱。然而,穿戴式设备的尺寸较为小巧,所以用户使用诸如触摸屏等传统的方式与它们进行交互是很不便的,例如在穿戴式设备上查看的运动数据、查看心率或查看提醒事项等常规操作都是很不便的。尽管软键盘在传统的移动设备上得到广泛的应用,但是如果用户想在穿戴式设备上同样地使用软键盘进行文本输入,那将会非常费时费力。此外,当手指湿了或脏了的时候,不仅在穿戴式设备上,即使是在传统的移动设备上,软键盘也不能很好地工作。随着移动设备越来越普及,这些问题显得越来越严峻。这激发了研究人员的兴趣,也激励着他们致力于改善移动设备的人机交互体验。研究人员们已经提出了各种类型的基于文本输入的人机交互(Human-Computer Interaction,HCI)研究成果,例如语音语义识别、基于射频(Radio Frequency,RF)的文本输入技术、基于惯性传感器的文本输入技术等。但是它们均有其自身的技术限制,使得它们不适用于现有的许多商用移动设备。语音语义识别有容易泄露用户隐私、环境嘈杂时性能下降、安静环境时使用不方便和网络不稳定时速度慢等限制。基于射频的文本输入技术需要依赖复杂的射频硬件。基于惯性传感器的文本输入技术需要用户佩戴或握持额外的专用设备。这一观察激励着我们致力改善穿戴式设备的输入体验。有鉴于此,本课题提出了一种利用普遍内置在智能设备中的扬声器和麦克风来实现悬空手写数字输入的系统Acou Digits。利用它,人们可以使用手指在移动设备旁边的空中手写输入数字,而不需要借助任何的额外设备(Device-free)。Acou Digits不仅能够高精度地识别手写数字,还能扩展到识别英文字母,这也展现出未来用于识别英文单词等文本的潜力。Acou Digits包括数据预处理模块、特征工程模块和模型训练模块。为了验证它的有效性,我们邀请不同的实验人员,在商用移动设备上(例如智能手表和智能手机)对Acou Digits进行全面而大量的实验来评估其识别10个基本数字“0”到“9”以及26个英文字母“A”到“Z”的性能。评估指标包括数字识别性能、有效距离、训练开销性能、用户多样适应性和英文字母识别性能等方面。实验结果表明,Acou Digits在识别数字时,能达到了令人满意的平均识别准确度。其中,在应用支持向量机(Support Vector Machine,SVM)和人工神经网络(Artificial Neural Network,ANN)时,准确度分别达到92.8%和93.4%。此外,在识别英文字母时,其在ANN下的识别准确度达到87.4%。