很有意思的命题,本质上仍然是经典的分类问题,设计方案借鉴一般的模式识别问题解决方案。
1. 鼾声数据的获取,尽可能的丰富,可能要费点功夫(亦或导师提供?很想知道你们如何区分是正常或不正常鼾声)。
2. 生成特征,声音的相关特征量是必须的了,除此还可以考虑年龄、性别、体质、区域、气候等等。
3. 提取选择特征,根据实际情况决定是否需要,本质上是特征矩阵的降维,降低样本的依赖性,提高分类效果。
4. 分类器设计,常见有Bayes决策、SVM、神经网络、决策树、Boosting等方法。
我的经验是算法性能严重依赖于特征,好的特征一般的分类器就能满足我们的需求;反之,再好的分类器也无能为力。
如果概率统计、最优化、矩阵论等数学知识非常熟悉的话,算法设计不是问题,具体可以参考以下书籍:
C.M.Bishop, Pattern Recognition and Machine Learning;
R.O.Duda, P.E.Hart & D.G.Stork, Pattern Classification;
边肇祺 & 张学工, 模式识别。