語音合成已有比較成熟的方案,國內如科大訊飛的。
語音降噪技術發展也很多年,主要分為去除平穩噪聲的單麥克風降噪,以及抑制方向性噪聲的雙麥克風降噪。總體而言,以feature形式存在居多,難以從根本上提高語音質量。畢竟,什麽信號處理技術也難以和人耳聽覺系統的處理能力相比啊。
回音消除技術嚴格說來,應該屬於音頻信號處理。不過其中的殘余回聲抑制,屬於語音信號處理。可以看成是語音降噪技術的壹種擴展,跟單麥克和雙麥克方式都有壹定的聯系。這個目前在VOIP技術中已經應用廣泛,可提高余地已經不大。
語音識別技術目前的技術框架主要基於模式識別,對數據的匹配性要求很高,對方言,口音,以及口語的處理能力還存在很大的瓶頸。對於標準口音,還是可以處理的,不過也需要用戶不低的配合度。總體而言,實用上來講,當前的技術還是略顯雞肋。
所有這些技術目前都有不少性能不錯的開源項目。可以參考使用。不過***同的問題是,似乎沒看到壹個非常光明的前進方向。