需求描述
語音交互模塊研發(fā),包括ASR(語言轉(zhuǎn)文字)和TTS(文字轉(zhuǎn)語音)功能
TTS要做到高擬人化,讓用戶察覺不出是在和機(jī)器對話(參考騰訊云“愛”系列音色)
ASR要支持對生僻詞匯識別的優(yōu)化,且盡量支持多種方言
ASR,TTS模塊要求低延遲,支持本地化CPU部署
語音交互模塊,會與公司已有大模型問答系統(tǒng)進(jìn)行結(jié)合
人才要求
有語音交互開發(fā)、音視頻開發(fā)經(jīng)驗(yàn)。最好開發(fā)過ASR,TTS模塊,有現(xiàn)成系統(tǒng)可以直接拿來用的
合作方式
遠(yuǎn)程、駐場、或遠(yuǎn)程+駐場均可
價格希望控制在幾萬元
如果你已開發(fā)過TTS系統(tǒng),或有現(xiàn)成TTS系統(tǒng)可以使用,應(yīng)聘時請附一段音頻效果試聽