6月3日小鵬汽車公布聲學(xué)語義大模型專利
6月3日,一則引人矚目的消息傳來:廣州小鵬汽車科技有限公司申請(qǐng)的“聲學(xué)語義大模型、服務(wù)器、語音交互方法和存儲(chǔ)介質(zhì)”專利正式公布。天眼查財(cái)產(chǎn)線索信息讓這一成果浮出水面,進(jìn)入大眾視野。
此次公布的聲學(xué)語義大模型頗具創(chuàng)新亮點(diǎn)。該模型涵蓋聲學(xué)編碼模塊、字符轉(zhuǎn)寫模塊、知識(shí)檢索模塊和大語言模型模塊。當(dāng)接收到輸入的語音請(qǐng)求時(shí),聲學(xué)編碼模塊便開始發(fā)揮作用,迅速生成語音請(qǐng)求的聲學(xué)特征向量;字符轉(zhuǎn)寫模塊也不示弱,將語音請(qǐng)求精準(zhǔn)轉(zhuǎn)寫為對(duì)應(yīng)的字符序列,這一序列清晰包含了語音請(qǐng)求中各文字對(duì)應(yīng)的字符;知識(shí)檢索模塊根據(jù)字符序列,從外部知識(shí)庫中獲取補(bǔ)充信息;而大語言模型模塊綜合聲學(xué)特征向量和補(bǔ)充信息,最終確定自然語言處理結(jié)果。
這種端到端的聲學(xué)語義大模型意義非凡。以往多個(gè)模塊串行處理的方式,往往會(huì)帶來較長(zhǎng)的處理時(shí)延,而新模型有效減少了這種情況,大大降低了處理語音請(qǐng)求的時(shí)間,模型響應(yīng)速度顯著提升。這對(duì)于用戶而言,意味著更流暢、更高效的交互體驗(yàn),能夠在發(fā)出語音指令后更快得到準(zhǔn)確回應(yīng)。
小鵬汽車在技術(shù)創(chuàng)新領(lǐng)域的探索腳步從未停歇。此次聲學(xué)語義大模型專利的公布,展現(xiàn)了其在智能語音交互領(lǐng)域的深厚技術(shù)積累和前瞻性布局。隨著智能汽車市場(chǎng)競(jìng)爭(zhēng)愈發(fā)激烈,語音交互作為重要的人機(jī)交互方式,其技術(shù)的進(jìn)步將為用戶帶來更多便利,也有望助力小鵬汽車在市場(chǎng)中脫穎而出,為智能出行發(fā)展注入新動(dòng)力,值得持續(xù)關(guān)注。
最新問答

