應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

階躍星辰推出國(guó)內(nèi)首個(gè)千億參數(shù)端到端語(yǔ)音大模型“Step-1o”

2024-12-16 08:40 IT之家

導(dǎo)讀:階躍星辰在公眾號(hào)宣布推出 Step-1o 千億參數(shù)端到端語(yǔ)音大模型,據(jù)稱是“國(guó)內(nèi)首個(gè)千億參數(shù)端到端語(yǔ)音大模型”。

  12 月 14 日消息,階躍星辰在公眾號(hào)宣布推出 Step-1o 千億參數(shù)端到端語(yǔ)音大模型,據(jù)稱是“國(guó)內(nèi)首個(gè)千億參數(shù)端到端語(yǔ)音大模型”。

  據(jù)階躍星辰介紹,傳統(tǒng)的語(yǔ)音模型采用級(jí)聯(lián)方案,用戶輸入的語(yǔ)音信息需要先轉(zhuǎn)化為文本,再二次轉(zhuǎn)化成語(yǔ)音輸出,這個(gè)過(guò)程不僅會(huì)降低傳輸效率、更會(huì)在過(guò)程中折損掉包括情緒在內(nèi)的信息,導(dǎo)致語(yǔ)音模型時(shí)延長(zhǎng)反應(yīng)慢、回答質(zhì)量和智能水平不足、情感表達(dá)空洞刻板的缺陷。但端到端的語(yǔ)音方案,可以實(shí)現(xiàn)語(yǔ)音理解和生成的一體化,提升模型智商和情商的上限。

  從官方介紹獲悉,Step-1o 支持語(yǔ)音、文本等混合形式的輸入和輸出,可以快速反應(yīng)并隨時(shí)打斷,它也能深度理解和模仿音色、韻律、方言、個(gè)性化的口語(yǔ)表達(dá)習(xí)慣等聲音特征;

  Step-1o 能夠通過(guò)自學(xué)和模仿不斷提升回復(fù)質(zhì)量,既能提供解決問(wèn)題的專業(yè)建議,也能作為提供高情緒價(jià)值的陪伴。此外,Step-1o 還傳承了階躍星辰語(yǔ)言大模型的創(chuàng)作能力。

  階躍星辰透露,近期,Step-1o 將接入躍問(wèn) App 端,為用戶提供實(shí)時(shí)語(yǔ)音通話服務(wù)