成人精品一区二区三区四区,在线天堂а√8,中文字幕一区二区三区乱码

无码成人A片在线观看,性欧美videofree高清变态,中文字幕有码无码av,国产无人区卡一卡二扰乱码 ,最近高清日本免费

您現(xiàn)在的位置：通信界 >> 國內(nèi)新聞 >> 新聞正文

通信界訊 10月31日消息，2023云棲大會上，喜馬拉雅展示其最新的自研語音技術(shù)成果，包括喜馬拉雅珠峰語音生成式大模型和第二代智能語音交互系統(tǒng)。

據(jù)介紹，喜馬拉雅珠峰語音生成式大模型，具備快速實現(xiàn)語音音色和風格定制的能力。這一技術(shù)支持豐富場景下的音色實時轉(zhuǎn)換，為聲音賦予了創(chuàng)造性的"變聲"能力，宛如給聲音涂上不同的“畫皮”。此前，喜馬拉雅珠峰實驗室團隊已通過AIGC方式創(chuàng)作了超過3.7萬部有聲書專輯，而AIGC作品的每日播放時長已超過250萬小時。

在云棲大會現(xiàn)場，喜馬拉雅展示了其自研的珠峰語音生成式大模型。該大模型由喜馬拉雅珠峰智人團隊與西北工業(yè)大學aslp lab展開合作，基于自研框架，實現(xiàn)音頻與文本在統(tǒng)一框架下的稠密訓練，用于語音生成任務，能夠?qū)崿F(xiàn)語音風格和音色的zero shot的學習和遷移，實現(xiàn)風格和音色的任意組合，同時，喜馬拉雅基于阿里云數(shù)據(jù)湖3.0構(gòu)建的云原生大數(shù)據(jù)平臺為語音大模型訓練提供了海量高質(zhì)量數(shù)據(jù)，是喜馬拉雅語音大模型不可或缺的“數(shù)據(jù)引擎”。

據(jù)喜馬拉雅首席科學家、珠峰實驗室負責人盧恒介紹，“喜馬拉雅語音生成式大模型目前已經(jīng)取得了顯著的突破，在音色定制方面實現(xiàn)了5秒內(nèi)的‘極速克隆’聲音。通過極少量的數(shù)據(jù)，該模型能夠克隆出具有90%相似度的基本音色，并在短短的10秒內(nèi)快速生成定制音頻。未來，這項技術(shù)在短視頻創(chuàng)作、數(shù)字人配音、人機交互對話、名人IP復刻等領(lǐng)域有望發(fā)揮出巨大的潛在價值，有效解決商業(yè)場景中的溝通需求痛點。”

喜馬拉雅珠峰實驗室資深產(chǎn)品專家呂睿韜現(xiàn)場介紹到：該語音大模型采用基于語音向量和語義標記的新型語音編解碼器，其中語音向量包含用于高保真語音重建的聲學細節(jié)，而語義標記（LLM）則側(cè)重于語言建模的語音的語言內(nèi)容，最終實現(xiàn)高效生成最富有語言表現(xiàn)力和最高保真度的語音（對話）內(nèi)容。應用場景上，該語音大模型可應用于語音內(nèi)容生成、口語對話、語音音色實時轉(zhuǎn)換、說話風格遷移、語音到語音跨語種翻譯、說話人匿名化等各種任務。

喜馬拉雅還將展示其第二代智能語音交互系統(tǒng)，這一系統(tǒng)以阿里云的“通義千問”大模型為基礎，以喜馬拉雅兒童形象代言人“波波”為中心，增強了他的自然連貫對話能力，凸顯了“波波”這一IP形象的特征。該智能語音交互系統(tǒng)已通過喜馬拉雅兒童APP和喜馬拉雅提供服務，波波球為家庭親子用戶提供陪伴對話功能。

未經(jīng)書面許可，禁止轉(zhuǎn)載、摘編、復制、鏡像