導語
7月26日,備受矚目的2025世界人工智能大會(WAIC)在上海盛大啟幕,清聽聲學攜前沿技術聚音屏驚艷亮相,以定向發(fā)聲與定向拾音的核心技術,展現(xiàn)新型音頻技術賦能人工智能與具身智能的創(chuàng)新成果。聚音屏刷新人機交互形式,為下一代智能終端打開全新交互維度,精準契合AI與具身智能發(fā)展趨勢,成為AIGC領域的重要推動者。
作為全球人工智能領域規(guī)格最高、規(guī)模最大、影響力最廣的頂級盛會,本屆WAIC吸引來自全球50多個國家和地區(qū)的頂尖學者、行業(yè)領袖及創(chuàng)新企業(yè)。在大會的“未來AI會客廳”展區(qū),聯(lián)想創(chuàng)投攜手多家被投企業(yè)共同描繪了一幅AI賦能下的未來圖景,而“聚音屏”無疑是其中最引人注目的技術之一。
聚音屏精準控制聲音傳播方向,讓用戶在開放環(huán)境中享受私密、清晰的聽覺體驗,無需佩戴耳機即可實現(xiàn)“聲音的私人定制”。結合定向拾音技術,還能智能過濾環(huán)境干擾噪聲,精準捕捉目標聲音,提高語音識別準確率和沉浸感,不僅提升AIGC內容生成的質量,還為智能助手、虛擬數(shù)字人、沉浸式游戲等場景注入更自然、更高效的交互方式,助力AIGC生態(tài)全面繁榮。
賦能AIGC
打造沉浸式、個性化內容體驗新范式
傳統(tǒng)嘈雜環(huán)境是AIGC語音交互與具身智能感知的主要桎梏,而用戶對音頻體驗沉浸感和個性化的更高要求,更是AIGC成功落地的關鍵。清聽聲學以聲學黑科技破局,提供完美解決方案。
想象一下,在未來的家庭娛樂中心,一位用戶正與AIGC生成的虛擬偶像進行實時互動。借助聚音屏,虛擬偶像的聲音可直接、清晰地傳遞給這位用戶,同時不會打擾到正在客廳另一側閱讀的家人。這種專屬的、私密的聽覺通道,極大地增強了人機交互的沉浸感和真實感。
在服務臺、接待處、問詢處等公共空間,AIGC結合“聚音屏”的應用將為參觀者帶來顛覆性的體驗。當用戶來到問詢臺,AIGC能精準識別并拾取用戶咨詢的問題,自動生成回復內容,并將回復聲定向投送給這位用戶,實現(xiàn)“一人一導覽”的個性化服務,徹底改變公共信息獲取的方式。
顛覆性人機聽覺體驗
從“聽到”到“聽懂”的聲學革命
在AIGC驅動的智能化浪潮中,人機交互界面的創(chuàng)新至關重要。聚音屏重新定義人機聽覺感知和交互,無論是智能客服、數(shù)智講解員、虛擬主播,還是教育、醫(yī)療、金融等行業(yè)的AI應用場景,都能顯著提升交互效率與用戶滿意度。
在復雜的現(xiàn)實環(huán)境中,精準理解人類,對機器人來說是一個巨大挑戰(zhàn),傳統(tǒng)的拾音系統(tǒng)會拾取來自四面八方的聲音,而搭載聚音屏的定向拾音技術,則可以像“聲音的聚光燈”一樣,精確捕捉來自特定方向的聲音,有效過濾掉周圍環(huán)境的噪音。
例如,在嘈雜的大廳環(huán)境中,用戶可以通過簡單的語音指令,精確地控制機器人。機器人搭載的“聚音屏”系統(tǒng)能夠精準地“聽”到用戶指令,而忽略掉嘈雜的環(huán)境噪聲和其他語音干擾,這種沉浸式、個性化的聽覺體驗,不僅滿足了AIGC對高質量內容生成的需求,也為具身智能設備賦予了更人性化的交互能力。
2025年被業(yè)界視為具身智能與AIGC技術融合的關鍵年份,清聽聲學通過“定向音頻”破解音頻交互難題,以其前瞻性的技術布局,正站在這一浪潮的前沿。作為聯(lián)想集團的戰(zhàn)略生態(tài)合作伙伴,聚音屏將繼續(xù)深耕定向音頻技術,探索更多AIGC應用場景,如智能家居、自動駕駛、虛擬現(xiàn)實(VR/AR)等,為用戶帶來更智能、更個性化的交互體驗。同時,聚音屏致力于與全球AI生態(tài)伙伴合作,共同推動人工智能技術的普惠化與產業(yè)化發(fā)展。
此次亮相WAIC 2025,不僅展示中國聲學技術的創(chuàng)新實力,也為推動AIGC與具身智能的落地應用提供了“聽得見”的解決方案,展現(xiàn)了與AIGC、具身智能融合的無限可能。在“同球共濟”的時代愿景下,清聽聲學正以創(chuàng)新之聲,書寫AIGC時代新的篇章。