奧推網

選單
科技

聲網趙斌:AI演算法在音訊領域有巨大進化,能抑制超過100個突發噪聲

聲網Agora創始人、CEO趙斌

鈦媒體App 11月3日訊息

,全球實時互動雲服務商聲網Agora(NASDAQ:API)主辦的RTE2022第八屆實時網際網路大會正在線上舉行。

相比往年,今年RTE大會更加聚焦實時網際網路技術、人工智慧(AI)降噪演算法技術突破、安全合規和標準制定、實時互動生態以及“元宇宙”技術落地等。

RTE是“實時互動”的英文縮寫,指用來解決在遠端條件下溝通互動的雙方能夠實時性的真實、無縫還原線下互動的場景和資訊傳遞體驗的相關活動,涉及的典型場景包括音影片通話、直播、實時指令、互動工具、虛擬形象等。

聲網Agora創始人、CEO趙斌(Tony Zhao)在演講中表示,隨著行業的發展,RTE概念與邊界已逐步清晰化,更聚焦使用者所需要的共享時空/場景,並能夠達到或者超越線下場景的互動體驗和效果。他還表示,最近一年,AI演算法在音訊領域產生了巨大進化,AI 降噪強力能夠抑制超過100個突發噪聲。

早在2015年,實時音影片技術的佈道在國內還處於“三無”狀態,即:無行業會議、無專業書籍、無專業媒體及社群。而剛成立不久的聲網,就在那年就將海外WebRTC大會引入國內。2016年,聲網舉辦實時網際網路大會,並形成一年一會至今。

今年6月,聲網釋出2022年第二季度財報,季度營收4100萬美元,比去年同期4230萬美元下降3.2%,主要由於受到“雙減”影響,季度淨虧損為3070萬美元。2022年上半年,聲網總收入達7956.4萬美元,接近8000萬美元,低於2021年全年1.68億美元收入的一半。聲網稱,公司預計2022財年總收入將在1.76億美元至1.78億美元(約合12.97億元人民幣)之間。

聲網披露,自2015年誕生以來,

RTE大會覆蓋超200個行業場景,累計影響超過200萬開發者。截至今年6月30日,聲網全球註冊應用數量超47.5萬個,同比增長41%。

不過,受到“雙減”等因素影響,聲網部分業務有所調整,並正在尋找新的發展路徑,其中包括透過合規標準佔據市場主導和構建生態體系等。

10月下旬的媒體日上,聲網首次披露,其與工信部直屬的中國資訊通訊研究院建立實時互動聯合實驗室,並且過去一年還參與實時音影片、SDK安全、智慧雙錄、兒童手錶、智慧電視等多項行業和應用相關的標準建設。

實際上,當線上會議平臺Zoom不再對中國客戶提供付費影片會議服務後,中國正在加緊制定關於實時互動音影片體驗的場景標準。

中國信通院泰爾終端實驗室智慧產品測評部主任張睿表示,場景標準將首先聚焦在成熟的影片會議和智慧門鈴門鎖的創新場景上,這兩個場景標準也得到了聲網生態夥伴金山辦公與樂鑫的支援。據張睿介紹,實時互動音影片體驗通用標準4個系列標準將於11月正式釋出。

對於“元宇宙”領域,

趙斌表示,無論是虛擬形象還是其他玩法,“元宇宙”如果想在社交領域有大的發揮,玩法上還有更多需要突破的空間。因此,聲網把“元宇宙”和API(應用程式介面)能力聚焦在了基礎能力模組上,並以組合的方式來提供,從而方便合作伙伴靈活選用其中的元件,自行創造不同方式的組合和互動玩法。

趙斌此前接受鈦媒體App採訪時表示,聲網希望做“元宇宙”技術服務商,只專注在實時音影片領域,幫助解決實際問題,使得他們更快打造相對應的場景。(詳見鈦媒體App前文:《聲網Agora創始人趙斌:未來聲網還將做“元宇宙”技術服務商》)

今年是聲網RTE實時網際網路大會的第8年。據悉,本屆RTE大會還邀請了其投資方GGV紀源資本、五源資本等機構,以及思必馳等生態夥伴參與。

(本文首發鈦媒體App,作者|林志佳)