聚焦內(nèi)容安全 跨模態(tài)視頻搜索引擎“白澤”正式發(fā)布
發(fā)布日期: 2021-11-24 16:29:59 來源: 人民網(wǎng)

人民網(wǎng)廣州11月24日電(記者孫陽、栗翹楚)11月24日,由中央網(wǎng)信辦、中央廣播電視總臺、廣東省委網(wǎng)信委聯(lián)合主辦的2021中國網(wǎng)絡(luò)媒體論壇在廣東省廣州市開幕。在技術(shù)論壇上,人民日報社傳播內(nèi)容認(rèn)知國家重點實驗室與人民中科共同發(fā)布了全球首款面向內(nèi)容安全的跨模態(tài)視頻搜索引擎——“白澤”,人民日報社傳播內(nèi)容認(rèn)知國家重點實驗室主任,人民網(wǎng)黨委書記、董事長、總裁葉蓁蓁介紹了相關(guān)情況。

“白澤”搜索引擎主頁面。

據(jù)悉,內(nèi)容風(fēng)控大腦是對全網(wǎng)海量內(nèi)容進(jìn)行高通量感知、機(jī)器理解、智能檢索并自主進(jìn)化的計算平臺,“白澤”則是該計算平臺的核心組件。內(nèi)容風(fēng)控大腦全部技術(shù)組件均實現(xiàn)國產(chǎn)化部署,提供視頻搜索、內(nèi)容風(fēng)控、開源情報、反詐反恐、內(nèi)容溯源、版權(quán)保護(hù)、實訓(xùn)靶場等多功能。鑒于跨平臺、跨模態(tài)的視頻搜索引擎是探索數(shù)字世界的重要工具,有巨大社會價值和商業(yè)前景,該引擎擬獨立運(yùn)營,以“白澤”作為商品名對外提供服務(wù)。

葉蓁蓁表示,當(dāng)前,各大主流媒體已進(jìn)入多模態(tài)階段,可實現(xiàn)文字、圖片、視頻搜索,但相互間的壁壘依然存在,人民網(wǎng)率先進(jìn)入跨模態(tài)搜索領(lǐng)域,實現(xiàn)文字、圖片、音視頻互聯(lián)互通。

“白澤”搜索界面。

當(dāng)前,基于單個模態(tài)的內(nèi)容提取及簡單規(guī)則匹配的內(nèi)容分析策略,已無法滿足實際工作需要。對此,各廠商紛紛推出基于多模態(tài)融合和復(fù)合規(guī)則判斷的多模態(tài)策略,但仍面臨依賴大規(guī)模算力、模態(tài)之間信息相互隔離、運(yùn)行和維護(hù)成本高、資源復(fù)用率低等問題。此次發(fā)布的“白澤”引擎,基于跨模態(tài)視頻檢索的策略,其跨模態(tài)引擎可實現(xiàn)單模態(tài)語義理解、多模態(tài)信息融合、跨模態(tài)語義關(guān)聯(lián),補(bǔ)全單一模態(tài)信息不足的現(xiàn)狀,打破模態(tài)間信息孤島。

據(jù)介紹,“白澤”引擎將文字、圖片、語音和視頻等不同模態(tài)信息映射到一個統(tǒng)一特征表示空間,以視頻為核心,學(xué)習(xí)多個模態(tài)間統(tǒng)一的距離度量,跨越文字、語音、視頻等多模態(tài)內(nèi)容的語義鴻溝,自動關(guān)聯(lián)多模態(tài)間關(guān)鍵要素。

在此背景下,“白澤”引擎無需配置傳統(tǒng)內(nèi)容搜索所需的復(fù)雜匹配規(guī)則,通過自然語言描述即可快速檢索出相同語義的視頻,在不需要依賴大規(guī)模算力的情況下,有效應(yīng)對新事件和突發(fā)事件,資源復(fù)用率高。

此外,面向內(nèi)容安全,“白澤”結(jié)合對境內(nèi)外多平臺內(nèi)容的檢索,可跨平臺實現(xiàn)文本搜圖片、文本搜視頻、圖片搜視頻、視頻搜視頻、圖片搜文字、視頻搜文字等功能。在論壇現(xiàn)場,葉蓁蓁展示了“白澤”在視頻搜索、溯源和辟謠、版權(quán)監(jiān)測、視頻生產(chǎn)等商業(yè)化應(yīng)用場景的功能。

同時,為提升“白澤”引擎的安全和效率,人民中科基于華為昇騰芯片研發(fā)了面向內(nèi)容理解的“雨燕”智能計算加速卡,并采用全自主研發(fā)的模型壓縮和加速算法,同等條件下能夠?qū)崿F(xiàn)4倍效率的提升。

關(guān)鍵詞: 內(nèi)容 搜索 多模 引擎 白澤

推薦內(nèi)容

?