數(shù)據(jù)要素采集標(biāo)準(zhǔn)化如何保障,數(shù)據(jù)的標(biāo)準(zhǔn)化要為采集劃定邊界
發(fā)布日期: 2020-04-14 09:51:10 來(lái)源: 科技日?qǐng)?bào)

4月9日發(fā)布的《中共中央國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》(以下簡(jiǎn)稱(chēng)《意見(jiàn)》)中,首次將數(shù)據(jù)與土地、勞動(dòng)力、資本、技術(shù)等傳統(tǒng)要素并列為要素之一?!兑庖?jiàn)》具體指出,發(fā)揮行業(yè)協(xié)會(huì)商會(huì)作用,推動(dòng)人工智能、可穿戴設(shè)備、車(chē)聯(lián)網(wǎng)、物聯(lián)網(wǎng)等領(lǐng)域數(shù)據(jù)采集標(biāo)準(zhǔn)化。

“數(shù)據(jù)采集的標(biāo)準(zhǔn)化是數(shù)據(jù)存儲(chǔ)、交易、加工及數(shù)據(jù)服務(wù)等一系列數(shù)據(jù)治理的前提,而且這件事只能由政府來(lái)主導(dǎo)。”中科院自動(dòng)化研究所研究員、視語(yǔ)科技創(chuàng)始人王金橋表示,“數(shù)據(jù)的治理涉及政府機(jī)關(guān)、運(yùn)營(yíng)企業(yè)、人工智能公司、用戶(hù)等方方面面,要想規(guī)范交易使用,充分利用沉睡的數(shù)據(jù)資源,必須先從數(shù)據(jù)采集的源頭來(lái)做標(biāo)準(zhǔn)化和規(guī)范化。”

王金橋介紹,采集標(biāo)準(zhǔn)化的最大價(jià)值是解決數(shù)據(jù)采集重復(fù)建設(shè)的問(wèn)題。交通、保險(xiǎn)、醫(yī)療、天氣、教育等,各行各業(yè)都在生產(chǎn)數(shù)據(jù),數(shù)據(jù)采集存在非常多的重復(fù)建設(shè)。比如各地有不同的采集標(biāo)準(zhǔn),每個(gè)地方的關(guān)注點(diǎn)、區(qū)域特色、數(shù)據(jù)分布都不一樣,對(duì)數(shù)據(jù)的訴求不一樣,采集的數(shù)據(jù)也不一樣,這直接導(dǎo)致數(shù)據(jù)的不完備、噪音大,影響數(shù)據(jù)效能的釋放。

“因此,政府驅(qū)動(dòng)是非常重要的。”王金橋說(shuō)。比如現(xiàn)在出門(mén)避開(kāi)擁堵靠導(dǎo)航軟件,但導(dǎo)航軟件依靠使用它的用戶(hù)的定位信息,事實(shí)上相當(dāng)于采樣,結(jié)果并不可靠。去年底,交通運(yùn)輸部印發(fā)通知,決定開(kāi)展全國(guó)高速公路視頻聯(lián)網(wǎng)監(jiān)測(cè)工作,充分利用新一代云計(jì)算和人工智能技術(shù),建設(shè)科學(xué)先進(jìn)、高效統(tǒng)一的視頻云聯(lián)網(wǎng)監(jiān)測(cè)體系。這一監(jiān)測(cè)體系將全面提升高速公路信息化、智能化水平,提高出行服務(wù)保障能力。按照通知要求,今年12月底,將完成全國(guó)高速公路視頻接入工作,建設(shè)部級(jí)視頻云平臺(tái)并全國(guó)聯(lián)網(wǎng)運(yùn)行。“高速公路視頻上云后,全國(guó)高速公路的標(biāo)準(zhǔn)化數(shù)據(jù)都會(huì)集成到云平臺(tái),交通部門(mén)也能像氣象部門(mén)提供天氣預(yù)報(bào)一樣提供準(zhǔn)確的信息服務(wù),這是充分發(fā)揮交通數(shù)據(jù)生產(chǎn)力的有效手段。”王金橋說(shuō)。

由于數(shù)據(jù)治理還處在探索階段,數(shù)據(jù)采集的標(biāo)準(zhǔn)化工作也還處于起步階段。各行各業(yè)數(shù)字化程度千差萬(wàn)別,很多行業(yè)還沒(méi)有實(shí)現(xiàn)數(shù)字化,高速公路視頻上云就相當(dāng)于剛剛連入互聯(lián)網(wǎng),距離真正的數(shù)據(jù)處理和服務(wù)還很遠(yuǎn)。在國(guó)家的統(tǒng)一要求下,不同行業(yè)也需要適配各自業(yè)務(wù)和場(chǎng)景的采集標(biāo)準(zhǔn)。

“更重要的是,伴隨技術(shù)的進(jìn)步,數(shù)據(jù)采集標(biāo)準(zhǔn)也會(huì)隨之變化,標(biāo)準(zhǔn)化工作需要一個(gè)長(zhǎng)期的不斷完善的過(guò)程。”王金橋說(shuō),以人臉數(shù)據(jù)的采集為例,直播、售票、征信等不同場(chǎng)景對(duì)人臉數(shù)據(jù)的要求不同,各個(gè)場(chǎng)景需要根據(jù)應(yīng)用劃分采集標(biāo)準(zhǔn),如人證同一性認(rèn)證、人員身份網(wǎng)絡(luò)遠(yuǎn)程驗(yàn)證、人臉門(mén)禁、人臉布控等。比如按照國(guó)家制定的標(biāo)準(zhǔn)證件照的數(shù)據(jù)采集標(biāo)準(zhǔn)——中臉部寬207±14像素,頭頂發(fā)跡距照片上邊沿7—21像素,眼睛所在位置距照片下邊沿的距離不小于207像素,按這個(gè)標(biāo)準(zhǔn)采集的證件照?qǐng)D像目前已經(jīng)廣泛用于機(jī)場(chǎng)、火車(chē)站等地的身份認(rèn)證。

另外,數(shù)據(jù)采集的邊界也需要界定:什么數(shù)據(jù)能采集,什么數(shù)據(jù)不能采集;如何對(duì)隱私數(shù)據(jù)進(jìn)行規(guī)避;如何正確采集數(shù)據(jù)(比如在采集人的行為數(shù)據(jù)時(shí)必須把臉部模糊);如何平衡數(shù)據(jù)的有效和去隱私。“數(shù)據(jù)的重要性已經(jīng)充分展現(xiàn)出來(lái),但數(shù)據(jù)治理的問(wèn)題特別復(fù)雜。數(shù)據(jù)是可以被操縱和改變的,數(shù)據(jù)傳輸特別碎片化,數(shù)據(jù)交易的利益誘惑極大……數(shù)據(jù)采集是為數(shù)據(jù)共享和交易服務(wù)的,數(shù)據(jù)的標(biāo)準(zhǔn)化要為采集劃定邊界。”王金橋說(shuō)。

關(guān)鍵詞: 數(shù)據(jù)要素采集

推薦內(nèi)容

?