李浪子,濟邦咨詢 經理(lǐ)
這是【公(gōng)共數據授權運營專題】的最後一期。前兩期我們綜合分(fēn)析了央地兩級政策體(tǐ)系與執行情況,對海量信息去蕪存菁,力求對公(gōng)共數據授權運營的基本概念、模式、流程以及發展展望做出清晰解讀。
本篇,我們延續公(gōng)共數據授權運營的話題,聚焦在公(gōng)共數據運營的終端形态——公(gōng)共數據産(chǎn)品,對公(gōng)共數據産(chǎn)品的關鍵底層原則、開發的兩級市場以及典型性的産(chǎn)品呈現形式作(zuò)深入剖析,并嘗試以交通領域公(gōng)共數據為(wèi)例,解讀目前市場上的主要公(gōng)共數據及相關産(chǎn)品形态。
一、公(gōng)共數據産(chǎn)品開發的幾個關鍵前提
1. 數據産(chǎn)權的結構性分(fēn)置
早在2022年12月,中(zhōng)共中(zhōng)央、國(guó)務(wù)院發布的《關于構建數據基礎制度更好發揮數據要素作(zuò)用(yòng)的意見》(簡稱“數據二十條”)中(zhōng),明确要求根據數據來源和生成特征,界定數據生産(chǎn)、流通、使用(yòng)過程中(zhōng)各參與方享有(yǒu)的合法權利,探索建立數據資源持有(yǒu)權、數據加工(gōng)使用(yòng)權、數據産(chǎn)品經營權等分(fēn)置的産(chǎn)權運行機制。
公(gōng)共數據的持有(yǒu)權與加工(gōng)使用(yòng)權指公(gōng)共數據伴随公(gōng)共部門提供的公(gōng)共服務(wù)而産(chǎn)生的數據持有(yǒu)權,以及相應的數據加工(gōng)、治理(lǐ)等加工(gōng)使用(yòng)權。
而經營權對應着的是數據産(chǎn)品,因此,基于公(gōng)共數據産(chǎn)生的數據産(chǎn)品經營權自然歸屬于産(chǎn)品的生産(chǎn)與加工(gōng)部門,而非政府與公(gōng)共部門的職責範疇,其本質(zhì)具(jù)有(yǒu)市場屬性。數據産(chǎn)權的結構性分(fēn)置,保障了公(gōng)共數據産(chǎn)品在市場上的自由流通。
2. 公(gōng)共數據開放程度的梯度屬性
公(gōng)共數據按照對外的開放程度,分(fēn)為(wèi)無條件開放、有(yǒu)條件開放與保密數據(不予開放)。對于依法需要保密的公(gōng)共數據不予對外開放,而對于在一定條件下或者通過特殊手段可(kě)以提供給社會使用(yòng)的公(gōng)共數據列為(wèi)有(yǒu)條件開放,其他(tā)不涉及保密要求應當向社會主動開放的公(gōng)共數據便是無條件開放數據。
因此,為(wèi)了滿足社會對公(gōng)共數據的使用(yòng)需求,同時充分(fēn)發揮公(gōng)共數據的要素價值,依據合理(lǐ)機制并通過必要手段合法獲取、使用(yòng)與開發數據是非常重要的一點。這同樣對當下公(gōng)共數據資源的供給模式及産(chǎn)品形态産(chǎn)生了深遠(yuǎn)影響。
3. 原始數據不出域、數據可(kě)用(yòng)不可(kě)見
“數據二十條”中(zhōng),對于公(gōng)共數據的使用(yòng)還有(yǒu)一條關鍵性原則,即在推進公(gōng)共數據确權授權過程中(zhōng),在确保個人隐私和公(gōng)共安(ān)全的前提下,公(gōng)共數據需遵循“原始數據不出域、數據可(kě)用(yòng)不可(kě)見”的原則,以模型、核驗等産(chǎn)品和服務(wù)的形式向社會提供。
各地方試點實踐中(zhōng),都明确将此項要求作(zuò)為(wèi)地方公(gōng)共數據管理(lǐ)辦(bàn)法、公(gōng)共數據條例等地方性法規、規章的重要原則性條款。這一點便要求了公(gōng)共數據産(chǎn)品開發需要兼顧數據安(ān)全與高效利用(yòng),通過數據的脫敏、匿名(míng)化确保數據安(ān)全,通過使用(yòng)數據沙箱、API接口等多(duō)種方式實現數據的高效利用(yòng)。
二、公(gōng)共數據産(chǎn)品開發的兩級市場
各行業的分(fēn)級市場常根據市場容量、經濟狀況、交易階段、行政級别等不同對市場進行區(qū)分(fēn),如資本市場針對金融資産(chǎn)的不同交易階段劃分(fēn)為(wèi)一級市場(發行市場)和二級市場(交易市場)。公(gōng)共數據産(chǎn)品開發按照公(gōng)共數據授權運營機制要求,也存在一二兩級市場。
1. 一、二級市場結構
所謂一級市場,即政府按照規範程序授權給數據運營機構,運營機構對數源單位提供的公(gōng)共數據,在授權範圍内對公(gōng)共數據進行整理(lǐ)、清洗、脫敏等處理(lǐ),實現一級産(chǎn)品開發。并按照相關要求,依托統一的公(gōng)共數據資源登記平台登記存證,最終實現上架交易。
一級市場可(kě)以稱為(wèi)數據資源市場,其産(chǎn)品形态是對原始公(gōng)共數據的粗加工(gōng),旨在解決數據的安(ān)全性與合規性問題,主要流通方式為(wèi)原始數據集或數據API接口。
所謂二級市場,是指市場主體(tǐ)(開發主體(tǐ))将通過合規渠道獲取的一級市場開發交付的初級公(gōng)共數據産(chǎn)品進行二次開發,融合多(duō)源數據,以提升數據産(chǎn)品和服務(wù)價值,滿足市場終端多(duō)樣化需求。
二級市場可(kě)以稱為(wèi)數據産(chǎn)品市場,重心在初級數據産(chǎn)品的再開發及市場化,産(chǎn)品形态與市場需求緊密結合,應用(yòng)場景、盈利模式清晰,有(yǒu)效發揮數據要素的乘數效應。
2. 兩級市場分(fēn)置
根據國(guó)家數據局《公(gōng)共數據資源授權運營實施規範(試行)》(公(gōng)開征求意見稿)的有(yǒu)關要求,運營機構應在授權範圍内依法依規開展業務(wù),不得直接或間接參與授權範圍内已交付的公(gōng)共數據産(chǎn)品和服務(wù)的再開發工(gōng)作(zuò)。鼓勵其他(tā)經營主體(tǐ)對運營機構交付的公(gōng)共數據産(chǎn)品和服務(wù)再開發。
這裏所謂的其他(tā)經營主體(tǐ),便是運營機構以外的其他(tā)市場開發主體(tǐ)。這就意味着,待正式稿發布後,大有(yǒu)可(kě)能(néng)一級市場、二級市場将會嚴格分(fēn)開,兩級市場的主體(tǐ)不得重合。
運營機構授權運營,意味着将對某一行政範圍内或某一特定領域擁有(yǒu)數據一級産(chǎn)品開發的專營權。按照各地方的運營實踐來看,運營機構甚至還承擔着一定的市場培育、市場維護的政府職能(néng)。因此,公(gōng)共數據産(chǎn)品開發的兩級市場機制,重點在維持再開發環節的市場競争性,充分(fēn)激發市場活躍度,防止權力濫用(yòng)導緻的競争受限和市場壟斷現象出現。
圖1 地方常見兩級市場結構
三、數據産(chǎn)品有(yǒu)哪些類型
以上内容我們介紹了塑造公(gōng)共數據産(chǎn)品交易機制的幾條關鍵原則,也通過一、二級市場的辨析對兩個階段數據産(chǎn)品的差異做了解釋。一級市場的産(chǎn)品具(jù)有(yǒu)程式化特征,隻是對公(gōng)共數據的粗加工(gōng),解決的是公(gōng)共數據資源的合規供給問題。對于市場來說,二級市場産(chǎn)品的開發才具(jù)有(yǒu)較高的可(kě)參與空間與商(shāng)業價值。那麽,當前有(yǒu)哪些數據産(chǎn)品活躍在市場交易中(zhōng)?
通過整理(lǐ)各大數據交易所數據,我們發現,市場上公(gōng)開上架交易的數據産(chǎn)品中(zhōng),數據集、數據工(gōng)具(jù)(應用(yòng))、數據服務(wù)以及綜合數據産(chǎn)品是最為(wèi)常見的類型。例如,上海數據交易所對目前上市數據産(chǎn)品便分(fēn)為(wèi)數據集、數據服務(wù)、數據應用(yòng);深圳數據交易所又(yòu)分(fēn)為(wèi)數據産(chǎn)品、數據工(gōng)具(jù)、數據服務(wù);杭州數據交易所分(fēn)為(wèi)數據API、數據服務(wù)、數據報告、數據工(gōng)具(jù)、數據集等等。
綜合來看,各地分(fēn)類基本是圍繞數據本身、數據處理(lǐ)工(gōng)具(jù)、數據相關服務(wù)三類展開,然後各有(yǒu)側重進行衍生與細分(fēn)。接下來,本文(wén)将對數據集、數據工(gōng)具(jù)、數據服務(wù)三大類數據産(chǎn)品展開解讀。
1. 數據集
數據集(Dataset),又(yòu)稱為(wèi)資料集或數據集合,是由數據元素所組成的集合。在統計學(xué)和機器學(xué)習中(zhōng),數據集常用(yòng)于進行分(fēn)析、構建模型或進行預測。它通常以表格形式出現,每一列代表一個特定變量,每一行都對應于某一成員的數據集。數據集可(kě)以包含不同類型的數據,如數值型數據、分(fēn)類數據、文(wén)本數據等。
從數據調用(yòng)角度,數據集的交易可(kě)分(fēn)為(wèi)原始數據集整體(tǐ)打包交易和API接口交易。對于公(gōng)共數據而言,敏感性低可(kě)直接開放的數據可(kě)通過原始數據集打包形成數據産(chǎn)品直接上架。而對于敏感性較高,不适宜開放原始數據的數據集,則可(kě)通過選擇數據API接口進行交易。
2. 數據工(gōng)具(jù)
數據工(gōng)具(jù),即數據采集、處理(lǐ)、分(fēn)析、存儲、可(kě)視化、開發、應用(yòng)等全流程配套工(gōng)具(jù)。典型形式包括智能(néng)化系統平台、狀态查詢程序、數據統計分(fēn)析程序、可(kě)視化管理(lǐ)系統、AI模型等等。
以交通出行為(wèi)例,各類停車(chē)場管理(lǐ)APP或小(xiǎo)程序,以及地方城市服務(wù)APP,普遍集成了智能(néng)化系統管理(lǐ)、分(fēn)析、可(kě)視化與查詢功能(néng);監管部門通過智慧監控系統内置交通識别算法大模型,有(yǒu)效識别交通事故、違停等情況,顯著提高了監管效率;智慧公(gōng)交系統則為(wèi)公(gōng)交調度、乘客了解到站信息等提供支持。數據工(gōng)具(jù)的供給方主要為(wèi)市場各類IT公(gōng)司。
3. 數據服務(wù)
數據服務(wù)是支撐數據開發應用(yòng)的重要環節。數據服務(wù)的類别非常豐富,涵蓋數據采集、分(fēn)析、傳輸、存儲、處理(lǐ)、咨詢等多(duō)個服務(wù)環節。
例如大數據報告、智慧解決方案、咨詢認證、數據評估、數據培訓、算力服務(wù)、數據校驗等等。數據服務(wù)是數據産(chǎn)品開發交易全流程的重要支撐,這類數據服務(wù)産(chǎn)品常由市場化咨詢服務(wù)商(shāng)提供。
四、以交通數據産(chǎn)品為(wèi)例
綜合以上産(chǎn)品類型總結可(kě)以發現,公(gōng)共數據産(chǎn)品的授權運營與開發交易,在數據工(gōng)具(jù)與數據服務(wù)方面,市場上已經形成了高效的解決方案與技(jì )術能(néng)力。但是這兩者作(zuò)用(yòng)的有(yǒu)效發揮依賴于以數據集為(wèi)基礎的數據底層資源。可(kě)見,當下制約公(gōng)共數據産(chǎn)品的廣泛開發與應用(yòng),很(hěn)重要的一個方面是如何實現平衡數據集的高效開放與信息安(ān)全。
結合國(guó)際經驗,廣闊的市場前景是當前市場對公(gōng)共數據産(chǎn)品開發的共識與動力之源,但從當下各地實踐情況來看,卻存在收益率不确定及市場熱情不足的情況。數據利用(yòng)場景的模糊、目标用(yòng)戶不明确、持有(yǒu)者對自身數據價值認識偏差是制約公(gōng)共數據産(chǎn)品開發的關鍵因素。
為(wèi)此,基于交通領域數據的可(kě)利用(yòng)性較高的特征,本文(wén)重點聚焦數據集型産(chǎn)品,試圖整理(lǐ)目前較為(wèi)火熱的交通類數據産(chǎn)品供大家參考。
1. API接口類
API接口對于公(gōng)共數據的适用(yòng)性前文(wén)已有(yǒu)提及,在此不再贅述。API接口是應用(yòng)程序編程接口(Application Programming Interface)的縮寫,是一種預先定義的函數,目的是提供開發主體(tǐ)得以訪問一組例程的能(néng)力。簡單來說,API就是讓不同的軟件之間可(kě)以互相通信、協作(zuò)的工(gōng)具(jù)。接口的調用(yòng)是實現公(gōng)共數據“可(kě)用(yòng)不可(kě)見”的重要方式。
對于交通領域來說,主要在狀态核驗、熱力指數、實時查詢、實施預測、地理(lǐ)信息調用(yòng)、物(wù)流溯源等方面,通過API數據調用(yòng)運用(yòng)公(gōng)共數據開發數據産(chǎn)品。
狀态核驗類
狀态核驗類主要有(yǒu)以機動車(chē)為(wèi)主體(tǐ)及其相關附加信息的一緻性檢驗。如人車(chē)關系一緻核驗,可(kě)以通過核驗指定人員/企業是否是指定車(chē)輛的所有(yǒu)人,确保所有(yǒu)權的一緻性,這一過程為(wèi)交通運輸行業監管、金融機構對市場主體(tǐ)授信提供數據支持。
又(yòu)或者網約車(chē)行業,通過核驗網約車(chē)行駛裏程狀态、事故情況、出險情況、營運資質(zhì)等等,為(wèi)保險部門提供保費設定依據等。
熱力指數類
熱力指數體(tǐ)現某類數據信息的集中(zhōng)度、飽和度等指标。對于交通領域來說,通過彙聚軌交進出站、公(gōng)交上下車(chē)信息,可(kě)提供軌交進出站熱力、公(gōng)交線(xiàn)路熱力等産(chǎn)品;通過彙聚網約車(chē)位置信息、上下車(chē)位置信息,可(kě)提供網約車(chē)需求熱力、網約車(chē)運力指數等産(chǎn)品;通過共享單車(chē)租還位置信息可(kě)提供共享單車(chē)租借便捷指數;通過彙集停車(chē)場停放情況、公(gōng)共充電(diàn)樁利用(yòng)情況等可(kě)提供停車(chē)便捷指數、新(xīn)能(néng)源充電(diàn)利用(yòng)率等指數産(chǎn)品。
這類數據産(chǎn)品具(jù)有(yǒu)天然大數據屬性,其數據量的大小(xiǎo)直接影響指數質(zhì)量。這類數據可(kě)為(wèi)公(gōng)共部門城市治理(lǐ)、企業商(shāng)家選址、企業市場營銷、網約車(chē)運力分(fēn)配、共享單車(chē)投放、地圖服務(wù)商(shāng)導航線(xiàn)路推薦等提供數據支持。
實時查詢類
實時查詢類基于實時信息的收集與分(fēn)析,為(wèi)用(yòng)戶提供實時信息查詢服務(wù)。交通出行場景中(zhōng),軌道交通和公(gōng)共交通的線(xiàn)路運行情況、進站信息及發車(chē)間隔等可(kě)為(wèi)大衆出行提供信息資訊,為(wèi)出行決策提供支持。基于充電(diàn)樁、停車(chē)場運行數據,可(kě)提供充電(diàn)、停車(chē)在線(xiàn)選擇與預約服務(wù)。物(wù)流行業還可(kě)提供物(wù)流車(chē)輛實時位置信息,滿足貨物(wù)物(wù)流追蹤需求。
實時查詢類信息常集成在地圖服務(wù)商(shāng)平台、城市服務(wù)平台等,可(kě)為(wèi)地圖服務(wù)商(shāng)引流、生活服務(wù)商(shāng)數據支撐等提供服務(wù),也可(kě)為(wèi)政府等公(gōng)共部門公(gōng)共服務(wù)提供支持。
實時預測類
在實時數據的基礎上,通過曆史數據的整合分(fēn)析,引入AI大模型預測等技(jì )術手段,還可(kě)提供實時預測類數據産(chǎn)品服務(wù)。例如以上各類動态交通數據,都可(kě)通過曆史數據演化模拟,預測同時期此時段的動态情況。在海運領域,基于沿海海域地形、岸線(xiàn)、港口、礁石、潮汐、天氣等海情數據,實時播報并階段性預測,為(wèi)海上物(wù)流運輸、海上作(zuò)業提供決策參考。
與交通相關的氣象數據領域,天氣數據API服務(wù)可(kě)提供各種尺度、範圍及時間的天氣情況及預測數據,能(néng)為(wèi)各類交通營運、地圖服務(wù)、城市治理(lǐ)提供數據依據,還能(néng)在與天氣密切相關的農業、太陽能(néng)光伏等行業找到商(shāng)業價值。
溯源類
産(chǎn)品物(wù)流追溯是通過一物(wù)一碼實現商(shāng)品從生産(chǎn)加工(gōng)、包裝(zhuāng)倉儲、渠道物(wù)流、終端銷售、真僞查詢到營銷互動等産(chǎn)品全生命周期信息記錄及追溯管理(lǐ)。基于交通物(wù)流信息的實時記錄、存檔的溯源數據産(chǎn)品在物(wù)流溯源領域有(yǒu)強大的市場需求。
地理(lǐ)信息類
地理(lǐ)信息類數據産(chǎn)品同氣象數據一緻,屬于交通領域相關數據産(chǎn)品,常在交通運輸類數據專區(qū)中(zhōng)有(yǒu)重要市場地位。例如,厘米級的高精(jīng)地圖定位數據、地圖即時更新(xīn)的POI數據是新(xīn)能(néng)源汽車(chē)自動駕駛行業的重要底層工(gōng)具(jù)。
2. 原始數據包類
對于無條件開放,或經脫敏後可(kě)直接開放原始數據的公(gōng)共數據,可(kě)直接作(zuò)為(wèi)公(gōng)共數據産(chǎn)品對外交易。相較于通過API接口調取數據,直接提供脫敏後的原始數據集給市場主體(tǐ),不僅有(yǒu)利于對數據的全局性把握,而且為(wèi)市場應用(yòng)提供了更廣闊的空間與自由度,便于數據産(chǎn)品的二次開發。
以交通領域來說,常見的交通标志(zhì)數據集、車(chē)牌數據集、曆史交通流量數據集以及交通路側感知數據等等是較為(wèi)常見的公(gōng)共數據産(chǎn)品,這些産(chǎn)品在自動駕駛領域有(yǒu)深入的行業應用(yòng),可(kě)為(wèi)自動駕駛AI模型提供道路信息訓練素材。
上海交易所上架交易的由儀征市恒源數據資産(chǎn)運營有(yǒu)限公(gōng)司提供的儀征市公(gōng)交運營數據産(chǎn)品。通過安(ān)裝(zhuāng)部署的智能(néng)車(chē)載調度終端、公(gōng)交客流分(fēn)析儀,以及調度人員的人工(gōng)錄入,積累了覆蓋136條公(gōng)交線(xiàn)路、274輛公(gōng)交車(chē)以及日均1萬左右人次客流量的公(gōng)交運營原始數據。通過對這些原始運營數據進行清洗、去重、格式校驗、篩選、整合等加工(gōng)處理(lǐ),并按照公(gōng)交線(xiàn)路、站點等維度進行了分(fēn)類管理(lǐ),形成圍繞公(gōng)交運營相關的公(gōng)交實時數據、曆史公(gōng)交站點客流、曆史公(gōng)交排班及調度等主題的數據集,總共大小(xiǎo)170G。
該産(chǎn)品的主要市場規劃方向為(wèi)面向外部市場,主要服務(wù)于企業和政府采購(gòu)。目标客戶包括高德(dé)、百度等科(kē)技(jì )公(gōng)司,以及交通管理(lǐ)部門、商(shāng)業機構和廣告公(gōng)司。産(chǎn)品提供豐富的公(gōng)交數據資源,支持實時監控、客流分(fēn)析、線(xiàn)路優化和廣告策略調整等功能(néng),助力客戶提升業務(wù)效率和決策能(néng)力,實現智能(néng)化管理(lǐ)。
五、展望
受限于安(ān)全管理(lǐ)機制的建設進程,目前大量市場主體(tǐ)所能(néng)使用(yòng)的公(gōng)共數據大都以API接口為(wèi)主。少量數據集為(wèi)相關市場主體(tǐ)在企業運營過程中(zhōng)自行收集的運營數據(這類數據在是以企業數據還是以公(gōng)共數據開展市場交易仍存在一定的模糊地帶)。
又(yòu)或者各省市試點“依場景授權”模式,推崇先有(yǒu)場景後有(yǒu)申請審批。通過此渠道,遵循最小(xiǎo)必要原則,實行“一場景一審批”方能(néng)獲得特定原始數據集(經脫敏處理(lǐ)後)。可(kě)見,市場主體(tǐ)拿(ná)到原始數據包進行數據産(chǎn)品開發還不是主流方式。
但是,相信随着市場規模逐漸擴大,數據安(ān)全監管機制逐漸完善,交易機制的創新(xīn),市場将呈現出多(duō)樣的、便捷的數據調取方式。加上盈利模式不斷清晰,公(gōng)共數據産(chǎn)品将出現一片新(xīn)的藍海市場。