數(shù)據(jù)的經(jīng)濟(jì)學(xué)分析:要素、產(chǎn)業(yè)和市場(chǎng)
文/江小涓
中國(guó)社會(huì)科學(xué)院大學(xué)教授、國(guó)務(wù)院原副秘書(shū)長(zhǎng)
去年以來(lái),數(shù)據(jù)是一個(gè)很熱的熱點(diǎn),從經(jīng)濟(jì)學(xué)的角度需要一個(gè)很好的分析框架,因?yàn)榻?jīng)濟(jì)學(xué)中的生產(chǎn)要素分析是一個(gè)非常成熟的體系。我們現(xiàn)在把數(shù)據(jù)當(dāng)成生產(chǎn)要素,這對(duì)經(jīng)濟(jì)學(xué)界的理論提出了很大的挑戰(zhàn),我們來(lái)探討研究什么問(wèn)題,才能稱之為學(xué)術(shù)研究。中國(guó)是首個(gè)把數(shù)據(jù)作為生產(chǎn)要素的國(guó)家,這在國(guó)際上是沒(méi)有先例的。作為一種生產(chǎn)要素,確權(quán)、交易、收益等概念需要納入分析框架中;作為一個(gè)產(chǎn)業(yè),產(chǎn)業(yè)組織、生產(chǎn)消費(fèi)、價(jià)格形成等概念需要納入分析框架中;作為一個(gè)市場(chǎng),創(chuàng)新、競(jìng)爭(zhēng)、公共品等概念需要納入分析框架中??紤]到數(shù)據(jù)的特點(diǎn),還需要在分析中擴(kuò)展框架和增加維度。并且,研究方向要呼應(yīng)經(jīng)濟(jì)學(xué)的宗旨:研究社會(huì)資源配置的總體效率并盡可能合理分配??傊畬W(xué)術(shù)研究應(yīng)該致力于知識(shí)體系的構(gòu)建和完善。當(dāng)下關(guān)于數(shù)據(jù)要素市場(chǎng)的研究,比較集中在數(shù)據(jù)確權(quán)、定價(jià)、交易等領(lǐng)域,希望學(xué)術(shù)界整體在數(shù)據(jù)研究方面繼續(xù)加強(qiáng)學(xué)術(shù)含量高的研究,來(lái)促進(jìn)理論發(fā)展,服務(wù)實(shí)踐,促進(jìn)國(guó)際交流,這是過(guò)去一年多我在參與數(shù)據(jù)問(wèn)題時(shí)非常深切的體會(huì)。從經(jīng)濟(jì)學(xué)視角思考,數(shù)據(jù)研究涉及非常多的學(xué)術(shù)問(wèn)題:數(shù)據(jù)作為要素,配置效率怎么樣,比如確權(quán)、交易和收益的制度安排,最終希望配置的效率最高;數(shù)據(jù)作為產(chǎn)業(yè),需要研究具體經(jīng)濟(jì)主體的行為及其市場(chǎng)影響,例如消費(fèi)者和生產(chǎn)者行為、均衡價(jià)格、創(chuàng)新行為等;數(shù)據(jù)作為市場(chǎng),要研究數(shù)據(jù)市場(chǎng)的規(guī)則、行為和結(jié)構(gòu),特別是AI出現(xiàn)以后的巨型企業(yè),對(duì)競(jìng)爭(zhēng)規(guī)則、壟斷的判定,政府的規(guī)制該怎么做,是非常具有挑戰(zhàn)的問(wèn)題;數(shù)據(jù)作為半公共品,公共利益和市場(chǎng)效益如何權(quán)衡,政府供給和市場(chǎng)供給的組合怎么判斷。
接下來(lái)舉例來(lái)講,數(shù)據(jù)要素我以確權(quán)、流通和收益為例,數(shù)據(jù)產(chǎn)業(yè)我用創(chuàng)新范式的改變作為例子,數(shù)據(jù)市場(chǎng)我們用規(guī)模遞增下的競(jìng)爭(zhēng)和壟斷作為例子,公共數(shù)據(jù)以免費(fèi)開(kāi)發(fā)和收費(fèi)開(kāi)發(fā)的平衡作例子。
關(guān)于數(shù)據(jù)要素
數(shù)據(jù)是一個(gè)生產(chǎn)要素,又是一個(gè)非常特別的要素,面臨的理論挑戰(zhàn)非常多。數(shù)據(jù)的獨(dú)特性質(zhì)主要體現(xiàn)在以下幾個(gè)方面:首先是多主體生產(chǎn)因而確權(quán)困難,數(shù)據(jù)的生成過(guò)程錯(cuò)綜復(fù)雜,常常是多方主體相互協(xié)作的結(jié)果,包含了不同主體不同程度的投入和貢獻(xiàn),因此確權(quán)困難。其次是多場(chǎng)景復(fù)用方便,一組數(shù)據(jù)可以被不同主體以不同方式重復(fù)利用,在使用上不具有競(jìng)爭(zhēng)性和排他性,不易清晰明確主張權(quán)力。第三是數(shù)據(jù)中的敏感信息多,許多數(shù)據(jù)的內(nèi)容多層次多元化,可能承載了需要保護(hù)的個(gè)人信息和商業(yè)機(jī)密,即使匿名化和去標(biāo)識(shí)化,也有可能被挖掘出來(lái)。第四是減損貶值快,絕大部分?jǐn)?shù)據(jù)的價(jià)值在于實(shí)時(shí)性,有研究表明一年期以上的數(shù)據(jù)貶值達(dá)到 98% 以上,保值增值十分困難。各位想想,你經(jīng)常點(diǎn)什么外賣,搜索過(guò)什么類型的服務(wù)、APP 就會(huì)推薦推送給你相關(guān)的內(nèi)容,這都是從即時(shí)數(shù)據(jù)中挖掘到的,幾個(gè)月后可能你的口味發(fā)生了變化,按照現(xiàn)在數(shù)據(jù)推送就沒(méi)有意義。第五是具有交易和交互兩類流通方式,特別是交互型流動(dòng)即數(shù)據(jù)在不同主體間的非交易型流通使用,與其他生產(chǎn)要素流通使用的形態(tài)相比有顯著不同。這個(gè)是我們后面要分析的重點(diǎn)問(wèn)題??紤]到上述問(wèn)題,在“數(shù)據(jù)二十條”的起草制定中,針對(duì)數(shù)據(jù)要素這些與其他生產(chǎn)要素不同的特點(diǎn),文件的重點(diǎn)是構(gòu)建起主要架構(gòu),即所謂的“四梁八柱”,許多更具體的內(nèi)容都需要不斷探索發(fā)展,并從社會(huì)有較多共識(shí)、實(shí)踐有迫切需求、符合數(shù)據(jù)要素特征、與理論體系有較好契合性這些角度排出工作的重點(diǎn)。例如,在起步階段不回避“所有權(quán)”,但更強(qiáng)調(diào)持有權(quán)、使用權(quán)、經(jīng)營(yíng)權(quán),讓數(shù)據(jù)先動(dòng)起來(lái)用起來(lái),就是現(xiàn)階段中國(guó)特色數(shù)據(jù)產(chǎn)權(quán)制度的一個(gè)鮮明特點(diǎn)。再如,處理好場(chǎng)內(nèi)交易和場(chǎng)外交易的關(guān)系也是現(xiàn)實(shí)針對(duì)性很強(qiáng)的問(wèn)題。從實(shí)踐看,數(shù)據(jù)流通使用既有通過(guò)數(shù)據(jù)交易所完成的“場(chǎng)內(nèi)交易”,也有企業(yè)與企業(yè)之間直接發(fā)生“場(chǎng)外交易”,更有規(guī)模巨大的非交易型的數(shù)據(jù)交互。因此“數(shù)據(jù)二十條”并未強(qiáng)調(diào)以哪種流通方式為主,而是提出場(chǎng)內(nèi)交易與場(chǎng)外交易相結(jié)合,不斷探索創(chuàng)新。在公共數(shù)據(jù)開(kāi)放共享和開(kāi)發(fā)利用、構(gòu)建安全貫穿數(shù)據(jù)治理全過(guò)程的安全治理模式等方面,也都從理論與實(shí)踐的結(jié)合出發(fā),既提出長(zhǎng)遠(yuǎn)發(fā)展方向,也明確當(dāng)下工作重點(diǎn)。
理解了數(shù)據(jù)要素的特點(diǎn),就能理解一年多來(lái)數(shù)據(jù)要素市場(chǎng)發(fā)展中的困難與問(wèn)題。數(shù)據(jù)要素交易所在“數(shù)據(jù)二十條”出臺(tái)前后特別是以后快速增長(zhǎng),但大體上是一個(gè)有市無(wú)價(jià),或者有市有價(jià)無(wú)交易的情況,這在其他要素市場(chǎng)上很難看到。各地?cái)?shù)據(jù)交易所發(fā)展很快,到 2023 年 10 月已經(jīng)超過(guò) 48 家。每個(gè)交易所都有成千上萬(wàn)家的數(shù)據(jù)服務(wù)商,也有些入場(chǎng)準(zhǔn)備參與確權(quán)交易的數(shù)據(jù)供應(yīng)方。但一年多下來(lái)(有些起步早的交易所嘗試時(shí)間更長(zhǎng),有些已有十年之久)數(shù)據(jù)交易量非常少,整體上仍在嘗試性起步階段。其實(shí)許多數(shù)據(jù)持有者都明白,數(shù)據(jù)交易很不容易,那他們?yōu)槭裁捶e極“入場(chǎng)”呢?企業(yè)期待數(shù)據(jù)入表,將數(shù)據(jù)資產(chǎn)化,進(jìn)而能夠去做金融創(chuàng)新、融資擔(dān)保或資產(chǎn)證券化等。下圖是各個(gè)數(shù)據(jù)交易所表達(dá)自己平臺(tái)能夠做什么的邏輯:做數(shù)據(jù)資產(chǎn)登記、數(shù)據(jù)資產(chǎn)評(píng)估;然后發(fā)放數(shù)據(jù)資產(chǎn)憑證,進(jìn)而入表;入表后的主線是去做金融創(chuàng)新、融資貸款等,其次是進(jìn)行數(shù)據(jù)資產(chǎn)的交易。我和銀行開(kāi)玩笑,說(shuō)“數(shù)據(jù)要素市場(chǎng)建設(shè)發(fā)展的接力棒交到了金融領(lǐng)域,你們遲遲不接棒”。金融業(yè)不敢往下做的原因之一,就是認(rèn)為數(shù)據(jù)資產(chǎn)定價(jià)、交易方式特別是易貶損特點(diǎn)帶來(lái)的挑戰(zhàn)和風(fēng)險(xiǎn)都是新問(wèn)題,需要積極而謹(jǐn)慎,發(fā)展與安全并重。不過(guò),雖然我們將數(shù)據(jù)納入傳統(tǒng)生產(chǎn)要素分析框架中有困難,但這是一個(gè)新事物,需要留給創(chuàng)新足夠的時(shí)間和空間。而且我們不一定要將其“裝”進(jìn)我們熟悉的體系構(gòu)建中間去,要允許探索。但從學(xué)術(shù)理論角度看,總要構(gòu)建一個(gè)學(xué)術(shù)體系出來(lái),這是一個(gè)非常有創(chuàng)新意義也有挑戰(zhàn)的領(lǐng)域。
關(guān)于數(shù)據(jù)產(chǎn)業(yè)
數(shù)據(jù)產(chǎn)業(yè)鏈條中,各環(huán)節(jié)參與方的行為和以往不一樣,這個(gè)方面要研究的新問(wèn)題很多。因?yàn)樽罱以谧鲆豁?xiàng)數(shù)字時(shí)代創(chuàng)新問(wèn)題研究,就拿它舉例?,F(xiàn)在數(shù)據(jù)創(chuàng)新范式按照國(guó)內(nèi)外的很多學(xué)者來(lái)說(shuō),進(jìn)入了“數(shù)據(jù)密集型”的科研創(chuàng)新范式。我們能看到除了數(shù)字行業(yè)自身以外,生物醫(yī)學(xué)、高能物理、地球科學(xué)、海洋科學(xué)很多都是以信息科學(xué)為支撐的基礎(chǔ)研究領(lǐng)域,如果數(shù)據(jù)觀測(cè)處理能力不高,它們的進(jìn)展是非常困難的。生命科學(xué)中,蛋白質(zhì)怎么預(yù)測(cè)出來(lái),不是生命科學(xué)自身的原創(chuàng)性發(fā)現(xiàn),而是數(shù)字技術(shù)應(yīng)用帶來(lái)的結(jié)果,其中的原理早就知道,但就是算不出來(lái)?,F(xiàn)在,世界進(jìn)入數(shù)字時(shí)代,數(shù)字技術(shù)迅速發(fā)展和海量數(shù)據(jù)的產(chǎn)生不僅顯著影響經(jīng)濟(jì)社會(huì)運(yùn)行方式,而且推動(dòng)著科研范式的深刻變革。這種變革不是原來(lái)創(chuàng)新范式內(nèi)部因素和結(jié)構(gòu)的調(diào)整,而是“數(shù)據(jù)”這個(gè)新要素和數(shù)據(jù)復(fù)雜交互形成的“數(shù)據(jù)關(guān)系”這些新變量加入所引發(fā)的創(chuàng)新要素、創(chuàng)新主體和創(chuàng)新組織的深刻變革。
我們現(xiàn)在講到數(shù)據(jù)和數(shù)據(jù)關(guān)系,不光是數(shù)據(jù)量多少,主要是數(shù)據(jù)關(guān)系影響了創(chuàng)新的重要維度。我們現(xiàn)在 AI 發(fā)展相對(duì)滯后有很多原因,能夠共享的信息的數(shù)量和質(zhì)量比較差,是影響下一步人工智能非常重要的因素。數(shù)據(jù)和算力決定誰(shuí)來(lái)創(chuàng)新,包括很重要的原始創(chuàng)新。大模型的訓(xùn)練和調(diào)整需要極其巨大的數(shù)據(jù)、算力和算法的投入,Transformer 架構(gòu)進(jìn)入主流以后,AI 算力每?jī)赡暝鲩L(zhǎng) 275 倍,在計(jì)算機(jī)本身有革命性的變革之前,只能靠擴(kuò)量來(lái)增強(qiáng)算法的能力,所以目前只有大科技企業(yè)有雄厚的財(cái)力足以吸引大批頂尖的 AI 人才,從而以算力、算法和數(shù)據(jù)的最佳結(jié)合來(lái)推動(dòng)人工智能前沿的突破,這就是最領(lǐng)先的 AI 大模型的變化。
如下圖,2014 年是一個(gè)轉(zhuǎn)折點(diǎn),AI 系統(tǒng)不是高校研發(fā)后的產(chǎn)業(yè)轉(zhuǎn)化,而是從最基本的數(shù)學(xué)算法開(kāi)始,都由產(chǎn)業(yè)界來(lái)做,2023 年 32 個(gè)重要的機(jī)器學(xué)習(xí)模型都誕生在產(chǎn)業(yè)界。我們現(xiàn)在也經(jīng)常講國(guó)家創(chuàng)新體系,集中力量辦大事,這方面也要考慮到數(shù)字時(shí)代的這種產(chǎn)業(yè)創(chuàng)新范式變革。這種海量的算力、數(shù)據(jù)以及人才迅速?zèng)Q策的能力、技術(shù)迭代的速度,完全是另外一種創(chuàng)新的組織架構(gòu),其中的變化是非常重要的。
關(guān)于數(shù)據(jù)市場(chǎng)
看待數(shù)據(jù)市場(chǎng),需要研究市場(chǎng)的規(guī)則、行為和結(jié)構(gòu),特別是 AI 出現(xiàn)以后的“小規(guī)模企業(yè)+巨大市場(chǎng)”是非常具有挑戰(zhàn)的問(wèn)題,對(duì)規(guī)模遞增下的競(jìng)爭(zhēng)和壟斷的分析也是我們的一個(gè)困惑。我們不能簡(jiǎn)單地認(rèn)為市場(chǎng)從長(zhǎng)期看會(huì)解決這個(gè)問(wèn)題的,然后完全交給市場(chǎng)去處理。規(guī)模遞增并不是數(shù)據(jù)市場(chǎng)的獨(dú)有特點(diǎn),軟件業(yè)也有這個(gè)特點(diǎn),但開(kāi)源模式限制了規(guī)模遞增導(dǎo)致的大者愈大,因此壟斷問(wèn)題沒(méi)有走向極端。雖然領(lǐng)先者有規(guī)模遞增的能力,但是開(kāi)源之后,更多的開(kāi)發(fā)者和應(yīng)用市場(chǎng)出現(xiàn),目前沒(méi)有導(dǎo)致規(guī)模遞增一定會(huì)致使大者越大、強(qiáng)者越強(qiáng)的局面出現(xiàn)。
對(duì)于大模型,我們能期待這個(gè)趨勢(shì)出現(xiàn)嗎?仍是未知。如果理論不能有預(yù)測(cè)性的話,就沒(méi)有價(jià)值。現(xiàn)在我們的知識(shí)能夠想到 OpenAI 在 AI 時(shí)代,其產(chǎn)業(yè)組織、競(jìng)爭(zhēng)壟斷的格局最后會(huì)不會(huì)避免走向極端?也是未知。所以這個(gè)問(wèn)題對(duì)我們是一個(gè)很大的新挑戰(zhàn)。
關(guān)于公共數(shù)據(jù)
公共數(shù)據(jù)的性質(zhì)有很多討論,有觀點(diǎn)認(rèn)為數(shù)據(jù)本身具有公共品性質(zhì),公共數(shù)據(jù)又是政府掌握的數(shù)據(jù),應(yīng)該對(duì)社會(huì)開(kāi)放。公共數(shù)據(jù)對(duì)公眾開(kāi)放是國(guó)際共識(shí)。開(kāi)放數(shù)據(jù)的定義是“公眾可獲取的、能夠被用戶完整觀測(cè)和使用的數(shù)據(jù)”。2009 年,美國(guó)的奧巴馬政府頒布了《開(kāi)放政府指令》(US Open Government Directive);2018 年 12 月 24 日,美國(guó)國(guó)會(huì)通過(guò)《開(kāi)放政府?dāng)?shù)據(jù)法案》,要求聯(lián)邦機(jī)構(gòu)必須以“機(jī)器可讀”格式,即以方便公眾在智能手機(jī)或電腦上閱讀的數(shù)據(jù)格式,發(fā)布任何不涉及公眾隱私或國(guó)家安全的“非敏感”信息。例如,紐約市的政府及分支機(jī)構(gòu)所擁有的數(shù)據(jù)必須對(duì)公眾實(shí)施開(kāi)放,市民們使用這些信息不需要經(jīng)過(guò)任何注冊(cè)、審批的繁瑣程序,使用數(shù)據(jù)也不受限制。2011 年,巴西、印尼、墨西哥、挪威、南非、菲律賓、英國(guó)和美國(guó)簽署了《開(kāi)放數(shù)據(jù)聲明》,公共數(shù)據(jù)開(kāi)放也是 2011 年成立的“開(kāi)放政府合作伙伴”。迄今為止,全球已經(jīng)有 75 個(gè)國(guó)家加入這一計(jì)劃。國(guó)內(nèi)政府?dāng)?shù)據(jù)開(kāi)放發(fā)展至今,發(fā)展和應(yīng)用最好的主要還是地理位置信息的開(kāi)放、公共設(shè)施的數(shù)據(jù)開(kāi)放(圖書(shū)館、教育機(jī)構(gòu)、公共wifi等)、涉及健康安全的數(shù)據(jù)開(kāi)放(比如河流洪水水位、交通擁堵?tīng)顩r、空氣指數(shù)等)、市場(chǎng)監(jiān)管數(shù)據(jù)開(kāi)放(企業(yè)信息查詢、行政處罰查詢等)。這些信息現(xiàn)已可以通過(guò)多種途徑獲得。政府?dāng)?shù)據(jù)開(kāi)放意義重大,但多年下來(lái)動(dòng)力不夠是普遍問(wèn)題。作為數(shù)據(jù)提供者的政府機(jī)構(gòu)并不能從中直接得到經(jīng)濟(jì)回報(bào),相反承擔(dān)著泄露商業(yè)秘密和個(gè)人隱私的巨大風(fēng)險(xiǎn),即便對(duì)數(shù)據(jù)采取“脫敏”處理也無(wú)法完全消除隱患。從道理上看,允許對(duì)數(shù)據(jù)開(kāi)放并有一些收費(fèi)也有合理性,例如有些原始數(shù)據(jù)不能直接開(kāi)放共享,要做成數(shù)據(jù)產(chǎn)品;再如有些公共數(shù)據(jù)并不被廣大公民和市場(chǎng)主體所需要,是某些企業(yè)的運(yùn)營(yíng)需要。公共品是為廣大公民和市場(chǎng)主體服務(wù)的,對(duì)少數(shù)人服務(wù)“用者付費(fèi)”這是公共品的基本原則。今后,要尋求免費(fèi)開(kāi)放(開(kāi)放共享)與收費(fèi)開(kāi)放(開(kāi)發(fā)利用)的平衡?!皵?shù)據(jù)二十條”里的提法是:“推動(dòng)用于公共治理、公益事業(yè)的公共數(shù)據(jù)有條件無(wú)償使用,探索用于產(chǎn)業(yè)發(fā)展、行業(yè)發(fā)展的公共數(shù)據(jù)有條件有償使用”。目前看,對(duì)公共數(shù)據(jù)有償開(kāi)發(fā)開(kāi)了一個(gè)口子以后,政府和相關(guān)公共企事業(yè)單位動(dòng)力更強(qiáng)勁,行動(dòng)更迅速。各地政府紛紛成立國(guó)有數(shù)據(jù)運(yùn)營(yíng)公司開(kāi)展政府?dāng)?shù)據(jù)的授權(quán)運(yùn)營(yíng),還可以搞二級(jí)合作商,獲取合理的收入,這是一個(gè)非常普遍的趨勢(shì)。政府大規(guī)模出售公共數(shù)據(jù),公共品性質(zhì)的數(shù)據(jù)轉(zhuǎn)化為商業(yè)化數(shù)據(jù),需要學(xué)術(shù)理論給予分析和解釋,至少對(duì)公共品理論的發(fā)展提出了要求??偟膩?lái)講,中國(guó)是一個(gè)數(shù)據(jù)生產(chǎn)大國(guó)和使用大國(guó),我們是首先提出數(shù)據(jù)要素概念的國(guó)家,其中的實(shí)踐探索多元而豐富,期待學(xué)術(shù)界同仁共同努力,構(gòu)建符合學(xué)術(shù)理論規(guī)范、包含數(shù)據(jù)實(shí)踐主要問(wèn)題、體現(xiàn)中國(guó)數(shù)據(jù)發(fā)展特色的學(xué)術(shù)體系。