黑龍江大學馬海群主持完成的國家社會科學基金項目“開放數(shù)據(jù)與數(shù)據(jù)安全的政策協(xié)同研究”(項目批準號為:15ATQ008),最終成果為同名專著。課題組成員有:周麗霞、趙建平、賀延輝、牛曉宏、張靜萍、孫瑞英、洪偉達、唐守利、楊志和、蒲攀、石岱。
一 研究的目的和意義
隨著大數(shù)據(jù)、人工智能概念的興起,世界各國對數(shù)據(jù)掌控尤為重視,數(shù)據(jù)不但在質和量上增長迅速,而且在人類生活和社會創(chuàng)新發(fā)展中更是占據(jù)著重要地位。誰掌握了數(shù)據(jù)和數(shù)據(jù)分析方法,誰就將會在大數(shù)據(jù)領域領先,無論是國家文明還是商業(yè)組織,只要充分發(fā)揮大數(shù)據(jù)技術的價值,迎接大數(shù)據(jù)時代面臨的挑戰(zhàn),如數(shù)據(jù)安全和隱私問題,并及時進行應對,就會處于大數(shù)據(jù)時代的不敗之地。大數(shù)據(jù)環(huán)境下,隨著數(shù)字經濟的興起和數(shù)據(jù)產業(yè)的發(fā)展,數(shù)據(jù)范式正在形成,數(shù)據(jù)治理成為重要的政府治理和社會治理手段;數(shù)據(jù)治理的兩個核心主題即為開放數(shù)據(jù)與數(shù)據(jù)安全,數(shù)據(jù)治理的重要工具是政策手段,數(shù)據(jù)治理最佳效能狀態(tài)的一種體現(xiàn)方式則是對開放數(shù)據(jù)與數(shù)據(jù)安全的政策協(xié)同的研究。信息與數(shù)據(jù)的開放與保護、共享與安全,是透明化現(xiàn)代社會健康發(fā)展與前進的兩股交織互動的重要力量,是信息資源建設需要面臨的重要課題,要加強中文網絡信息資源建設,特別是數(shù)據(jù)和知識挖掘,需要技術支持和政策扶持。那么在技術方面,數(shù)據(jù)庫技術及網絡技術已相對成熟,那就需要從政策視角出發(fā),激勵數(shù)據(jù)建設和服務。數(shù)據(jù)安全政策與開放數(shù)據(jù)政策的相互作用與協(xié)調發(fā)展,則是國家對信息資源宏觀規(guī)劃與配置的核心手段。
二 成果的主要內容
該成果分別從政策擴散、語料庫、知識圖譜的角度出發(fā),對開放數(shù)據(jù)和數(shù)據(jù)安全政策及數(shù)據(jù)政策中開放數(shù)據(jù)和數(shù)據(jù)安全主題進行協(xié)同性研究。
(1)政策擴散角度:在研究內容上,選取“開放數(shù)據(jù)”和“數(shù)據(jù)安全”這兩類看似呈現(xiàn)出對立性的政策,根據(jù)發(fā)布機構層級不同,在自建語料庫中按照中央層級和地方層級分別選擇符合要求的政策文本作為研究樣本,共計得到中央層級發(fā)布的101條政策文本,地方層級發(fā)布的230條政策文本,總計331條政策文本,覆蓋范圍上較為全面;在研究方法的設計上,本研究擬從政策擴散的角度出發(fā),同時結合研究內容的特點,定義相關指標,考量不同政策之間文本主題詞的擴散程度,利用“桑基圖”的特點,嘗試將定量分析與結果可視化結合起來,對兩類政策之間的協(xié)同情況進行直觀的展示。該成果的突出特色在于將“政策擴散”的思想應用到兩類政策的協(xié)同探究上,改變了以往的“政策擴散”思想主要應用在“同類政策”研究上的局面。通過定量研究的手段,直觀鮮明地體現(xiàn)出了兩類政策之間的協(xié)同程度,并由此體現(xiàn)出了兩者之間不協(xié)同性主要表現(xiàn)的方面;主要建樹表現(xiàn)在對協(xié)同理論和政策擴散理論的內涵進行了分析的同時,并未單純從理論層面上進行解讀,反而借鑒熱力學第二定律的有關理念形象,直觀地對二者之間的邏輯關系進行了闡述,同時根據(jù)設計的方法和提出的指標結合具體實例進行了相關的實證分析,證明了所提出的方法的可行性。
(2)語料庫角度:利用語料庫研究方法結合內容分析法和聚類分析法,通過自建語料庫采集并篩選數(shù)據(jù)類政策文本446條,其中包括根政策19條,干政策41條,枝政策386條。為提升政策分析的精準度,選用主題關系協(xié)同度和復合系統(tǒng)協(xié)同度兩個視角對現(xiàn)有數(shù)據(jù)類政策中開放數(shù)據(jù)和數(shù)據(jù)安全兩類主題進行協(xié)同關系分析,最終通過計算結果算出政策協(xié)同關系的取值范圍,結合數(shù)據(jù)給出數(shù)據(jù)類政策對策及建議并列出現(xiàn)存政策中協(xié)同關系較好的政策文件。基于實證表明,我國正處于不斷完善相關數(shù)據(jù)政策體系階段,開放數(shù)據(jù)和數(shù)據(jù)安全政策多數(shù)相對獨立,并沒有形成體系融入現(xiàn)有的數(shù)據(jù)類政策中來,要促進開放數(shù)據(jù)與數(shù)據(jù)安全子系統(tǒng)間協(xié)同,須建立開放數(shù)據(jù)及數(shù)據(jù)安全協(xié)同創(chuàng)新機制。開放數(shù)據(jù)及數(shù)據(jù)安全子系統(tǒng)和子子系統(tǒng)的平衡發(fā)展有助于復合系統(tǒng)協(xié)同能力發(fā)展。復合系統(tǒng)協(xié)同強調子系統(tǒng)間相互作用,加強子系統(tǒng)之間良好協(xié)作的意義大于單個子系統(tǒng)有序度的提升。政府應促進開放數(shù)據(jù)和數(shù)據(jù)安全體系的緊密結合,從實際政策數(shù)據(jù)分析來看,單獨提升某一個子系統(tǒng)的關注度,很難提升二者之間的協(xié)同效應。如某大數(shù)據(jù)政策中開放數(shù)據(jù)子系統(tǒng)的有序度持續(xù)上升,但該政策中并未提及安全相關事宜,因此數(shù)據(jù)安全子系統(tǒng)有序度并未持續(xù)上升,而是呈現(xiàn)平穩(wěn)或波動狀態(tài)。在數(shù)據(jù)開放政策制定的同時,還要確保開放的數(shù)據(jù)安全穩(wěn)定,要更加注重開放及安全子系統(tǒng)各子子系統(tǒng)之間的協(xié)同。
(3)知識圖譜角度:“基于知識圖譜的開放數(shù)據(jù)與數(shù)據(jù)安全政策協(xié)同研究”應用知識圖譜針對政策中兩類不同主題——開放數(shù)與數(shù)據(jù)安全的協(xié)同情況做出探索性研究,并選擇政策國務院關于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知的國發(fā)〔2015〕50號《促進大數(shù)據(jù)發(fā)展行動綱要》完成實踐應用,該研究基于人工智能下的知識圖譜技術為核心,運用全文本數(shù)據(jù)作為研究分析對象,選擇數(shù)據(jù)挖掘中關聯(lián)規(guī)則構建推理模型,探索性地完成關于研究主題——開放數(shù)據(jù)與數(shù)據(jù)安全協(xié)同情況的推理分析:首先,完成政策全文數(shù)據(jù)的文本核心意圖、政策熱點等統(tǒng)計與分析,并以此為基礎選擇政策文本中的“任務”這部分內容完成該政策中兩類不同主題協(xié)同情況的分析。研究結果表明,通過基于知識圖譜技術的政策協(xié)同情況探索研究,該方法可以推廣應用于多篇政策文本中不同主題協(xié)同情況分析。該研究方法創(chuàng)新性在于探索完成政策分析領域知識圖譜的應用可行性,研究突出特色在于將自然科學中強人工智能技術——認知智能與政策文本潛在知識的挖掘難題相結合的研究。研究思路中體現(xiàn)自然科學發(fā)展最新技術方法與社會科學有機融合:一是研究設計按照標準化軟件工程規(guī)范可行性分析、需求分析、概要設計、詳細設計與代碼實現(xiàn)、結果可視化展示、研究結果與研究問題有機結合的應用分析;二是研究核心問題按照知識圖譜生命周期中知識提取、知識表示、知識存儲、知識融合、知識推理與知識應用完成政策中以文本形式闡述的不同主題的協(xié)同程度情況研究;該研究中突出貢獻在于提出——將“關聯(lián)規(guī)則”數(shù)據(jù)挖掘算法作為知識圖譜技術核心部分知識推理機的動力,構建政策協(xié)同情況的推理模型,針對目前無法客觀性、權威性界定政策協(xié)同度參考值的前提下研究政策的協(xié)同問題這一難題提供了一種科學的、可行的、可移植應用的解決方法。本研究探索了自然科學領域中的技術前沿方法與社會科學界研究熱點與難點解決的無縫對接:針對政府政策協(xié)同問題輔助決策研究,其學術與應用價值一方面拓展性地實現(xiàn)了領域知識圖譜應用的寬度,另一方面延展性地實現(xiàn)了政策文本研究問題的深度,該研究在政策文本深層次語義層挖掘具備開創(chuàng)性的應用價值。
三 對策建議
基于以上不同角度對開放數(shù)據(jù)和數(shù)據(jù)安全協(xié)同度的分析,該成果提出如下政策對策建議。
(1)建設統(tǒng)一政府數(shù)據(jù)開放共享平臺
平臺用于匯聚、存儲、共享、開放政府數(shù)據(jù),要明確數(shù)據(jù)開放領域及數(shù)據(jù)標準格式,社會公眾和市場主體關注度、需求度高的政府數(shù)據(jù),應當優(yōu)先向社會開放。如信用、交通、醫(yī)療、衛(wèi)生、就業(yè)、社保、地理、文化、教育、科技、資源、農業(yè)、環(huán)境、安監(jiān)、金融、質量、統(tǒng)計、氣象等民生保障服務相關領域的政府數(shù)據(jù)應當優(yōu)先向社會開放。共享數(shù)據(jù)分為無條件共享和有條件共享兩部分,其中無條件共享的政府數(shù)據(jù),應當提供給所有政府機關共享使用;有條件共享的政府數(shù)據(jù),僅提供給相關政府機關或者部分政府機關共享使用。技術層面:政府提供通用的符合技術標準的訪問接口與共享平臺和開放平臺對接;數(shù)據(jù)管理層面:政府數(shù)據(jù)實行分級、分類目錄管理,所開放共享的數(shù)據(jù)能夠使大數(shù)據(jù)為各行業(yè)活動提供強有力的支撐;業(yè)務水平提升層面:數(shù)據(jù)行政主管部門應定期組織行政機關工作人員開展政府數(shù)據(jù)共享開放培訓和交流,提升共享開放業(yè)務能力和服務水平;考核標準層面:各級各類政府機構要制定考核辦法,將政府數(shù)據(jù)共享開放;監(jiān)管評估層面:需要有第三方對政府數(shù)據(jù)進行監(jiān)管與評估。
(2)構建政府數(shù)據(jù)安全保障體系
政府要從制度建設、安全應急演練、安全監(jiān)管、人才培養(yǎng)、知識產權等方面盡快構建完善數(shù)據(jù)安全保障體系,給各行業(yè)的商業(yè)活動提供安全保障環(huán)境。在政府構建數(shù)據(jù)共享開放平臺的前提下,應當依法維護國家安全和社會公共安全,保守國家秘密、商業(yè)秘密,保護個人隱私,任何組織和個人不得利用共享、開放政府數(shù)據(jù)進行違法活動。制度建設層面:政府應當依法建立健全政府數(shù)據(jù)安全管理制度和共享開放保密審查機制,行政機關和共享開放平臺運行、維護單位應當落實安全保護技術措施,全力保障數(shù)據(jù)安全。安全監(jiān)管層面:相關部門要開展大數(shù)據(jù)安全的等級保護、日常巡查、執(zhí)法檢查、信息通報、應急處置等監(jiān)督管理工作。人才培養(yǎng)層面:要創(chuàng)新人才培養(yǎng)模式,建立健全多層次、多類型的數(shù)據(jù)安全人才培養(yǎng)體系,重點培養(yǎng)具有統(tǒng)計分析、計算機技術、經濟管理、數(shù)據(jù)安全等多學科知識的跨界復合型人才。知識產權保護層面:要加強新領域創(chuàng)新成果的知識產權數(shù)據(jù)保護,加強互聯(lián)網、電子商務、大數(shù)據(jù)等領域的知識產權保護規(guī)則研究,推動完善知識產權數(shù)據(jù)保護體系。
(3)保障開放數(shù)據(jù)和數(shù)據(jù)安全政策協(xié)同且穩(wěn)定運行
開放數(shù)據(jù)與數(shù)據(jù)安全主題在明確職責、數(shù)據(jù)立法、知識產權、監(jiān)督預警等方面都存在不同程序的關聯(lián)關系。明確職責:政府應明確所要開放數(shù)據(jù)的采集匯聚、目錄編制、數(shù)據(jù)提供、更新維護和安全管理等工作職責,政府部門應當按照技術規(guī)范,在職責范圍內采集政府數(shù)據(jù),進行處理后實時向共享平臺匯聚,采集政府數(shù)據(jù)涉及多部門,要按照規(guī)定的職責協(xié)同采集匯聚。數(shù)據(jù)立法:由于政府數(shù)據(jù)共享開放與信息安全之間的法律界限不明,在開放數(shù)據(jù)過程中時常與數(shù)據(jù)安全問題產生沖突,因此應加快推進大數(shù)據(jù)相關立法工作進程。知識產權:要加強對開放數(shù)據(jù)知識產權的保護來有效確保數(shù)據(jù)安全穩(wěn)定。通過發(fā)掘新知識和創(chuàng)造新價值及大數(shù)據(jù)領域的智力成果,采取合理的規(guī)則保護其知識產權。不但要通過開放數(shù)據(jù)防止數(shù)據(jù)資源壟斷,保護基于大數(shù)據(jù)的創(chuàng)新動力,實現(xiàn)基礎數(shù)據(jù)資源共享,不斷完善數(shù)據(jù)資源建設體系,發(fā)揮其最大效能;還要通過知識產權保護數(shù)據(jù)獲取、挖掘和開發(fā)主體的利益,實現(xiàn)具有商業(yè)價值的大數(shù)據(jù)的有償轉讓和交易,提升數(shù)據(jù)資源集聚和管理水平。監(jiān)督預警:要建立開放數(shù)據(jù)和數(shù)據(jù)安全的監(jiān)督和預警體系,應由專業(yè)數(shù)據(jù)行政主管部門負責政府數(shù)據(jù)共享開放的監(jiān)督管理和指導工作。政府應著手從以上方面來保證數(shù)據(jù)開放平臺及數(shù)據(jù)安全保障體系的協(xié)同、穩(wěn)定運行。
四 成果的主要價值
該成果以政策擴散、知識圖譜、內容分析、協(xié)同學理論為依據(jù),從政策協(xié)同視角探討開放數(shù)據(jù)及數(shù)據(jù)安全政策以及數(shù)據(jù)政策中開放數(shù)據(jù)與數(shù)據(jù)安全主題間的相互支撐、協(xié)同發(fā)展,學術價值在于可以延伸信息政策體系在大數(shù)據(jù)背景下的內涵拓展,在現(xiàn)有語料庫中提取數(shù)據(jù)類政策文本446條(其中包括根政策19條,干政策41條,枝政策386條),從理論和實證層面上構建協(xié)同框架模型并通過計算結果算出政策協(xié)同關系的取值范圍。貴州省是我國大數(shù)據(jù)政策貫徹落實較好的地區(qū)之一,該成果以貴州省為例利用所建立框架模型及取值范圍,對貴州省的大數(shù)據(jù)政策進行了實證分析。最終給出開放數(shù)據(jù)與數(shù)據(jù)安全政策協(xié)同的對策及建議。