馬克團隊根據各省份政府工作報告,參考金燦陽(2022)和陶長琪(2022)的做法,借助Python軟件對政府工作報告進行分詞處理,分別統計了省級政府工作報告中與數字經濟相關的關鍵詞詞頻,分別記為數字經濟政策詞頻A、數字經濟政策詞頻B
A文獻參考
B文獻參考
年度趨勢
數據名稱: 政府工作報告-數字經濟政策詞頻
數據范圍:全國31個省份
數據年份:2002-2023年(平衡面板為2007-2023年)
數據來源:地方政府網
數據整理:馬克數據網
數據說明:內含數字經濟相關的60個詞頻明細、文本長度、文本詞頻總數
更新時間:2023年2月
二、整理說明從地方政府網爬取工作報告原始文件
將報告文本整理為面板數據
去除停頓詞,利用python的jieba庫進行精確模式和全模式分詞,統計詞頻和
(精確:'推薦', '馬克', '數據網')
(全:'推薦', '馬克', '克數', '數據', '數據網')
保留中英文、數字、標點符號,利用正則表達式統計60個詞頻
保留中英文、數字,統計全文文本總長度
保存文本詞頻總數、60個詞頻明細、文本長度
三、指標說明一共71個指標,如下
行政區劃代碼 | 年份 | 地區 |
所屬地域 | 長江經濟帶 | 文本總長度 |
僅中英文-文本總長度 | 文本總詞頻-全模式 | 文本總詞頻-精確模式 |
數字經濟政策詞頻和-A | 數字經濟政策詞頻和-B | 數字經濟_A |
智能經濟_A | 信息經濟_A | 知識經濟_A |
智慧經濟_A | 數字化信息_A | 現代信息網絡_A |
信息和通信技術_A | ICT_A | 通信基礎設施_A |
互聯網_A | 云計算_A | 區塊鏈_A |
物聯網_A | 數字化_A | 數字鄉村_A |
數字產業_A | 電子商務_A | 5G_A |
數字基礎設施_A | 人工智能_A | 電商_A |
大數據_A | 數據化_A | 產業數字化_A |
數字產業化_A | 數據資產化_A | 智慧城市_A |
云服務_A | 云技術_A | 云端_A |
電子政務_A | 移動支付_A | 線上_A |
信息產業_A | 軟件_A | 信息基礎設施_A |
信息技術_A | 數字生活_A | 智能制造_B |
智能化_B | 智慧化_B | 智慧城市_B |
云計算_B | 上云_B | 云平臺_B |
云服務_B | 大數據_B | 數據安全_B |
數據服務_B | 數據治理_B | 數據共享_B |
工業互聯網_B | 物聯網_B | 區塊鏈_B |
機器人_B | 5G_B | 數字技術_B |
數字化_B | 數字經濟_B |
面板形態
數據概覽
注:該數據為馬克社區高級會員-附贈數據