4.0版更新說明:
1.數據更新至2021年
2.修復少部分地區代碼錯誤
3.0版更新說明:
1.數據更新至2020年
2.剔除缺失較多的區縣,轉為平衡面板
3.填補升級。內含原始版本、線性插值、ARIMA填補三個版本數據
注:上圖顯示為2020年,實際更新至2021年
一、數據介紹數據名稱:中國縣域數據庫
數據來源:《中國區域經濟統計年鑒》、《中國縣域統計年鑒》
數據范圍:2000-2021年,包括2721個區縣
樣本數量:平衡面板59862條(2721區縣*22年=59862)
數據整理:馬克數據網,各指標存在不同程度的缺失
更新時間:2023年4月,當前最新4.0版
二、整理方法第一,識別年鑒。利用NLP算法識別《中國區域經濟統計年鑒》、《中國縣域統計年鑒》,并轉為面板數據
第二,完善數據。對比主流數據庫、地方統計局,進一步完善縣域數據
第三,統一地區。匹配民政部編碼,統一使用2019年編碼和地區名稱
第四,統一單位。對不同單位的情況,進行單位換算
第五,人工驗證。得到指標的面板數據,并人工抽樣驗證
第六,平衡面板。將非平衡面板轉為平衡面板數據
第七,線性插值。利用線性趨勢對中間缺失進行填充,得到線性插值版
第八,ARIMA填補。利用時間趨勢,對剩余缺失進行預測,得到ARIMA填補版
最終,保留原始版本、線性插值版、ARIMA填補版
三、數據指標共計83個指標,部分如下:
年份 | 寬帶接入用戶數 | 農林牧漁業總產值 |
行政區劃代碼 | 地區生產總值 | 規模以上工業企業數 |
地區名稱 | 第一產業增加值 | 規模以上工業總產值 |
經度 | 第二產業增加值 | 城鎮固定資產投資完成額 |
緯度 | 工業增加值 | 全社會固定資產投資 |
所屬城市 | 第三產業增加值 | 社會消費品零售總額 |
所屬省份 | 農業增加值 | 房地產開發投資 |
長江經濟帶 | 牧業增加值 | 普通小學學校數 |
行政區域土地面積 | 人均地區生產總值 | 普通中學學校數 |
鄉及鎮個數 | 城鎮單位在崗職工平均工資 | 普通小學專任教師數 |
鄉個數 | 城鎮居民人均可支配收入 | 普通中學專任教師數 |
鎮個數 | 農村居民人均可支配收入 | 普通小學在校生數 |
街道辦事處個數 | 地方財政一般預算收入 | 普通中學在校學生數 |
村民委員會個數 | 各項稅收 | 中等職業教育學校在校學生數 |
年末總戶數 | 地方財政一般預算支出 | 醫院、衛生院床位數 |
鄉村戶數 | 城鄉居民儲蓄存款余額 | 醫院和衛生院衛生人員數_衛生技術人員 |
年末總人口 | 年末金融機構各項貸款余額 | 醫院和衛生院衛生人員數_執業醫師 |
鄉村人口 | 出口額 | 各種社會福利收養性單位數 |
戶籍人口數 | 實際利用外資金額 | 各種社會福利收養性單位床位數 |
年末單位從業人員 | 農作物總播種面積 | 全社會用電量 |
城鎮單位在崗職工人數 | 常用耕地面積 | 城鄉居民生活用電量 |
鄉村從業人員數 | 機收面積 | 廢氣中氮氧化物排放量 |
農林牧漁業從業人員數 | 設施農業占地面積 | 廢氣中煙塵排放量 |
年末第二產業單位從業人員 | 農用機械總動力 | 工業廢氣中二氧化硫排放量 |
年末第三產業單位從業人員 | 糧食總產量 | 藝術表演場館數_劇場、影劇院 |
農業機械總動力 | 棉花產量 | 公共圖書館總藏量 |
固定電話用戶 | 油料產量 | 體育場館機構數 |
移動電話用戶數 | 肉類總產量 |
2000-2022年原始年鑒:www.bio-sorfa.com/article/1147471783
注:整理數據為社區中級會員-附贈數據(點擊底部領取)