GeoDa
GeoDa是一個免費軟件包,可以進行空間數據分析、地理視覺化、空間自相關和空間建模。
它可以在不同版本的Windows 、Mac OS和Linux上運行。該軟件包最初由伊利諾伊大學厄巴納-香檳分校的空間分析實驗室在Luc Anselin的指導下開發。2016年起,芝加哥大學空間數據科學中心(Center for Spatial Data Science,CSDS)接手開發工作。[1]
GeoDa具有執行空間分析、多元探索性數據分析以及全局和局部空間自相關分析的強大功能。它還能夠執行基本的線性回歸。它也提供了一些空間模型,例如空間滯後模型和空間誤差模型,均使用最大似然估計的方法。
歷史
GeoDa取代了以前稱為DynESDA的模塊,該模塊在舊版ArcView 3.x下工作,可用來執行探索性空間數據分析(exploratory spatial data analysis,ESDA)。當前版本的GeoDa已不再依賴ArcView或其他GIS軟件包。
功能
GeoDa中的項目大致由定義網格數據的shapefile和.dbf格式的屬性表組成。屬性表可在GeoDa中編輯。
該軟件包藉助動態鏈接和刷選技術,專用於探索性數據分析和地理可視化。也就是說,當一個項目中有多個視圖或窗口時,在其中一個中選取對象,同一對象會在所有其他窗口中高亮顯示。
GeoDa還能夠生成直方圖、箱形圖、散點圖來對數據進行簡單的探索性分析,也能將這些統計工具與用戶研究的現象的空間分布進行映射和鏈接。
GeoDa中的動態鏈接和刷選
動態鏈接和刷選使用戶能夠交互地發現或確認數據中空間排列的異常模式,或者丟棄這些數據。它允許用戶從空間排列的數據中提取信息,這些操作原本可能需要繁複的計算才能得到有用的統計數據。而後者可能對專業知識和軟件操作能力的要求可能很高。
Anselin莫蘭散點圖
GeoDa提供了研究空間自相關全局模式的一種實用功能:Anselin莫蘭散點圖(Anselin's Moran scatterplot)。這種圖像它描繪的是x軸上的標準化變量與該標準化變量的空間滯後。空間滯後僅是對相鄰空間單元的影響的匯總,它是使用空間權重矩陣算得的,而矩陣有多種不同形式,但最常用的是鄰接矩陣。鄰接矩陣是一個數組,若空間單元j與i鄰接,數組中相應元素(i, j)的值就為1。為方便起見,可將矩陣標準化,即將每個值除以原始矩陣的行的和,使每行之和為1。
本質上,Anselin莫蘭散點圖表示變量在某一位置i的取值與在i附近的取值的關係。散點圖中直線的斜率相當於莫蘭指數,它表示的是全局空間自相關的程度。如果其斜率為正,則表示存在空間正相關:變量在位置i的取值高,則該變量在i相鄰位置的取值很可能也高,即高值聚集在一起;反之的低值亦然。如果散圖中的直線斜率為負,則意味着存在類似國際象棋棋盤的格局,或一種空間競爭,其中若變量在位置i的取值高,與之伴隨的往往是相鄰位置出現低值。
在Anselin莫蘭散點圖中,曲線的斜率計算結果顯示在圖形的頂部。圖片的案例中,這一數值為正,表示犯罪率高的地區,其附近的犯罪率往往也較高,反之亦然。
GeoDa中的全局與局部分析
全局層面的聚類(clustering)即地圖中要素集聚的總體趨勢;而局部層面的聚類(clustering)能夠確定其具體位置。後者可以通過空間關聯的局部指標(local indicators of spatial association,LISA)進行評估。LISA分析能夠確定變量的哪些高值區域,其周圍區域也傾向於是高值,即所謂的高-高聚類;該分析也能同時確定低-低聚類。
這種情況下,需要分析的另一種重要現象是存在離群值:某個位置是高值,但其周圍相鄰位置卻是低值。GeoDa以Anselin莫蘭散點圖的形式提供了這一功能。但需注意,一個值比鄰近的數值更高,未必就表示它是離群值,我們需要評估其關係的統計學顯著性。換句話說,我們可能會發現似乎存在聚類的區域,但是當進行統計程序時,它們在統計上並不是顯著的聚類或離群值。評估統計顯著性的程序中包括:對不同數據排列的蒙特卡羅模擬,以及模擬統計的經驗分布的構建。之後,將最初獲得的值與模擬值的分布進行比較,如果該值超過95百分位,則認為發現的關係在5%上顯著。
參考文獻
延伸閱讀
- Anselin, Luc, Xun Li and Julia Koschinsky (2021). GeoDa, From the Desktop to an Ecosystem for Exploring Spatial Data. Preprint (頁面存檔備份,存於網際網路檔案館)
- Anselin, Luc, Ibnu Syabri and Youngihn Kho (2006). GeoDa: An introduction to spatial data analysis. Geographical Analysis 38, 5-22
- Anselin, Luc, Rey, Sergio J. (2014). Modern Spatial Econometrics in Practice: A Guide to GeoDa, GeoDaSpace, and PySAL. GeoDa Press LLC, Chicago, IL