1.近百年、50年基礎數據集的質量控制、均一性研究
1.1 站點資料概況
原始數據來自與國家氣象信息中心氣象資料室收集整理的中國大陸地區1900年1月-2009年12月的所有氣象觀測站(1951年以后為國家基本、基準站點)的逐月降水量數據。另外,我們嘗試引入美國NOAA研制的全球歷史氣候網數據集(Global Historical Climatology Network, monthly version2,經過了質量控制和均一性訂正)中中國范圍內的作為補充。但分析表明,GHCN數據集中的臺站基本與我們收集到的臺站重疊,但GHCN某些臺站的降水資料更完整;因此,我們將這些臺站的降水資料引入以充實原有降水資料。另外,從GHCN中獲得的香港站的降水資料也被用于后續分析中。
逐日尺度降水質量控制包括:氣候界限值檢驗和空間一致性檢查;逐月降水量質量控制包括:極值檢驗、時間域檢驗、空間域檢驗。方法均采用目前國際上較為成熟的方法。
臺站數量的變化情況見圖1,如圖,1930年之前臺站數量在100個以下,30年代至40年代中期臺站數量在100~200個之間,40年代中期至50年代初期臺站數量又回落至100個以下,此后臺站數量激增,1960年之后臺站數量基本維持在700個左右。圖2分別給出了解放前的臺站分布和所有臺站的分布。如圖所示,解放前西部臺站很少,而這個問題在建國后基本得到解決。
圖1 1900-2009年臺站數逐年變化曲線
圖2 觀測臺站的地理分布
(上圖:1900-1950年有一年以上觀測資料的臺站 下圖:所有臺站)
1.2 降水資料均一性檢驗、訂正
從每個待檢站臨近的所有臺站中挑選4個與待檢站序列相關系數最高的年
下一步對該序列進行標準化,標準化的目的是使得序列的值在1附近波動(如果是差值則在0附近波動),并且近似服從N (0,1)分布。即:
(3)
SNHT方法目前已經有很多版本,可以針對不同的要素和實際情況采用不同的版本,各種版本各有優勢,根據降水序列的實際情況,經過比較,采用單不連續點的平均值檢驗的效果較好。至于兩個以上不連續點的檢驗則通過分段來進行檢驗。
對序列{Zi}(i=1,2,……,n)這樣假設為:
如果{Zi}序列沒有不連續點存在,則統計假設為:H0:對于任意i,Zi ∈N(0,1)
如果{Zi}有一個不連續點a,則統計假設為:
Zi ∈N(μ1,1) i ∈{1,…,a}
Zi ∈N(μ2,1) i ∈{a+1,…,n} (4)
μ1,μ2分別為假設不連續點a前后兩個序列的平均值(μ1≠μ2),n為樣本容量。σ為前后兩段的均方差,因為沒有考慮方差間斷,所以前后不變。根據最大似然比率的標準技術(Lindgren,1968)〔18〕,經過一定的近似處理,構造統計量Ts作為顯著性判據:
訂正后的序列,在應用了上述訂正系數后,序列就可以認為是均一的。對于月值的訂正,則根據各月逐年待檢序列和參考序列的差值的線性關系將該補償值應用到各月序列中,得出逐月訂正值。
2. 不同尺度、分辨率網格數據集的研制
區域以及全球尺度的高密度氣象數據,是氣候變化和生態系統研究中所需的重要數據。但是由于研究區特殊的地理位置以及氣象觀測儀器設備的不足,使得獲取一定區域的實測數據存在困難。在研究全球或區域大尺度氣候變化序列時,往往需要先將氣候序列網格化,以確保網格序列能代表相同面積上的氣候變化,從而有效減小或避免空間采樣誤差。因此,研究者往往需要借助一定的空間分析技術,實現對氣象要素的空間插值。
基于質量控制和均一化后的降水量觀測數據,制作中國區域近百年網格降水量數據集。鑒于解放前西北內陸區的實際臺站分布非常稀疏,因此課題組將研制兩套不同時空分辨率的中國降水量數據集,第一套是中國5°×5°的逐月網格降水量數據集,時間范圍從1901年——2007年,簡稱MON_5°;第二套是中國0.5°×0.5°的逐日網格降水量數據集,時間范圍從1957年——2007年,簡稱DAY_0.5°。
2.1 中國5°×5°的逐月網格降水量數據集
5°×5°的逐月網格降水量數據集采用反距離加權平均的方法?!》淳嚯x加權法又名空間滑動平均法,它是根據近鄰點的平均值估計未知點的方法,該方法基于地理學第一定律——相似相近原理,即根據樣本點周圍數值隨著其到樣本點距離的變化而變化,并且呈現反相關,距離樣本點越近,其數值和樣本點的數值越近??杀硎緸?br />
(7)
顯著影響著插值的結果,這里取k = 1進行插值.
2.2 中國0.5°×0.5°的逐日網格降水量數據集。
針對全國日降水量氣候觀測值,對該數據進行傅立葉變換剔除高頻噪聲,得到臺站降水量的日氣候值。這里選取Shepard空間插值方法對降水量日氣候值進行2維(經度和緯度)空間插值,得到日氣候值的分析場資料,該資料的空間分辨率為0.05°×0.05°。Shepard方法類似于反距離權重插值法,但它還校正站點方位的影響,且不需要提前設定初始值,是一種相對簡單且有效的空間插值方法。
降水量受地形影響大,目前國際上還沒有一種非常好的方法來訂正地形對降水量的影響。為了進一步考慮地形影響,引入了國際上公認的質量最好的氣候數據集PRISM (Parameter-elevation Regressions on Independent Slopes Model)數據。該數據通過建立點雨量觀測值與局地海拔高度的經驗關系進而生成了考慮地形影響的氣候標準值,被共認為是至今質量最好的氣候數據集(http://www.prism.oregonstate.edu/)。在定義中國區域的PRISM數據時,共利用了2600多個臺站的30年標準值。目前得到的PRISM數據的空間分辨率為0.05°。
進一步定義Shepard插值得到的背景場與對應日期500米分辨率PRISM數據的比例系數,并將此系數與Shepard插值得到的背景場相乘,得到經過PRISM訂正后的日氣候背景場。此時定義的日氣候背景場在一定程度上考慮了地形影響。
為了減小由于降水量空間分布上不連續帶來的插值誤差,沒有直接對降水量數據進行空間插值,而是先利用日氣候分析值定義降水量的比值數據(如式8):
(8)
即某日降水量的比值數據是站點觀測的日降水量與對應網格、對應日期氣候背景場的商。
某月的降水量分析數據是該月比值數據與對應月份、對應網格的氣候分析值的乘積;同樣,某日的降水量分析數據是該日比值數據與對應日期、對應網格的氣候分析值的乘積,即:
降水量網格數據=對應網格的降水量比值分析值×某網格的降水量氣候分析值
此時得到的是空間分辨率為0.05°×0.05°的降水量網格數據。因為地形對降水量的影響隨海拔高度的變化非常顯著,分辨率越高得到的網格數據越有利于提高地形校正效果。另外,如此高的分辨率也可以更好的滿足用戶對不同空間分辨率數據的需求,最后生成的0.5°×0.5°的產品是在此基礎上空間重采樣得到的。