|
站点数据是气象数据很重要的一部分,尤其是在观测数据方面,站点数据一般存放于.txt(.csv)文件中,首先就需要读取数据。 以一套中国气象数据网下载的某省的1979-2019年逐月气温的站点数据为例,数据文件格式为TXT文本格式: (数据下载地址:www.52ocean.cn)
TXT文本保存的数据如下图所示:
- q }4 K$ v$ k# ~$ ]) u) ?
如果没有导入pandas库,需要现在anaconda里下载pandas库,再在spyder理运行python代码,对于这类简单排列的.txt文件,可以通过np.load读取,但用pandas的.read_csv更为方便: - . D3 m% ^+ Z6 T! T- R5 C) ^
% i8 M5 S% T9 z9 f4 `6 V1 \/ i
# X1 _; A0 g/ V% ^- {/ E% g, V6 R' O& g
) v9 S0 K& p6 t3 ~
import pandas as pddata = pd.read_csv("tem.txt", skiprows=1, sep=',', header=None)print(data)5 g* a& o. M0 y: }( k& V
文件信息查看如下:
可以看到,文件的数据有22列,492行,第0列是年份,第1列是月份,剩余列数是变量数据。 skiprows=1表示跳过了前1行的文件头(因为第一行的数据中含有非数字的字符,所以选择跳过不读取)。 如果其他文件中数据是以空格为间隔,则sep='\s+'定义了数据间隔为空格。 : q& f: m% e$ }. G, G3 s+ _2 [1 ]
|