收藏本站 劰载中...网站公告 | 吾爱海洋论坛交流QQ群:835383472

[Python] Python11:读取不同Netcdf和txt格式的气象数据(xarray库和pandas...

[复制链接]

读取NetCDF文件(***.nc)

回顾:【气候软件】Python读取气象数据 NetCDF文件(***.nc)


本例以一套CMIP6的BCC-CSM2-MR模式输出的全球tas(表面气温)变量1850-2014年的历史格点资料为例:(数据下载地址:www.52ocean.cn

文件信息查看如下:


$ m& }/ q) M/ M+ r- d; y9 t. ~' q

1a1e28f7de9c02c666ed97dbd5fd2a72.png

可以看到,文件的坐标有时间time, 经度lon,纬度lat,高度height,变量有表面气温tas。

%读取nc文件用到xarray库包中.open_dataset()函数;

%提取某时间范围内、某经纬度范围内的数据用到.loc[]函数;

5 B( x5 A5 @# J  q' t7 p$ S

  • # n& J& ?( W6 X
  • 1 J8 m7 i6 z& m; f4 y

  • ) a$ Z4 ?* ]) I+ o

  • " }6 N) \' q- l1 k2 \5 ]

  • , o2 K! Z) \; e0 `$ ?

  • 3 C7 m9 z2 I4 {0 P+ W
  • 3 l/ m9 t4 G. t0 [

  • 8 W+ _! u" s# i7 Y3 p5 C

  • 6 |- o. ~* n  N. @- a0 |; }7 X
    - i- O3 K5 P  ^8 P. p8 O

#1引库import xarray as xr#2数据(数据免费下载后台输入“BCC-CSM2-MR数据”回复获取)data = xr.open_dataset('tas_Amon_BCC-CSM2-MR_historical_r1i1p1f1_gn_185001-201412.nc', decode_times=False)print(data)  #输出显示数据信息,便于了解tas = data['tas']  #提取变量tas数据  a = tas.loc[15.5:74.5]  # 提取time在15.5至74.5区间内的数据b = tas.loc[15.5:74.5, 40:55, 115:135]  #选取了lat在40°N-55°N,lon在115°E-135°E范围的数据6 a3 l2 E$ a5 {

3 C7 r) i8 ^: a9 l# @

读取(time时间在15.5至74.5区间内,lat纬度在40°N-55°N,lon精度在115°E-135°E)范围结果显示:

ba790cde36edf774adba4d7236ae5bae.png

" W$ i% [# u/ t0 x0 `
! L; I( P) V6 I( [6 i$ Q# _) g: m

读取TXT文件

" j4 a, q. v; v

回顾:【气候软件】Python2:读取TXT文本格式的数据

站点数据是气象数据很重要的一部分,尤其是在观测数据方面,站点数据一般存放于.txt(.csv)文件中,首先就需要读取数据。

以一套中国气象数据网下载的某省的1979-2019年逐月气温数据为例,数据文件格式为TXT文本格式:(数据下载地址:www.52ocean.cn

TXT文本保存的数据如下图所示:

9b1379a3b4909ed05af149774d062cda.png

%读取txt文件用到pandas库包中.read_csv()函数;

3 s/ T( ?* G/ z; a
  • 2 P7 u4 ^3 W3 i4 J

  • ! i( K0 v' h: w! R1 h$ y  \

  • % d7 b/ {8 T0 U' x5 Y

  • # @+ _6 M* W1 q

  • 9 I4 E0 N0 u7 ^; B( U0 w
  • 3 x- H/ ]) ?, \  ^
  • 9 y8 `  I: C0 |# p6 M" m1 q
  •   J9 h$ y6 F2 c9 W& L

  • 0 X$ l! I9 z( r4 e: _- R$ y; x8 e5 b& B3 A! n- l

#1引库import pandas as pd#2数据##skiprows跳过了前1行的文件头##sep=','为文件中数据以逗号间隔;若以空格为间隔修改为sep='\s+'#设置导入 数据 的列名称data = pd.read_csv("tem.txt", skiprows=1, sep=',', header=None)  print(data)) k) M% v" F+ F$ g- U


& v  T1 V& P; w. y

读取结果显示:

cdeaa0ac0572f4c8f1dcd31b2cedc757.png

可以看到,文件的数据有22列,492行,第0列是年份,第1列是月份,剩余列数是变量数据。

skiprows=1表示跳过了前1行的文件头(因为第一行的数据中含有非数字的字符,所以选择跳过不读取)。

如果其他文件中数据是以空格为间隔,则sep='\s+'定义了数据间隔为空格。

header:设置导入 数据 的列名称,默认为 "infer",注意它与下面介绍的 names 参数的微妙关系。

names

  • 当names没被赋值时,header会变成0,即选取数据文件的第一行作为列名。

  • 当 names 被赋值,header 没被赋值时,那么header会变成None。如果都赋值,就会实现两个参数的组合功能。

    & ^+ J; ^% c% k/ L" D3 ?
* J7 k% o3 x+ q% {6 |
6 C% f3 I8 S$ H
回复

举报 使用道具

相关帖子

全部回帖
暂无回帖,快来参与回复吧
懒得打字?点击右侧快捷回复 【吾爱海洋论坛发文有奖】
您需要登录后才可以回帖 登录 | 立即注册
有风
活跃在2022-10-29
快速回复 返回顶部 返回列表