g( ^4 b9 W$ N* m1 z* R! N+ P/ z 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
% ~1 Q+ n4 b6 D, e* O: q0 q
1. 字段信息统计
& R+ |% N1 \. |. [& e# R6 v
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
- l+ Y9 `/ K+ ?5 ^, r% r
# p& B& a3 s: N ( b* v; Z/ B6 h$ @+ v1 H
打开凤凰新闻,查看更多高清图片
( A' D/ [. t5 y, _1 F/ A: t
]2 r7 i) h4 v9 f$ z
: E( C- ]: ]. }8 `* C- z! Z 2. 筛选生成新表
$ i; h* a0 n# c) K: `5 Y& X) G 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
' M; U3 }* \" K) m. O6 h/ y

5 d6 A' K# R1 J" x% L' N$ ] 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
5 y* X; `5 E# v; R$ y

9 w; \9 z% Z" N# z5 Z* a 3. 生成关联数据
; J) g9 h$ X) `% n: q: x+ A+ ? 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
0 x! `& T! X; S6 i& i 1. 选择表做关联关系
) e* ^9 ]; K- `: Z- \ H! d8 Q

4 U6 R* D3 N* D: b8 n, | 2. 设置关联关系类型及关联字段
' u5 b( d/ e4 c

8 P* z8 {% i S* e$ A1 j8 B+ ^8 }
3. 选择最终生成关联新表数据需要的字段
( g7 c' z8 v5 X- G# i. R- l

' v$ o6 M; e, f9 W 4. 主题表数据追加覆盖
6 I: v: U8 P8 w* B 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
5 s# }+ `7 F* z; H# v- S 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
* L" H6 N1 `0 M* q$ k2 `

" q# E) B- Y8 P' V
2. 选择文件数据源中的文件,点击追加或覆盖
' Z$ c) n2 S/ ^5 L+ E: a

, Z/ ~0 P" I+ h z' b% m$ H 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
) ?9 J7 T' g* C$ W! D# [

, _: \* |4 r! w; {& p+ @& F 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
* R+ i5 M9 F) c5 o: v) y: [! K. T) D 
6 a" v; K, o. o7 ?# H5 | T 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
0 j% o& ]% U. N* H' y8 T! Q/ W+ v

! d' S3 ?* f$ |% Y 也可针对某一个字段自行选择设置字段对应关系
& F8 r6 j9 |% A, d1 P 
! w" ]: h7 U2 W# e# _6 x 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
( t8 }6 v1 E3 Q5 y5 Y0 d" i7 K