9 N9 U* @# J9 F2 U, [7 `- l* r
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
% M9 W6 a4 k# O' O. ~7 {6 `8 E" ^ 1. 字段信息统计
4 x8 b* S9 G5 H7 N: X5 l
在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
/ n2 V! i6 X; g5 S- b5 L- y$ }2 T
5 w, Q4 S* _# F( d1 b9 l& J# t' C
1 R2 ^+ g' U- m 打开凤凰新闻,查看更多高清图片
1 F) i! ~& L7 \) V* i* ~+ t
: s& s' F. t' \* c% N+ D t * t# `6 L0 n/ i% k% R0 K
2. 筛选生成新表
* C( v# r+ L1 Q! D) M; K 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
2 P1 ^- b$ r! ]. M% { 
5 K% T/ i! M) A! ]2 l" n5 i* b 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
# ?$ B6 A( C+ _) B

7 `" l9 K- [+ V7 i) ]
3. 生成关联数据
0 Z7 i# _' {. z7 e' U, J( l 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
1 c! z" s% s, | 1. 选择表做关联关系
0 ^; ^* `( P' O% s. g1 f4 u' x 
* Z* A8 u9 ^6 D3 S# V3 H0 N
2. 设置关联关系类型及关联字段
& Q- j7 a. q- k& ~% p" r 
' b' J: G! I! p5 t5 ~$ g 3. 选择最终生成关联新表数据需要的字段
3 z0 g R/ O. O* F 
# ^. N. R3 w l9 d2 y 4. 主题表数据追加覆盖
9 e$ c0 o Q/ ^6 ^$ Y; ?$ J7 A 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
p4 R0 J$ B8 I- X
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
% o; L x( ?# o4 k

2 v6 Y L4 t9 ?2 @4 R" A4 g7 l& Z 2. 选择文件数据源中的文件,点击追加或覆盖
0 Y4 ]% S8 B1 E& S7 {! N q; u 
- I% z; i/ y; z a3 Y* ] 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
! L- Y0 t' W( W

/ ^0 t2 E3 w. |. Z* @0 ?
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
( r: ^/ ~: O- D4 m% S, K- a 
& Q1 e5 i8 p* d& r 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
# g) ^+ T# M4 T2 |+ z3 V4 Y 
7 z7 Z! p7 B- h' K# P! _ 也可针对某一个字段自行选择设置字段对应关系
6 k- S/ n. l, Z$ M0 [+ Z, K, @% x 
# V+ T2 ]6 k: j* j' s: f 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
" E C# f. j: u+ T+ _7 K