样本数据预处理
- 经过数据库注释得到包括保留时间(retention time,rt)、保留指数(Retention Index,RI)及峰面积(intensity)等信息的数据矩阵。
- 对原始数据中的缺失值进行模拟(missing value recoding),数值模拟方法为最小值二分之一法进行补空。
- 为使不同量级的数据能够进行比较,对数据进行峰面积的 总峰面积归一化(total peak area normalization) 。
数据预处理附件
数据预处理数据文件:metabolome.xlsx
metabolome.xlsx 里面包含“raw”和“normalized”工作簿,其中“raw”工作簿是数据预处理前(即解卷积获得的)数据,“normalized”工作簿是经过归一化等预处理后的数据。