样本数据预处理
- 通过Proteowizard软件(v3.0.8789)将获得的原始数据转换成mzXML格式(xcms输入文件格式)[1] 。
- 利用R(v3.3.2)的XCMS程序包进行峰识别(peaks identification)、峰过滤(peaks filtration)、峰对齐(peaks alignment),主要参数有 bw=2, ppm=15, peakwidth=c(5, 30), mzwid=0.015, mzdiff=0.01, method=centWave 。
- 得到包括质核比(mass to charge ratio, m/z)和保留时间(retention time,rt)及峰面积(intensity)等信息的数据矩阵;正离子模式获得 11752 个前体分子(precursor molecule),负离子模式获得 10546 个前体分子,导出数据至excel进行后续分析。
- 为使不同量级的数据能够进行比较,对数据进行峰面积的 批次归一化(batch normalization) 。
数据预处理附件
数据预处理数据文件:metabolome_pos.xls (正离子模式)
metabolome_neg.xls (负离子模式)
metabolome_*.xls 里面包含“raw”和“normalized”两个工作簿,其中“raw”工作簿是数据预处理前(即解卷积获得的)数据,“normalized”工作簿是经过归一化、QA等预处理后的数据。