网页报告

代谢组学数据分析中另一种常用的方法是正交-偏最小二乘判别分析(Orthogonal Projections to Latent Structures Discriminant Analysis, OPLS-DA)，为PLS-DA的扩展。相比于PLS-DA，该方法可以在不降低模型预测能力的前提下，有效减少模型的复杂性和增强模型的解释能力，从而最大程度查看组间差异。

OPLS-DA使用正交信号校正技术，将X矩阵信息分解成与Y相关和不相关的两类信息，然后过滤掉与分类无关的信息，相关的信息主要集中在第一个预测成分。

与PLS-DA模型相同，OPLS-DA同样可以用R2X、R2Y、Q2和OPLS-DA得分图来评价模型的分类效果。

通常，根据VIP（Variable Importance for the Projection）值来说明变量(特征峰)能解释X数据集和关联Y数据集的重要性。所有VIP值的平方之和与模型中的变量总数相等，因此，其平均值为1^[2]。

当某个变量的VIP>1时，说明该变量是重要的——通常将此作为潜在生物标记物的筛选条件之一。

正离子模式
负离子模式

详细OPLS-DA模型验证参数： DOWNLOAD

	pre	R2X(cum)	R2Y(cum)	Q2(cum)
CTRL vs DM	1+3+0	0.498	0.997	0.736
CTRL vs DN	1+2+0	0.419	0.994	0.834
DM vs DN	1+1+0	0.236	0.968	0.852
HouseH vs DM	1+3+0	0.482	0.993	0.631
HouseH vs DN	1+2+0	0.419	0.989	0.885

注：pre，主成分数；R2X，模型（对X变量数据集）可解释度；R2Y，模型（对Y变量数据集）可解释度；Q2，模型可预测度；

CTRL vs DM
HouseH vs DN

图：OPLS-DA得分图

代谢物VIP值表格

OPLS-DA_vip.xls

	pre	R2X(cum)	R2Y(cum)	Q2(cum)
CTRL vs DM	1+2+0	0.248	0.997	0.803
CTRL vs DN	1+1+0	0.239	0.986	0.895
DM vs DN	1+1+0	0.237	0.984	0.859
HouseH vs DM	1+3+0	0.323	0.999	0.537
HouseH vs DN	1+1+0	0.201	0.993	0.897