MVU notes

Maximum Variance Unfolding

它找到一个好的核函数,使 “所有转换后的数据点之间的距离之和 “在 “邻域图中的距离 “不变的约束下达到最大。直观地说,当一个流形被适当地展开时,各点的方差是最大的。因此,目标函数旨在展开变换空间中的数据点(由核函数诱导),同时,约束条件保证在展开时满足局部属性。

给定 n 个点 $X={x_1, \cdots, x_n}$,MVU 首先构建一个 neighborhood graph G,其中每个点 $x_i$ 都和离它最近的 k 个点有连接。

找一个图形 $Y={y1, \cdots,y_n}$,其满足:$\| y_i - y_j \|^2 = \|x_i - x_j \|^2,\ for \forall (i,j) \in G$,然后对Y中各点间的距离之和取最大:

$$ \begin{aligned} & \operatorname{Maximize} \sum_{ij} | y_i -y_j |^2 \

& \text{subject to}\ |y_i - y_j |^2 = | x_i - x_j |^2 ,\ \text{for } \forall (i,j) \in G \end{aligned} $$

可以通过引入一个核函数($k: X \times X \rightarrow R$)找到一个合理而可行的Y的近似。

因此需要找到一个好的核函数,在变换后的空间中,所有变换后的数据之间的距离之和是最大,满足3个限制条件:

  1. 核函数有效;
  2. 变换后数据点的均值为零;(便于写目标函数)
  3. $\|\phi(x_i) - \phi(x_j) \|^2 = \| x_i - x_j \|^2 ,\ for \forall (i,j) \in G$

$$ \begin{aligned} & \operatorname{Maximize} \sum_{ij} |\phi(x_i) - \phi(x_j) |^2 \

& \text{subject to} \begin{cases} K \text{ is positive semidefinite} & \text{有效}\ | \sum_i \phi(x_i) |^2 = 0 & \text{零均值}\ |\phi(x_i) - \phi(x_j) |^2 = | x_i - x_j |^2 ,\ for \forall (i,j) \in G \end{cases} \end{aligned} $$

首先改写约束条件2:

$$ \| \sum_i \phi(x_i) \|^2 = \left( \sum_i \phi(x_i) \right)^T \left( \sum_j \phi(x_j) \right) = \sum_{ij} \phi(x_i)^T \phi(x_j) = \sum_{ij} k_{ij} = 0 $$

约束条件3的左边部分:

$$ \|\phi(x_i) - \phi(x_j) \|^2 = \left( \phi(x_i) - \phi(x_j) \right)^T \left( \phi(x_i) - \phi(x_j) \right) = k_{ii} + k_{jj} - 2k_{ij} $$

改写目标函数:

$$ \sum_{ij} \| \phi(x_i) - \phi(x_j) \|^2 = \sum_{ij} (k_{ii} + k_{jj} - 2 k_{ij} ) = \sum_{ij} k_{ii} + \sum_{ij} k_{jj} -2\sum_{ij} k_{ij} = 2n \sum_i k_{ii} - 2 \cdot 0 = 2n \cdot tr(K) $$

最终,优化问题是一个半正定规划问题(SDP):

$$ \begin{aligned} & \operatorname{Maximize} tr(K) \

& \text{subject to} \begin{cases} K \text{ is positive semidefinite} & \text{有效}\ \sum_{ij} k_{ij} = 0 & \text{零均值} \ k_{ii} + k_{jj} - 2k_{ij} = | x_i - x_j |^2 ,\ for \forall (i,j) \in G \end{cases} \end{aligned} $$

SDP 的解K 是用于输入Kernel PCA的核矩阵。

stat946f10-uwaterloo

MVU is a variation of Kernel PCA

Built with Hugo
Theme Stack designed by Jimmy