04-05 Transformations and change of variables

목적함수 또는 제약함수는 주어진 optimization problem를 유지하는 선에서 변경될 수 있으며, 때로는 이를 이용해 문제의 “hidden convexity”를 찾아낼 수 있다.

Theorem1

함수 \(h : \mathbb{R} \rightarrow \mathbb{R}\)가 monotone increasing transformation일때, 아래의 관계가 성립한다.

\[\begin{align} &\text{min}_{x} f(x) \text{ subject to } x \in C \\ \Longleftrightarrow \quad &\text{min}_{x} h(f(x)) \text{ subject to } x \in C \end{align}\]

Theorem2

함수 \(\phi: \mathbb{R}^{n} \rightarrow \mathbb{R}^{m}\)가 일대일 대응 함수이고, \(\phi\)의 상(image)이 feasible set \(C\)를 커버한다면 optimization problem의 변수는 다음과 같이 변경될 수 있다.

\[\begin{align} &\min_{x} f(x) \text{ subject to } x \in C \\\\ \Longleftrightarrow \quad &\min_{y} f(\phi(y)) \text{ subject to } \phi(y) \in C \end{align}\]

Example: geometric programming

함수 \(f: \mathbb{R}\_{++}^n \rightarrow \mathbb{R}\)가 다음과 같은 형태일때 이를 monomial이라 부른다.

\[f(x) = \gamma x_{1}^{a_{1}} x_{2}^{a_{2}} \dotsb x_{n}^{a_{n}} \text{ for } \gamma > 0, a_{1}, \dotsc, a_{n} \in \mathbb{R}.\]

또한 monomial의 합을 posynomial이라 부른다.

\[g(x) = \sum_{k=1}^{p} \gamma_{k} x_{1}^{a_{k1}} x_{2}^{a_{k2}} \dotsb x_{n}^{a_{kn}} \text{ for } \gamma > 0, a\_1, \dotsc, a_{n} \in \mathbb{R}.\]

Geometric program은 다음과 같은 형태로 정의되며, 이는 non-convex problem이다.

\[\begin{align} &\min_{x} &&f(x) \\ &\text{subject to } &&g_{i}(x) \leq 1, i = 1, \dotsc, m\\ &&&h_{j}(x) = 1, j = 1, \dotsc, r,\\\\ \end{align}\\\]

where \(f\), \(g_{i}, i=1, \dotsc, m\) are posynomials and \(h_{j}, j=1, \dotsc, r\) are monomials.

Geometric program이 어떤 convex problem과 동일함을 증명해보자.

Proof:

\(f(x) = \gamma x_{1}^{a_{1}} x_{2}^{a_{2}} \dotsb x_{n}^{a_{n}}\)일때, \(y_{i} = logx_{i}\), \(b=log \gamma\)라 하면 \(f\)는 다음과 같이 변경될 수 있으며, Theorem2에 의해 이는 주어진 optimization problem을 동일하게 유지한다. \(\gamma (e^{y_{1}})^{a_{1}} (e^{y_{2}})^{a_{2}} \dotsb (e^{y_{n}})^{a_{n}} = e^{a^Ty + b}\)

또한 posynomial은 \(\sum_{k=1}^{p} e^{a_{k}^{Ty} + b_{k}}\)로 나타낼 수 있다.

이때, Theorem1에 의해 이에 log를 취해준 형태인 \(log \big( \sum_{k=1}^{p} e^{a_{k}^{Ty} + b_{k}} \big)\) 또한 optimization problem을 동일하게 유지할 수 있다.

즉, geometric program은 다음의 문제와도 동일하며 이는 convex problem이다.

\[\begin{align} &\min_{x} \quad &&{log \big( \sum_{k=1}^{p_{0}} e^{a_{0k}^{Ty} + b_{0k}} \big)} \\ &\text{subject to} &&{ log \big( \sum_{k=1}^{p_{i}} e^{a_{ik}^{Ty} + b_{ik}} \big) \leq 0 , \quad i = 1, \dotsc, m }\\ &&&c_{j}^{Ty} + d_{j} = 0, \quad j = 1, \dotsc, r\\\\ \end{align}\]