본문 바로가기

Unsupervised2

[Linear Factor Model] PCA, ICA, Sparse coding 설명 6. 선형 인자 모델(Linear Factor Model) 인자(factor)란 관측되지 않는 변수를 뜻합니다. z가 인자에 해당하며, 잠복변수(latent variable) 또는 은닉변수(hidden variable)이라고도 불립니다. 선형인자모델은 선형연산을 통해 관찰한 데이터를 인자로 변환하는 방법입니다. 주어진 훈련집합 x 에서 평균이나, 공분산 등의 통계를 내어 데이터를 요약하고 분석할 수도있지만, 선형인자모델을 활용해 데이터의 잠재적인 특성을 파악하여 더 심층적인 의사결정을 할 수 있습니다. 일반적으로 차원(특징)의 크기는 z < x 이며, 아래와 같이 선형 연산을 사용하여 인코딩, 디코딩을 표현합니다. $$ f : z = W_{encoder}x + \alpha_{encoder} $$ $$ g.. 2019. 11. 21.
[Manifold Learning] IsoMap, LLE, t-SNE 설명 Manifold Learning 여기서 매니폴드 학습은 데이터 분포의 비선형(non-linear) 구조를 직접적으로 고려합니다. 즉, Nonlinear Dimensionality Reduction 문제를 봅니다. 1. Manifold? 위상수학에서 개발된 매니폴드와 이론과 달리, 기계학습에서는 개념적으로 다룹니다. 주로 고차원 공간에 내재한 저차원 공간을 매니폴드라고 합니다. 매니폴드는 보통 비선형 구조를 가지며, 특정 점을 중심으로 인근만 살피면 선형 구조에 가깝습니다. 기계학습에서 trainset에 있는 샘플은 매니폴드 위 또는 매니폴드에 가까이 있습니다. 훈련집합 샘플 $x = (x_1, x_2, \cdots, x_d)^T$ 는 $d$차원 공간의 한 점입니다. 데이터는 보통 매우 높은 차원 공간에 .. 2019. 11. 16.
728x90