[ICML 2018] GAIN: Missing Data Imputation using Generative Adversarial Nets
Paper url : https://arxiv.org/abs/1806.02920
Author and affiliation

Background
Three assumptions of missing values
์ฐ๋ฆฌ๋ ๋จธ์ ๋ฌ๋์ ํ์ฉํ ๋ถ์ ๋ฐ ์์ธก์ ์งํํ๋ฉด์ ๋ค์ํ ๋ฐ์ดํฐ๋ฅผ ์ ํ๊ฒ ๋๋ค. ๊ทธ ์ค ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ์ผ์ ํํ ์ผ์ผ ๊ฒ์ด๋ค. ๊ฒฐ์ธก์น๋ ๋ค์๊ณผ ๊ฐ์ด 3๊ฐ์ง ์ ํ์ผ๋ก ๋ถ๋ฅํ ์ ์๋ค [1].
MCAR (Missing Completely at Random) : ์์ ๋ฌด์์ ๊ฒฐ์ธก
MNAR (Missing Not at Random) : ๊ฒฐ์ธก์น๊ฐ ํน์ ์๋ฏธ๋ฅผ ๋ดํฌํ๋ฉฐ ๊ทธ ์๋ฏธ๊ฐ ๊ฒฐ์ธก๋ ๋ณ์๋ฅผ ์ง์นญ
MAR (Missing at Random) : ๊ฒฐ์ธก์น๊ฐ ํน์ ์๋ฏธ๋ฅผ ๋ดํฌํ๋ฉฐ ๊ทธ ์๋ฏธ๊ฐ ๋ฐ์ดํฐ ๋ด ๋ค๋ฅธ ๋ณ์๋ฅผ ์ง์นญ
์๋ฅผ ๋ค์ด ํน์ ํ์ฌ์์ ์ฝ๋ก๋ ๊ฐ์ผ ์ฌ๋ถ๋ฅผ ์์ธกํ๊ธฐ ์ํด ์ฒด์จ ์ธก์ , ์ผ์ฃผ์ผ ๋ด ํ์ ์ฐธ์ ์ฌ๋ถ๋ฅผ ์กฐ์ฌํ์๋ค๊ณ ๊ฐ์ ํ์. ๋ ๋ฆฝ๋ณ์๋ ์ฒด์จ, ํ์ ์ฐธ์ ์ฌ๋ถ์ด๋ฉฐ ์ข ์๋ณ์๋ ์ฝ๋ก๋ ๊ฐ์ผ ์ฌ๋ถ์ด๋ค. ์ด ๋ ์ฒด์จ ๋ณ์์ ๊ฒฐ์ธก์ด ๋ฐ์ํ์๋ค๋ฉด ์ 3๊ฐ์ง ๊ฐ์ ์ ๊ฐ๊ฐ ๋ค์์ ํด๋นํ๋ค.
๊ฐ ๋ถ์์ ๋ฐ์ดํฐ๋ฅผ ์ข ํฉํ์ฌ ์ ์ฅํ๋ ์์ค, ๋ด๋น์๊ฐ ์ค์๋ก ํน์ ๋ ์ง์ ๋ฐ์ดํฐ๋ฅผ ๋๋ฝํ์๋ค๋ฉด ์ด ๊ฒฝ์ฐ MCAR์ ํด๋นํ๋ค. MCAR ๊ฐ์ ์ ๊ฒฐ์ธก์น๊ฐ ์ด๋ ํ ์๋ฏธ๋ฅผ ์ง๋์ง ์๊ณ ์์ ๋ฌด์์๋ก ๊ฒฐ์ธก์ด ๋ฐ์ํ ๊ฒฝ์ฐ์ด๊ธฐ ๋๋ฌธ์ด๋ฉฐ ๊ณ ์ ์ ์ธ ๊ฒฝ์ฐ์ ์๋ฅผ ๋ค๋ฉด ๋ฐ์ดํฐ sheet์ ์ปคํผ๋ฅผ ์์ ์์๋ก ๊ฐ์ด ์ง์์ง ๊ฒฝ์ฐ๊ฐ ํด๋นํ๋ค.
๋ฐ๋ฉด ์ฝ๋ก๋์ ๊ฑธ๋ฆฌ๊ฑฐ๋, ๊ฐ๊ธฐ์ ๊ฑธ๋ ค ๊ณ ์ด์ด ๋ฐ์ํ ํ์ฌ์๋ค์ด ์๋์ ์ผ๋ก ์ฒด์จ ์ธก์ ์ ๊ธฐํผํ์๋ค๊ณ ๊ฐ์ ํ์. ์ด ๊ฒฝ์ฐ ์ฒด์จ ๋ณ์์ ๊ฒฐ์ธก์ด ๋ฐ์ํ ์ํ์ ์ฒด์จ ์ธก์ ๋น์ ๊ณ ์ด์ด์์ ๊ฒ์ด๋ผ๊ณ ์ถ์ ํ ์ ์๋ค. ์ด ๊ฒฝ์ฐ ๊ฒฐ์ธก์น๊ฐ ํน์ ์๋ฏธ๋ฅผ ๋ดํฌํ๋ฉฐ(์ฒด์จ ๋ณ์์ ๊ฒฐ์ธก = ๊ณ ์ด) ๊ทธ ์๋ฏธ๊ฐ ๊ฒฐ์ธก์ด ๋ฐ์ํ ๋ณ์(์ฒด์จ)์ ์ง์นญํ๊ธฐ์ MNAR ๊ฐ์ ์ ํด๋นํ๋ค.
๋ง์ง๋ง์ผ๋ก ์ฒด์จ ์ธก์ ์ ํ ๋น์์ ํ์์ ์ฐธ์ํ ๋ถ์๊ฐ ์กด์ฌํ์ฌ ์ฒด์จ ์ธก์ ์ ์ค์ํ์ง ๋ชปํด ๊ฒฐ์ธก์ด ๋ฐ์ํ ๊ฒฝ์ฐ๋ผ๋ฉด MAR ๊ฐ์ ์ ํด๋นํ๋ค. ์ด ๊ฒฝ์ฐ ๊ฒฐ์ธก์น๊ฐ ํน์ ์๋ฏธ๋ฅผ ๋ดํฌํ๋ฉฐ(์ฒด์จ ๋ณ์์ ๊ฒฐ์ธก = ํ์ ์ฐธ์) ๊ทธ ์๋ฏธ๊ฐ ๋ฐ์ดํฐ ๋ด ๋ค๋ฅธ ๋ณ์(ํ์ ์ฐธ์ ์ฌ๋ถ)๋ฅผ ์ง์นญํ๊ธฐ ๋๋ฌธ์ด๋ค.
์ด์ ๊ฐ์ด ๊ฒฐ์ธก์น ๊ฐ์ ์ ๋ถ๋ฅํ ์ด์ ๋ ๋ฐ๋ก ๊ฒฐ์ธก์น์ ๊ฐ์ ์ ๋ฐ๋ผ ์ฐ๋ฆฌ๊ฐ ๋์ฒํด์ผํ ๋ฐฉ๋ฒ์ด ๋ฌ๋ผ์ง๊ธฐ ๋๋ฌธ์ด๋ค. ์๋ฅผ ๋ค์ด ๊ฒฐ์ธก์น์ ์๋ฌด๋ฐ ์๋ฏธ๊ฐ ์๋ MCAR ๊ฐ์ ์ ์ํด ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋ค๋ฉด, ์ด ๊ฒฝ์ฐ ๋ฐ์ดํฐ๋ฅผ ์ญ์ ํด๋ ๋ถ์์ด๋ ์์ธก์ ์ด๋ ํ ์ํฅ์ ๋ฏธ์น์ง ์๋๋ค(๋ฐ์ดํฐ๊ฐ ์ถฉ๋ถํ๋ค๋ ๊ฐ์ ํ์). ๋ฐ๋ฉด ๊ฒฐ์ธก์น์ ํน์ ์๋ฏธ๊ฐ ์กด์ฌํ๋ MNAR, MAR ๊ฐ์ ์ ๊ฒฝ์ฐ ๋ฐ์ดํฐ๋ฅผ ์ญ์ ํ๋ค๋ฉด ์๊ณก๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ค.
๋ฐ๋ผ์ ๋ฐ์ดํฐ์ ๋๋ฉ์ธ ์ง์์ ๊ธฐ๋ฐํ์ฌ ๊ฒฐ์ธก์น๊ฐ ์ด๋ค ํน์ฑ์ ํ์ธํ๋์ง๋ ๋งค์ฐ ์ค์ํ๋ฉฐ, ๋ง์ฝ ๋๋ฉ์ธ ์ง์์ด ์๋ค๊ณ ํ๋ค๋ฉด ๊ฒฐ์ธก์ด ๋ฐ์ํ sample๋ค๊ณผ ๊ทธ๋ ์ง ์์ sample๋ค์ target variable์ ๋ถํฌ ํ์ธ์ ํตํด ๊ฒฐ์ธก์น๊ฐ target variable์ ์ด๋ค ์ํฅ์ ๋ผ์น๋์ง ํ์ธํ๋ ๊ณผ์ ์ด ํ์ํ๋ค.
Single imputation & Multiple imputation
๊ฒฐ์ธก์น๋ฅผ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ์๋ ์ญ์ (deletion)์ ๋์น(imputation)์ด ์กด์ฌํ๋ค. ๋๋ถ๋ถ์ ๊ฒฝ์ฐ ๊ฒฐ์ธก์น๋ฅผ ๋ณด์ํ๋ค์ ์๋ฏธ๋ ๋์น(=๊ฒฐ์ธก์น๋ฅผ ์์์ ๊ฐ์ผ๋ก ๋์ฒดํจ)๋ฅผ ๋ปํ๊ธฐ์ ์ญ์ ๋ ํต์ฌ์ ์ธ ๋ด์ฉ๋ง ๋ค๋ฃจ๋๋ก ํ๊ฒ ๋ค.
์ญ์ ๋ ๊ฒฐ์ธก์น๋ฅผ ํฌํจํ๋ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ ์ ๊ฑฐํ๋ ๊ฒ์ ๋ปํ๋ค. ๊ฒฐ์ธก์น๊ฐ ํน์ ์๋ฏธ๋ฅผ ๋ดํฌํ์ง ์๋ MCAR์ ํด๋นํ๊ฑฐ๋ ๊ทธ ๋น์จ์ด ๋ง์ง ์์ ๋ ์ฌ์ฉํ ์ ์๋ค. ์ผ๋ฐ์ ์ผ๋ก ๊ฒฐ์ธก ๋น์จ์ด 10%๊ฐ ๋์ด๊ฐ๋ฉด ์ญ์ ๋ ์ข์ ์ ํ์ด ์๋๋ค [2]. ๋น๊ต์ ๊ฐ๋จํ๋ฉฐ computational cost์ ์ด์ ์ด ์์ผ๋, ๊ฒฐ์ธก ๋ฐ์ ์์ธ์ด MNAR, MAR ๊ฐ์ ์ ํด๋นํ๋ค๋ฉด ์๋ ๋ถํฌ๋ฅผ ์๊ณกํ ์ ์๋ค๋ ๋จ์ ์ด ์กด์ฌํ๋ค.
๋์น(์ดํ imputation)๋ ๋จ์ ๋์น(single imputation)์ ๋ค์ค ๋์น(multiple imputation)์ผ๋ก ๊ตฌ๋ถํ ์ ์๋ค. Single imputation๊ณผ multiple imputation์ ๊ตฌ๋ถํ๋ ๊ธฐ์ค์ ๊ฒฐ์ธก์น์ ํ๋ณด๊ตฐ ๊ฐ์์ด๋ค. ๋ง์ฝ ๊ฒฐ์ธก์น๋ฅผ ๋์ฒดํ ์ ์๋ ํ๋ณด๊ตฐ์ด ๋จ์ผ ๊ฐ์ด๋ผ๋ฉด single imputation, ์ฌ๋ฌ๊ฐ๊ฐ ์กด์ฌํ๋ค๋ฉด multiple imputation์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค. ๋ค์ ๊ทธ๋ฆผ์ ํตํด ์ฝ๊ฒ ์ดํดํ ์ ์๋ค.

์ผ๋ฐ์ ์ผ๋ก single imputation์ ๊ฒฝ์ฐ multiple imputation์ ๋นํด ํ์ค ์ค์ฐจ ๊ณผ์์ ๋ฌธ์ ๋ฅผ ์ง๋๋ค๊ณ ๋งํ๋ค. ์ด๋ ๋ถํ์คํ ๊ฒฐ์ธก์น๋ฅผ ๋จ์ผ๊ฐ์ผ๋ก ๋์ฒดํ๋ ๋ฐฉ๋ฒ์ ํน์ฑ์, ์ถ์ ๊ฐ์ ๋ํ ๊ณผ๋ํ ์ ๋ขฐ๋๋ฅผ ์ง๋๋ค๋ ์๋ฏธ์ด๋ค. ์ด์ ๋ฐํด multiple imputation์ ๊ฒฝ์ฐ ๊ฒฐ์ธก์น์ ๋ํ ํ๋ณด๊ตฐ์ ์ฌ๋ฌ๊ฐ ์์ฑํ๊ธฐ ๋๋ฌธ์ ๋ณด๋ค ์ ๋ขฐ์ฑ ์๋ ์ถ๋ก ์ด ๊ฐ๋ฅํ๋ฉฐ ๊ฒฐ์ธก์น์ ์ ๋ขฐ ๊ตฌ๊ฐ ๋ํ ์ถ์ ํ ์ ์๋ค๋ ์ฅ์ ์ด ์กด์ฌํ๋ค. ๋ณธ ๋ ผ๋ฌธ์ ๋ฐฉ๋ฒ์ธ GAIN์ multiple imputation์ ํด๋นํ๋ค.
Related works
Single/multiple imputation์ ๋ํ์ ์ธ ์๊ณ ๋ฆฌ์ฆ๋ค์ ์ดํด๋ณด์. ๋จผ์ single imputation์์๋ ๋ํ์ ์ผ๋กMissForest ์๊ณ ๋ฆฌ์ฆ [3]์ ๋ค ์ ์๋ค.
Single imputation - MissForest
MissForest๋ ์ด๋ฆ์์ ์ ์ถํ ์ ์๋ฏ, random forest ์๊ณ ๋ฆฌ์ฆ์ ์์ธก๊ฐ์ผ๋ก ๊ฒฐ์ธก์น๋ฅผ ์ฑ์๋ฃ๋ ๋ฐฉ๋ฒ์ ๋งํ๋ค. ์ด 4 ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ imputation์ด ์งํ๋๋๋ฐ ์ธ๋ถ ๋จ๊ณ๋ฅผ ์ดํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
Step1) ์์ ๋์ฒด
๊ฒฐ์ธก์น๋ฅผ ์์๋ก ๋์ฒดํ๋ ๋จ๊ณ์ด๋ค. ๋จ์ ํ๊ท , ์ต๋น๊ฐ๊ณผ ๊ฐ์ด ํต๊ณ๋์ ์ฌ์ฉํ๊ฑฐ๋ ๊ฐ๋จํ ๋ค๋ฅธ ๋์น ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ค.

Step 2) Random Forest ํ์ฉ ๋ณ์๋ณ ๊ฒฐ์ธก์น ์์ธก
๊ฒฐ์ธก์น ๋น์จ์ด ๊ฐ์ฅ ๋ฎ์ ๋ณ์๋ถํฐ random forest๋ฅผ ์ฌ์ฉํ์ฌ ์์ธก์ ์งํํ๋ค. ์ด ๋ ํ์ต ๋ฐ์ดํฐ๋ ๊ฒฐ์ธก์ด ๋ฐ์ํ์ง ์์ sample์ด๋ฉฐ ์ด๋ฅผ ํ ๋๋ก ๊ฒฐ์ธก์น ์์ธก์ ์งํํ๋ค. Figure 03์ ํตํด ์ฐ๋ฆฌ๋ x1โ,x2โ๊ฐ ๊ฒฐ์ธก์น ๋น์จ์ด ๊ฐ์ฅ ๋ฎ์ ๋ณ์์์ ์ ์ ์๋ค. ๋ฐ๋ผ์ ๊ฒฐ์ธก์น๋ ์์ธก์ column ์์๋๋ก ์งํํ๋ฉฐ Figure 04์ ๊ฐ๋ค.

Step 3) ์ ๊ณผ์ ๊ณผ ๊ฐ์ด ๊ฒฐ์ธก์น๊ฐ ๋ณด์๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ๋์ผํ ๊ณผ์ ์งํ
๊ฒฐ์ธก์ด ์ฑ์์ง ๋ฐ์ดํฐ(step 2 ์ดํ)๋ฅผ ์ฌ์ฉํ์ฌ ๋ณ์๋ณ ๊ฒฐ์ธก์น ์์ธก์ ๋ค์ ์งํํ๋ค. Step 3์์์ random forest ์์ธก๊ฐ์ step 2์๋ ๋ค๋ฅธ ๊ฐ์ด ๋ ๊ฒ์ด๋ค. ํ์ต์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ ์ค ๊ฒฐ์ธก์น์ ๊ฐ์ด ๋ณ๊ฒฝ๋์๊ธฐ ๋๋ฌธ์ด๋ค(step 1 - ํ๊ท , step 2 - ํ๊ท ์ ๋ฐํ์ผ๋กํ random forest ์์ธก๊ฐ). ๊ทธ๋ฆผ์ผ๋ก ํ๊ธฐํ๋ฉด Figure 05์ ๊ฐ์ผ๋ฉฐ ๊ฒฐ์ธก์น์ ๊ฐ์ด step 2์๋ ๋ค๋ฅธ ๊ฒ์ ํ์ธํ ์ ์๋ค.

Step 4) ์ข ๋ฃ ์กฐ๊ฑด์ ๋ง์กฑํ ๋๊น์ง step 3 ๋ฐ๋ณต
Step 3์ ๊ณผ์ ์ ์ข ๋ฃ ์กฐ๊ฑด์ ๋ง์กฑํ ๋๊น์ง ๋ฐ๋ณต๋๋ค. ์ฌ๊ธฐ์ ์ข ๋ฃ ์กฐ๊ฑด์ด๋ผ ํจ์ 1. ์ฌ์ฉ์๊ฐ ์ง์ ํ ๋ฐ๋ณต ํ์ ๋๋ฌ๊ณผ 2. ๊ฒฐ์ธก ๋์ฒด ๊ฐ์ ๋ณํ๋์ด ์ผ์ ๊ธฐ์ค์ ์ดํ๋ก ์๋ ดํ ๋๋ฅผ ๋งํ๋ค. Figure 06์ ํ์์ ์ข ๋ฃ ์กฐ๊ฑด์ ๋ง์กฑํ ๋๊น์ง ๋ฐ๋ณตํ๋ ๊ฒฝ์ฐ์ด๋ค.

์ข ๋ฃ์กฐ๊ฑด์ ๋ง์กฑํ์ฌ ๋์น๊ฐ ์๋ฃ๋ ๋ฐ์ดํฐ(imputed data)๊ฐ MissForest์ ์ต์ข ๊ฒฐ๊ณผ์ด๋ค. ๊ฐ ๊ฒฐ์ธก์น์ ๋ํด์ ๋์ฒด ํ๋ณด๊ตฐ์ด 1๊ฐ์ฉ ์กด์ฌํ๊ธฐ ๋๋ฌธ์ single imputation์ ํด๋นํ๋ค.
Multiple imputation - multiple imputation using denoising autoencoders (MIDA) [4]
Multiple imputation ๋ฐฉ๋ฒ์ผ๋ก๋ ๋ํ์ ์ผ๋ก multiple imputation by chained equations (MICE) [5], Amelia [6] ๋ฑ์ด ์กด์ฌํ๋ค. ์ด๋ค์ Python, R์ ์ด์ฉํ๋ฉด ์ฝ๊ฒ ์ฌ์ฉํ ์ ์์ด ์ ๊ทผ์ฑ์ด ๋๋ค. ํด๋น ๋ฐฉ๋ฒ๋ค์ ํ ๋ธ๋ก๊ทธ์ ์์ธํ ์ค๋ช ์ด ๋์ด์์ผ๋ ์ค๋ช ์ ์๋ตํ์๋ค.
Multiple imputation ๋ฐฉ๋ฒ ์ค ํ๋๋ก ์๊ฐํ MIDA๋ MICE, Amelia์๋ ๋ฌ๋ฆฌ deep learning ๊ธฐ๋ฐ imputation method์ด๋ค. ๋ณธ review ๋ ผ๋ฌธ์ธ GAIN ๋ํ deep learning ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ์ด๊ธฐ์ ์ฑ๋ฅ์ ์ง์ ์ ์ผ๋ก ๋น๊ตํ๊ณ ์๋ค. MIDA๋ ์ด๋ฆ์์ ์ ์ ์๋ฏ denoising autoencoders (DAE)๋ฅผ ํ์ฉํ multiple imputation ๋ฐฉ๋ฒ์ด๋ค. ๋จผ์ DAE๋ฅผ ์ดํด๋ณด์.
DAE๋ autoencoder์ ํ์ ๋ชจ๋ธ๋ก noise๊ฐ ์์ธ input data๋ก๋ถํฐ noise๊ฐ ์ ๊ฑฐ๋ ์๋์ input์ ๋ณต์ํ๋ ๋ชจ๋ธ์ ๋งํ๋ค. ๋ง์ฝ ์ ํ ๋ฐ์ดํฐ์ ์ ์ฉ์ด ๋์๋ค๋ฉด Figure 07๊ณผ ๊ฐ์ ํํ๋ฅผ ๋ณด์ธ๋ค.

MIDA๋ ์ ์ฌ ๋ณ์(latent vector)์ dimension์ด input์ dimension๋ณด๋ค ๋์ overcomplete autoencoder ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ๋ค. Overcomplete autoencoder ๊ตฌ์กฐ๋ input data๊ฐ ์ ๊ณตํ๋ ์ ๋ณด๋ณด๋ค ๋ ๋ง์ ์ ๋ณด๋ฅผ ์ฐพ์ ๋ ์ฌ์ฉํ๋ค. MIDA์ ๋ชฉ์ ์ด ๊ฒฐ์ธก์น๋ฅผ ์ฑ์ฐ๋ ๊ฒ์ด๊ธฐ์ input data๋ฅผ high-dimension์ผ๋ก mappingํ์ฌ ๊ฒฐ์ธก์น์ ๋ด์ฌ๋ ์ ๋ณด๋ฅผ ํ์ ํ ๋ค์ ์์ถํ๋ ๊ณผ์ ์ ํตํด ๋์นํ๋ ์๊ณ ๋ฆฌ์ฆ์ธ ๊ฒ์ด๋ค. MIDA์ ๊ตฌ์กฐ๋ Figure 08๊ณผ ๊ฐ๊ณ encoder์ ๊ฒฝ์ฐ hidden node์ ๊ฐ์๋ layer ๋น ฮธ (default = 7)๋งํผ ์ฆ๊ฐํ๋ฉฐ decoder์ ๊ฒฝ์ฐ ๋ฐ๋๋ก layer ๋น ฮธ๋งํผ ๊ฐ์ํ๋ค.

MIDA์ ๋์์ ๋ํด์ ์์๋ณด์. ๋จผ์ MissForest์ ์ ์ฌํ๊ฒ ์์ ๋์ฒด ๊ณผ์ ์ ๊ฑฐ์น๋๋ฐ ์์นํ ๋ณ์์ ๊ฒฝ์ฐ ํ๊ท , ๋ฒ์ฃผํ ๋ณ์์ ๊ฒฝ์ฐ ์ต๋น๊ฐ์ ์ฌ์ฉํ์ฌ ์์ ๋์น๋ฅผ ์งํํ๋ค. ์ดํ DAE๋ฅผ ํ์ฉํ ๋์น๋ฅผ ์งํํ๋ฉฐ n๊ฐ์ data์ ๋ํด์ DAE์ ์ด๊ธฐ ๊ฐ์ค์น๋ฅผ ๋ณ๊ฒฝํ์ฌ ๋ค์ํ ๊ฒฐ์ธก ๋์ฒด๊ฐ์ ๋์ถํ๋ค.
์์์ ์ค๋ช ์ ์๋ตํ์์ผ๋ multiple imputation์ ํต์ฌ์ n๊ฐ์ imputed data์ ๋ค์์ฑ์ด๋ค. Multiple imputation์ ๋ณธ์ง์ด ๋ค์ํ ๊ฒฐ์ธก ํ๋ณด๊ตฐ์ ์ ์ํ์ฌ ์ ๋ขฐ๋๋ฅผ ๋ํ๊ณ ์ถ์ ๊ตฌ๊ฐ์ ์ ์ํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. MIDA์ ๊ฒฝ์ฐ DAE์ ์ด๊ธฐ ๊ฐ์ค์น๋ก์จ ์ด๋ฅผ ๊ตฌํํ๋ค๊ณ ๋ณผ ์ ์๋ค. ์ด๊ธฐ ๊ฐ์ค์น ๋ฟ ์๋๋ผ noise ๋ํ n๊ฐ ๋ฐ์ดํฐ ๋ง๋ค ๋ค๋ฅธ ๊ฐ์ด ๋ถ์ฌ๋์ง๋ง DAE๋ ์ด๋ฅผ ์ ๊ฑฐํ๋๋ก ๋ณต์ํ๊ธฐ ๋๋ฌธ์ ๋ค์์ฑ์ ๊ธฐ์ฌํ์ง๋ ๋ชปํ๋ค. MIDA์ ์ ์ฒด ๊ณผ์ ์ ๋์ํ ํ๋ฉด Figure 09์ ๊ฐ๋ค.

MIDA์ ๊ฒฝ์ฐ deep learning์ ํ์ฉํ imputation ๋ฐฉ๋ฒ์ ์์ด๊ฒฉ ๋ชจ๋ธ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค. ๋ ผ๋ฌธ์ ๊ฒฝ์ฐ MICE์ ๋น๊ตํ์ฌ ๋๋ถ๋ถ์ ๋ฐ์ดํฐ ๋ฐ ์ํฉ(๊ฒฐ์ธก์น์ ๊ฐ์ )์์ ์ข์ ์ฑ๋ฅ์ ๋ณด์๋ค๊ณ ํ๋ ๋ ผ๋ฌธ์์ ์ ์๋ data ์ธ์ ์ค ์ ์ฉ ์์๋ ๋์ผํ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ผ์ง ์๋ฌธ์ด๋ค. ํ์๊ฐ ๋ ผ๋ฌธ์ ์ฑ๋ฅ์ ๋ฏฟ์ง ๋ชปํ๋ ์ด์ ๋ ๋ค์๊ณผ ๊ฐ๋ค.
๋ ผ๋ฌธ์ ์ฃผ์ฅ์ ๋ฐ๋ฅด๋ฉด MICE์ ๊ฒฝ์ฐ ํน์ ๋ณ์์์ ๊ฒฐ์ธก์น๊ฐ ์๊ณ์น ์ด์์ผ๋ก ๋ฐ์ํ ๋ ์ด๋ฅผ ๋์นํ์ง ๋ชปํ์ง๋ง MIDA๋ ๊ฒฐ์ธก์น์ ์์ ์๊ด์์ด ๋์น๊ฐ ๊ฐ๋ฅํ๋ค๊ณ ํ๋ค. ์ด์ ์๊ตฌ์ฌ์ ๊ฐ์ ธ R์์ ์ง์ ์คํํ ๊ฒฐ๊ณผ(Python์ MICE๊ฐ ์ ๋๋ก ๊ตฌํ๋์ด์์ง ์์๋ฏ ํ๋ค) MICE๊ฐ ๊ฒฐ์ธก์น๋ฅผ ๋์นํ์ง ๋ชปํ๋ ๊ฒฝ์ฐ๋ ์ค์ง ํน์ ๋ณ์๊ฐ ๋ชจ๋ ๊ฒฐ์ธก์น๋ก ๊ตฌ์ฑ๋์ด ์์ ๋ ๋ฟ์ด์๋ค.
๋์ผํ ํ๊ฒฝ์์ MIDA๋ ๊ฒฐ์ธก์น ๋์น๊ฐ ๊ฐ๋ฅํ ๊น? ๋ ผ๋ฌธ์์ ์ฃผ์ฅํ ๋ฐ์ ๋ฌ๋ฆฌ MIDA ๋ํ ํ๊ท ๋ฐ ์ต๋น๊ฐ์ผ๋ก ์์ ๋์ฒดํ๋ ๊ณผ์ ์ ๊ฑฐ์น๊ธฐ์ NaN์ผ๋ก๋ง ๊ตฌ์ฑ๋ ๋ณ์๋ ๋์น๋ฅผ ์งํํ์ง ๋ชปํ๋ค. ๋ ผ๋ฌธ์์ ๊ตฌ์ฒด์ ์ธ ์คํ setting ๋ฐ ์ฌ์ฉ ์ํํธ์จ์ด๋ฅผ ๋ฐํ์ง ์์ ๋์ผํ ์ํฉ์์ ๊ฒ์ฆํ ์๋ ์์ผ๋ ์ด์ ๊ฐ์ ์ด์ ๋ก ์ธํด ์คํ ๊ฒฐ๊ณผ์ ๋ํ ์๋ฌธ์ด ๋จ์์๋ค. ๋ค๋ง ๊ตฌํ์ ์ฌ์ฐ๋ ํ๋ก์ ํธ๋ฅผ ์งํํ ์ผ์ด ์๋ค๋ฉด MIDA๋ฅผ ์ ์ฉ ํ MICE, KNN imputation ๋ฑ์ ๋ค๋ฅธ ๊ธฐ๋ฒ์ด ๋ ์ฐ์ํ์๋ค๊ณ ๋ด์ฉ ์ฑ์ฐ๊ธฐ์๋ ์ข๋ค.
Proposed method
Generative adversarial imputation nets (GAIN)์ 2018๋ ๊ตญ์ ๋จธ์ ๋ฌ๋ํํ(ICML)์ ๋ฑ์ฌ๋ ๋ ผ๋ฌธ์ด๋ค. ์ด๋ฆ์์ ์ ์ ์๋ฏ์ด GANs์ ๊ตฌ์กฐ๋ฅผ ๋ณ๊ฒฝํ์ฌ ๊ฒฐ์ธก์น๋ฅผ ๋ณด์ํ๋ ๋ฐฉ๋ฒ์ด๋ค. ๋ณธ ํฌ์คํ ์ GANs์ ๋ํ ์ฌ์ ์ง์์ด ์๋ ๋ ์๋ค์ด ๋ณธ๋ค๋ ๊ฐ์ ํ์ ์์ฑํ์๋ค. GAIN์ ๊ตฌ์กฐ๋ Figure 10๊ณผ ๊ฐ๋ค.

GAIN์ ์์ฑ์(generator)์ ํ๋ณ์(discriminator) ๋ถ๋ถ์ผ๋ก ๋๋ ์ ์๋ค. ์์ฑ์๋ ์ด 3๊ฐ์ง input์ ๋ฐ๋๋ฐ ๊ฐ๊ฐ์ data matrix (X~), random matrix ((1โM)โZ), mask matrix (M)์ด๋ฉฐ ๋์น๊ฐ ์๋ฃ๋ imputed matrix๋ฅผ output์ผ๋ก ์ผ๋๋ค.
Data matrix๋ ๊ฒฐ์ธก์น๋ 0์ผ๋ก ์์ ๋์นํ ํ๋ ฌ์ ๋ปํ๋ค. ์ด๋ ์์ฑ์๊ฐ ๋ง๋ค๊ณ ์ํ๋ ๋ชฉํ ๋ถํฌ์ ํด๋นํ๋ฉฐ ์ ๋ต ์ญํ ์ ํ๋ค. Random matrix๋ ์์ฑ์๊ฐ ๊ฐ์์ ๋ฐ์ดํฐ(๊ฒฐ์ธก์น ๋์ฒด ๊ฐ)๋ฅผ ์์ฑํ ๋ ํ์ํ input์ ํด๋นํ๋ค. ์ผ๋ฐ์ ์ธ GANs์์์ white noise์ ํด๋นํ๋ฉฐ noise๋ feature๋ง๋ค ์๋ก ๋ค๋ฅธ ๋ถํฌ๋ฅผ ๋๋ค. Mask matrix๋ ๊ฒฐ์ธก์น๋ 0, ๊ฒฐ์ธก์น๊ฐ ์๋ ๊ฐ์ 1๋ก ํ ๋นํ matrix์ด๋ค. ์ด๋ ์์ฑ์์ ํ๋ณ์ ๋ชจ๋ ์ฌ์ฉ๋๋ฉฐ ์ฃผ๋ ๋ชฉ์ ์ ํ๋ณ์์ ์ ๋ต์ง ์ญํ ์ ํ๋ค. ์์ฑ์์์์ ์ญํ ์ feature noise Z์ pairwise product๋ฅผ ํตํด ์ฐจ์์ ์ผ์น์ํค๋ ์ญํ ์ ํ๋ค. Feature noise์ ๊ฒฝ์ฐ feature ๊ฐ์ * sample ์ ์ฐจ์์ ์ง๋๋๋ฐ ์ด๋ฅผ 1-mask matrix์์ ๊ณฑ์ ํตํด ๊ฒฐ์ธก์น ๋ถ๋ถ์๋ง noise๊ฐ ์ง๋ ํ๋ ฌ์ ๋ง๋ค์ด ์ฃผ๋ ์ญํ ์ ํ๋ ๊ฒ์ด๋ค. Figure 11์ ํตํด์ ์์ฑ์์ input๊ณผ ๊ทธ์ ์ญํ ์ ํ์ธํ ์ ์๋ค.

์์ฑ์๋ ์์์ ์ ์ํ 3๊ฐ์ง input์ ๋ฐ์ ๊ฒฐ์ธก์น๋ฅผ ๋ณด์ํ ํ๋ ฌ(Xห)์ ์ถ๋ ฅํ๋ค. ๋จ ์์ฑ์์ ์์ output์ธ Xห๋ imputed matrix๊ฐ ๋ ์ ์๋๋ฐ, ๊ทธ ์ด์ ๋ ์์ฑ์๋ฅผ ๊ฑฐ์น๋ฉด์ ์ ๊ฒฝ๋ง ์ฐ์ฐ์ ์ํด ๊ฒฐ์ธก์น๊ฐ ์๋ ๊ธฐ์กด๊ฐ(xijโ^โ)๋ค ๋ํ ๋ณํ์ด ์ค๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฐ๋ผ์ ๋ณธ๋ ๊ฒฐ์ธก์น๊ฐ ์๋์๋ ๊ฐ์ data matrix์ ๊ฐ์ ๊ฐ์ ธ์ค๊ณ , ๊ฒฐ์ธก์น ์๋ฆฌ๋ง ์์ฑ๊ฐ์ผ๋ก ๋์ฒดํ ํ๋ ฌ์ ์ฌ์ฉํ๋ค. Imputed matrix (X^)์ ์์์ ๋ค์๊ณผ ๊ฐ๋ค.
๋ค์์ผ๋ก ํ๋ณ์์ ๋ํด์ ์์๋ณด์. ํ๋ณ์์ input์ ๋ ๊ฐ์ง๋ก, ์์ฑ์๋ฅผ ๊ฑฐ์น imputed matrix์ mask matrix๋ฅผ ํ ๋๋ก ์์ฑ๋ hint matrix (H)์ด๋ค. Hint matrix๋ ํ๋ณ์์ ์ํํ ํ์ต์ ์ ๋ํ๊ธฐ ์ํด ํน์ eleme-nt์ ๋ํ ์ ๋ต์ ์ ๊ณตํ๋ฉฐ epoch ๋ง๋ค ์์๋ก ๋ ธ์ถ๋๋ ๊ฐ์ด ๋ฌ๋ผ์ง๋ค. Figure 12๋ฅผ ์ดํด๋ณด์.

Hint matrix๊ฐ ํ์ํ ์ด์ ๋ฅผ ์๊ธฐ ์ํด์๋ ํ๋ณ์์ ์ญํ ์ ๋ํด์ ์์์ผํ๋ค. ํ๋ณ์๋ ์์ฑ์๊ฐ ๋ง๋ค์ด๋ธ ๊ฐ(๊ฒฐ์ธก ๋์ฒด ํ๋ณด๊ฐ)๊ณผ ๊ฒฐ์ธก์น๊ฐ ์๋ ์ค์ ๊ฐ์ ๊ตฌ๋ถํ๋ ์ญํ ์ ํ๋ค. ์ผ๋ฐ์ ์ธ GANs์์์ ํ๋ณ์๋ image ํ ์ฅ์ ๋ํ real, fake๋ฅผ ๊ตฌ๋ถํ๋ ๊ฒ์ด๊ธฐ์ output layer๋ 1๊ฐ(with sigmoid activation function), ํน์ 2๊ฐ(softmax activation function)์ hidden nodes๋ฅผ ์ฌ์ฉํ๋ค.
์ด์ ๋ฌ๋ฆฌ GAIN์ ์ ํ ๋ฐ์ดํฐ์ ๋ชจ๋ elements์ ๋ํ classification์ ์งํํ๊ธฐ์ sample์ ๊ฐ์(n) * feature์ ๊ฐ์(p)์ nodes๋ฅผ ๊ฐ์ ธ์ผํ๋ค. Softmax activation์ ์ฌ์ฉํ๊ธฐ์๋ ํฑ์์ด ๋ง์ ์ซ์์ด๊ธฐ์ multi label classification์ผ๋ก ์ ๊ทผํ์ฌ n*p๊ฐ์ output nodes ๊ฐ๊ฐ์ sigmoid activate function์ ์ฌ์ฉํ๊ฒ ์ง๋ง ์ผ๋ฐ์ ์ผ๋ก ์ ํ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ n*p์ ๊ฐ์๋ ์๋นํ ์์ค์ด๋ผ ํ์ต์ ์ด๋ ค์์ด ์กด์ฌํ ๊ฒ์ด๋ค.
Hint matrix๋ฅผ ์ดํด๋ณด๋ฉด ์ค์ ๊ฐ์ 1, ๊ฒฐ์ธก์น๋ 0, hint element๋ 0.5์ ๊ฐ์ ๊ฐ๊ณ ์๋ค. ํ๋ณ์์ ์ ์ฅ์์ ์ด์ ๊ฐ์ ์ ๋ต์ ์ผ๋ถ๊ฐ ๋ค์ด์จ ๊ฒ์ด๊ธฐ์ ํ์ต์ ์งํํ ๋๋ 0.5์ hint element์ ๋ํด์๋ง ํ์ต์ ์งํํ๋ค๊ณ ์ดํดํ๋ฉด ๋๋ค. ์ฆ ๋ชจ๋ element๋ฅผ ์์ธก, ํ์ตํ ํ์ ์์ด epoch๋ง๋ค ๋ค๋ฅด๊ฒ ๋ฐฐ์ ๋๋ ์ผ๋ถ element์ ๋ํ loss๋ฅผ ๋ฐ์ํ๋ค. ํด๋น ๊ทธ๋ฆผ์์ hint generator๋ผ๋ ๋ณ๋์ network๊ฐ ์กด์ฌํ๋ ๊ฒ ์ฒ๋ผ ๋ณด์ด์ง๋ง epoch ๋ง๋ค element ์๋ฆฌ๋ฅผ ๋ณ๊ฒฝํ๋ ๊ฒ์ด hint generator๋ฅผ ์๋ฏธํ๋ค.
Loss function of GAIN
๋ค์์ผ๋ก GAIN์ loss function์ ๋ํด์ ์์๋ณด์. ์์ฑ์์ loss function์ ๋ ๊ฐ์ง๋ก ๊ตฌ์ฑ์ด ๋๋๋ฐ, ์ฒซ ๋ฒ์งธ loss๋ ๊ฒฐ์ธก์น๊ฐ ์๋ ๊ธฐ์กด๊ฐ(xijโ^โ)๊ณผ ์์ฑ์๋ฅผ ๊ฑฐ์ณ ๋ณํ์ด ๋ ๊ธฐ์กด๊ฐ(xijโหโ)์ mean squared error (MSE)์ด๋ค. ์์์ ์์ฑ์์ 3๊ฐ์ง input์ ์๊ฐํ๋ฉฐ data matrix์ ์ญํ ์ ์์ฑ์๊ฐ ์ถ๊ตฌํ๋ ๋ชฉํ ๋ถํฌ๋ผ๊ณ ์ค๋ช ํ์๋๋ฐ MSE term์ ํตํด ํ์ธํ ์ ์๋ค. ์ด๋ ๋ฏ ๊ฒฐ์ธก์น๊ฐ ์๋ ๊ฐ๋ง์ ์ฌ์ฉํ์ฌ ๊ฒฐ์ธก์น๋ฅผ ์ฑ์ฐ๋ ์ธก๋ฉด์์ ์ถ์ฒ ์์คํ (recommender system)์์ ์ฌ์ฉ๋๋ matrix factorization (MF)๊ณผ ์ ์ฌํ๋ค. ์คํ์์ ๋น๊ต ๋์์ผ๋ก MF๊ฐ ์ฌ์ฉ๋๋ ์ด์ ์ง ์์๊น ์ถ๋ค.
์์ฑ์์ ๋ ๋ฒ์งธ loss์ด์ ํ๋ณ์์ loss๋ ๊ฐ element๋ค์ real, fake์ ๋ํ ์์ธก ํ๋ฅ ๊ณผ mask matrix ์ฌ์ด์ cross entropy์ด๋ค. ์ด ๋ ๊ฐ์ง loss๊ฐ ์ ์ฉ๋ ๊ทธ๋ฆผ์ Figure 13๊ณผ ๊ฐ๋ค.

์ค์ GAIN ๋ ผ๋ฌธ์ ์ดํด๋ณด๋ฉด pseudo code๋ฅผ ๋น๋กฏํ ์์์ ์ฆ๋ช ๋ฑ ์์ธํ ๋ด์ฉ์ ํ์ธํ ์ ์์ผ๋ ๊ด์ฌ์ด ์๋ ๋ ์๋ ์ฐธ๊ณ ํ๋ฉด ์ข์ ๋ฏ ํ๋ค.
Results
์คํ ๊ฒฐ๊ณผ๋ ์ด 5๊ฐ์ง datasets์ ์ฌ์ฉํ์์ผ๋ฉฐ ๋น๊ต ์๊ณ ๋ฆฌ์ฆ์ ์์์ ์ค๋ช ํ MICE, MIDA (Auto-encoder), MissForest, Matrix (matrix factorization), expectation maximization (EM)์ด๋ค. Data imputation์ ์ฑ๋ฅ์ ์์๋ก ๊ฒฐ์ธก์น๋ฅผ ์์ฑํ ๋ค์ ์ด๋ฅผ ์ผ๋ง๋ ์ ๋ณต์ํ๋์ง, root mean squared error (RMSE)๋ฅผ ์ธก์ ํ์ฌ ๋น๊ตํ ์ ์๋ค. ์๋ ํ๋ ๊ฐ ์๊ณ ๋ฆฌ์ฆ์ n๋ฒ ์ํ ํ ํ๊ท ยฑํธ์ฐจ๋ฅผ ๋ํ๋ธ ํ์ด๋ค. ์ด๋ฅผ ํตํด ์ ์๋ค์ด GANs๊ฐ ๊ฐ๊ณ ์๋ ๊ณ ์ง์ ์ธ ๋ฌธ์ (์: ํ์ต ๋ฐ ์๋ ด์ ์ด๋ ค์, ์ฌํ์ฑ์ issue)์์ ์์ ๋กญ๋ค๋ ์ ์ ๊ฐ์กฐํ ๋ชจ์ต์ ํ์ธํ ์ ์๋ค.

5๊ฐ์ง datasets์ ๋ํด์ GAIN์ด ๊ฐ์ฅ ๋์ ์ฑ๋ฅ์์ ํ์ธํ ์ ์๋ค.
๋ค์์ผ๋ก ๋ฐ์ดํฐ์ ๊ฒฐ์ธก์น ๋ดํฌ ๋น์จ์ ๋ฐ๋ฅธ imputation ์ฑ๋ฅ(a)๊ณผ sample ์ซ์์ ๋ฐ๋ฅธ ์ฑ๋ฅ(b), feature dimension์ ๋ฐ๋ฅธ ์ฑ๋ฅ(c)์ MissForest, MICE์ ๋น๊ตํ ๊ทธ๋ํ๋ ํ๊ธฐ์ ๊ฐ๋ค.

๊ฒฐ์ธก์น ๋น์จ์ ๋ฐ๋ฅธ imputation ์ฑ๋ฅ์ ํ์ธํ๋ฉด ๋ชจ๋ missing rate์์ GAIN์ ์ฑ๋ฅ์ด ์ฐ์ํจ์ ์ ์ ์๋ค(y-axis: RMSE). Sample ์ซ์์ ๋ฐ๋ฅธ ์ฑ๋ฅ์ ํ์ธํ ์ ํ์คํ deep learning method์ธ GAIN๊ณผ MIDA๋ 100๊ฐ ๋ฏธ๋ง์ samle์ผ ๋ ์ฑ๋ฅ์ด MissForest์ ๋น๊ตํ์ฌ ์ข์ง ์๋ค. ๊ทธ๋ฌ๋ GAIN์ MIDA์ ๋ฌ๋ฆฌ ๊ทธ ์ด์์ sample ์๋ฅผ ๋ณด์ ํ๊ณ ์์ผ๋ฉด ๊ฐ์ฅ ์ข์์ ํ์ธํ ์ ์๋ค. ๋ง์ง๋ง์ผ๋ก feature dimension์ ๋ฐ๋ฅธ imputation ์ฑ๋ฅ์ ๊ฒฝ์ฐ ๋ชจ๋ ์ธก๋ฉด์์ GAIN์ด ์ฐ์ํ๋ค.
๋ค์ํ ์คํ ๊ฒฐ๊ณผ์์ GAIN์ ์ฐ์์ฑ์ ์ ์ฆํ์๊ณ ํ ํฐ์ด ์ปจํผ๋ฐ์ค ICML์ ์ค๋ฆฐ๋งํผ ์๋ฆฌ์ ์ฆ๋ช ๋ํ ํํํ ๋ ผ๋ฌธ์ด๋ผ๊ณ ์๊ฐํ๋ค. ๋ค๋ง ํ์ ์์ ์ฌ์ฉ ๊ฐ๋ฅํ ์ ๋๋ก ๊ตฌํ์ด ์ฉ์ดํ์ง, ๋ํ ๊ตฌํ๋ ๋ชจ๋ธ์ด ๋ ผ๋ฌธ์์ ์ ์ฆ๋ ๊ฒ ์ฒ๋ผ ํ์ต ๋ฐ ์๋ ด์ ์ด๋ ค์, ์ฌํ์ฑ issue๋ฅผ ๊ทน๋ณตํ ๋งํผ ์์ ๋ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ ์ ์๋์ง๋ ํด๋ด์ผ ์ ๊ฒ ๊ฐ๋ค. ์ด์์ผ๋ก ํฌ์คํ ์ ๋ง๋ฌด๋ฆฌ ์ง๋๋ค.
Reference
[1] Rubin, D. B. (1976). Inference and missing data. Biometrika, 63(3), 581-592.
[2] Hair, J. F., Black, W. C., Babin , B. J., Anderson, R. E., & Tatham, R. L. (2006). Multivariate data analysis (6 th ed.). pp. 49 73. Upper Saddle River, NJ: Pearson Educations, Inc.
[3] Stekhoven, D. J., & Bรผhlmann, P. (2012). MissForestโnon-parametric missing value imputation for mixed-type data. Bioinformatics, 28(1), 112-118.
[4] Gondara, L., & Wang, K. (2018, June). Mida: Multiple imputaJใ ใ ์Uในtion using denoising autoencoders. In Pacific-Asia conference on knowledge discovery and data mining (pp. 260-272). Springer, Cham.
[5] van Buuren, S. (2014). MICE: Multiple Imputation by Chained Equations. R Package Version 2.21.
[6] Honaker, J., King, G., & Blackwell, M. (2011). Amelia II: A program for missing data. Journal of statistical software, 45(1), 1-47.
โ ๋ ผ๋ฌธ์ concept ๋ฐ idea ์์ฃผ๋ก ์ ๋ฆฌํ์ฌ ์์ธํ ์์์ด๋ ๋ด์ฉ์ ์ค๋ฅ๊ฐ ์์ ์ ์์ต๋๋ค.
Last updated