๊ธฐ์กด ๋ฌธ์
- Controlled Text Generation์ ์ฌ๋ฌ๊ฐ์ง ๋ฐฉ๋ฒ์ด ์์
- CCLM: GPT-2๊ฐ์ ์ผ๋ฐ LM์ ํน์ ๋๋ฉ์ธ corpus๋ก ์ง์ Finetuneํ๋ ๋ฐฉ๋ฒ
- PPLM: GPT-2 output์ final layer์ Linear Gradient ascending ๋ถ์ฌ์ ํน์ ํ Attribute๋ก ์ ์ด
FUDGE
- Language Model G
- G์ Random Var P(x)
- ์ฐ๋ฆฌ๊ฐ ๊ตฌํ๊ณ ์ ํ๋ ๊ฒ์ ๋ก ์กฐ๊ฑด์ ๋ฐ๋ฅธ Generation (conditioning)
- ์ด๋ ์ง์ ์ ์ผ๋ก ๋ฅผ ๊ตฌํ๋ ๋ฐฉ๋ฒ์ด โ CCLM
- fudge์์๋ ๋ฅผ ๋ฐ๋ฅด๋ Bayesian factorization์ ์ด์ฉ
- ์ด ๋ถ๋ถ์ GeDI์์ ์ฌ์ฉํ ๋ฐฉ๋ฒ๋ก ๊ณผ ๊ฑฐ์ ํก์ฌํ๋ค.
- Prediction Model โ P(a|x_1:i)๋ '์์ฑ๋ ๋ฌธ์ฅ'์ ๋ํ Classifier
- ์ฆ, Top-200(Top-k) ์ํ๋ง๋ ๊ฒ์ ๋ํด classifier(LSTM๊ธฐ๋ฐ)
- ์ฌ๊ธฐ์๋ 200๋ฒ์ ๋ํด inference ํ๋ ๊ฒ์ ๋ํ Computing cost์ ๋ํด Excuse๊ฐ ์์
ย