2021 "์ด๋ค ์ธ์ด ๋ชจ๋ธ์ด ์ข์๊น - ์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ตํ ์ญ์ฌ"
(โ์ด๋ค ์ธ์ด ๋ชจ๋ธ์ด ์ข์๊น - ์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ตํ ์ญ์ฌโ 2021)
์ธ์ด ๋ชจ๋ธ(Language Model)์ ํน์ ๋ฌธ์ฅ(=๋จ์ด์ ๋์ด)์ด ๋ฑ์ฅํ ํ๋ฅ ์ ๊ณ์ฐํด์ฃผ๋ ๋ชจ๋ธ์ ๋๋ค. ๋ฌธ์ฅ์ ๋ํด ํ๋ฅ ์ ๊ณ์ฐํ ์ ์๋ค๋ ๊ฑด, ๋จ์ด(ํน์ ๋ฌธ์ฅ)๋ฅผ ์ ์ ํ๊ฒ ์ ํํ๊ฑฐ๋ ์์ฑํด์ผํ๋ ๊ฒฝ์ฐ ์ฌ๋ฌ ํ๋ณด ์ค์์ ๋ ์ ์ ํ(ํ๋ฅ ์ด ๋์) ํ๋ณด๋ฅผ ์ ํํ๋ ๋ฐ์ ์ฐ์ผ ์ ์๋ค๋ ๋ป์ด์ง์. ์ด ๋๋ฌธ์ ๊ธฐ๊ณ๋ฒ์ญ, ์์ฑ ์ธ์, ์ฒ ์ ๊ต์ , OCR ๋ฑ ์ธ์ด์ ๊ด๋ จ๋ ์ฌ๋ฌ ๊ณผ์ ์์ ๋๋ฆฌ ์ฐ์ด๊ณ ์์ต๋๋ค(์ด์ ๋ํด์๋ ์์ ์ ๋ช๋ช ํฌ์คํ ์์ ๊ฐ๋ตํ๊ฒ ๋ค๋ฃฌ ์ ์ด ์์ต๋๋ค). ๊ฒ๋ค๊ฐ ์ต๊ทผ GPT-3์ ๊ฐ์ ๊ฐ๋ ฅํ ์ธ์ด ๋ชจ๋ธ์ด ๋ฑ์ฅํ๋ฉด์ ์ธ์ด๋ชจ๋ธ์ด ์์ ๊ฐ์ด ๋น๊ต์ ๋จ์ํ ๊ณผ์ ๋ฟ๋ง ์๋๋ผ ๋ํ๋ ๊ธด ๊ธ์ ํต์ฑ๋ก ์์ฑํ๊ฑฐ๋, ์ฃผ์ด์ง ์๋ฌธ์ด๋ ์ค๋ช ์ ๋ฐํ์ผ๋ก ์๋ก์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ๊น์ง๋ ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ด ๋ฐํ์ ธ์..
- N-Gram
- RNN ๊ณ์ด ๋ชจ๋ธ
- GPT 1,2,3
- Kneser-ney
Related-Notes
References
โ์ด๋ค ์ธ์ด ๋ชจ๋ธ์ด ์ข์๊น - ์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ตํ ์ญ์ฌ.โ 2021. ๋์ ํฐ O๋ log x์ผ. June 22, 2021. https://bab2min.tistory.com/666.