LLaMA: ๊ฐ๋ฐฉ์ ์ด๊ณ ํจ์จ์ ์ธ ๊ธฐ๋ฐ ์ธ์ด ๋ชจ๋ธ(Foundation Language Models)
์ด ์น์ ์ ํ์ฌ ๊ฐ๋ฐ์ค์ ์์ต๋๋ค.
์๋ก์ด ๊ธฐ๋ฅ
์ด ๋ ผ๋ฌธ์ 70์ต๊ฐ์์ 650์ต๊ฐ์ ํ๋ผ๋ฏธํฐ๊น์ง ๋ค์ํ ์ฌ์ด์ฆ์ ๊ธฐ๋ฐ ์ธ์ด ๋ชจ๋ธ(foundation language models)๋ค์ ์๊ฐํฉ๋๋ค.
์ด ๋ชจ๋ธ๋ค์ ๊ณต๊ฐ๋ ๋ฐ์ดํฐ์ ์์ ์กฐ ๋จ์ ๊ฐฏ์์ ํ ํฐ์ผ๋ก ํ์ต๋์์ต๋๋ค.
(Hoffman et al. 2022) (opens in a new tab)์ ์ฐ๊ตฌ๋ ๋ ๋ง์ ๋ฐ์ดํฐ์์ ํ์ต๋ ์์ ๋ชจ๋ธ์ด ๋ฐ๋ ๊ฒฝ์ฐ์ ๋ ํฐ ๋ชจ๋ธ๋ณด๋ค ๋์ ์ฑ๋ฅ์ ๋ฐํํ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค. ์ด ์ฐ๊ตฌ์์๋ 2000์ต๊ฐ ํ ํฐ์์ 100์ต๊ฐ ๋ชจ๋ธ์ ํ์ตํ๋ ๊ฒ์ ๊ถ์ฅํ๊ณ ์์ต๋๋ค. ๊ทธ๋ฌ๋ LLaMA ๋ ผ๋ฌธ์์๋ 70์ต๊ฐ ๋ชจ๋ธ์ ์ฑ๋ฅ์ 1์กฐ๊ฐ์ ํ ํฐ ์ดํ์๋ ์ง์ํด์ ํฅ์๋๋ค๋ ๊ฒ์ ๋ฐ๊ฒฌํ์ต๋๋ค.

์ด ๋ ผ๋ฌธ์ ๋ค์ํ ์ถ๋ก ํ๊ฒฝ์์ ๋ ๋ง์ ํ ํฐ์ผ๋ก ํ์ตํจ์ผ๋ก์จ, ์ต์์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ ๋ชจ๋ธ(LLaMA)์ ํ์ตํ๋ ๋ฐ ์ด์ ์ ๋ง์ถ๊ณ ์์ต๋๋ค.
๋ฅ๋ ฅ & ์ฃผ์ ๊ฒฐ๊ณผ
์ ๋ฐ์ ์ผ๋ก, LLaMA-13B๋ GPT-3(175B)๋ณด๋ค 10๋ฐฐ ์์ง๋ง ๋ค์ํ ๋ฒค์น๋งํฌ์์ ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ, ๋จ์ผ GPU์์๋ ์๋์ด ๊ฐ๋ฅํฉ๋๋ค. LLaMA 65B๋ Chinchilla-70B ๋ฐ PaLM-540B ๊ฐ์ ๋ชจ๋ธ๋ค๊ณผ ๊ฒฝ์๋ ฅ์ด ์์ต๋๋ค.
๋ ผ๋ฌธ: LLaMA: Open and Efficient Foundation Language Models (opens in a new tab)
์ฝ๋: https://github.com/facebookresearch/llama (opens in a new tab)
์ฐธ๊ณ ์๋ฃ (References)
- Koala: A Dialogue Model for Academic Research (opens in a new tab) (April 2023)
- Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data (opens in a new tab) (April 2023)
- Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality (opens in a new tab) (March 2023)
- LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention (opens in a new tab) (March 2023)
- GPT4All (opens in a new tab) (March 2023)
- ChatDoctor: A Medical Chat Model Fine-tuned on LLaMA Model using Medical Domain Knowledge (opens in a new tab) (March 2023)
- Stanford Alpaca (opens in a new tab) (March 2023)