Retrieval Augmented Generation (RAG) for LLMs
Retrieval Augmented Generation(RAG)์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ, ์ฆ LLM(Large Language Models)์ ํ๊ณ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ์ ๋๋ค. ์ด ๋ฐฉ์์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ฐ์ ์ธ๋ถ ์ง์์์ LLM์ ๊ฒฐํฉ์์ผ, ๋๋ฉ์ธ ์ง์์ ๊ฒฉ์ฐจ, ์ฌ์ค์ ์ค๋ฅ, ๊ทธ๋ฆฌ๊ณ ์๋ชป๋ ์ ๋ณด ์์ฑ(hallucination)๊ณผ ๊ฐ์ ๋ฌธ์ ๋ค์ ์ค์ผ ์ ์์ต๋๋ค. ํนํ, ์ง์์ ์ผ๋ก ๋ณํํ๊ณ ์ ๋ฐ์ดํธ๋๋ ์ ๋ณด๊ฐ ํ์ํ ๋ถ์ผ๋ ํน์ ํ ์์ฉ ํ๋ก๊ทธ๋จ์์ RAG๋ ํฐ ์ฅ์ ์ ๊ฐ์ง๊ฒ ๋ฉ๋๋ค. RAG์ ๋ฐ์ด๋ ์ ์ ํน์ ์์ ์ด๋ ์์ฉ ํ๋ก๊ทธ๋จ์ ๋ง์ถ์ด LLM์ ๋ค์ ํ์ต์ํฌ ํ์๊ฐ ์๋ค๋ ๊ฒ์ ๋๋ค. ์ต๊ทผ์๋ ๋ํํ ์์ด์ ํธ ๋ถ์ผ์์ RAG์ ํ์ฉ์ด ๋์ด๋๋ฉฐ ๊ทธ ์ธ๊ธฐ๊ฐ ๋ง์์ง๊ณ ์์ต๋๋ค.
์ด ๊ธ์ ์ต๊ทผ ๋ฐํ๋ 'Retrieval-Augmented Generation for Large Language Models: A Survey (opens in a new tab) (Gao et al., 2023)'๋ผ๋ ๋ ผ๋ฌธ์์ ๋์จ ์ค์ํ ๋ฐ๊ฒฌ๊ณผ ์ค์ง์ ์ธ ์ธ์ฌ์ดํธ๋ฅผ ์์ฝํฉ๋๋ค. ํ์ฌ์ ์ ๊ทผ ๋ฐฉ๋ฒ, ์ต์ RAG ๊ธฐ์ , ํ๊ฐ ๋ฐฉ๋ฒ, ์์ฉ ํ๋ก๊ทธ๋จ, ๊ทธ๋ฆฌ๊ณ RAG ์์คํ ์ ๊ตฌ์ฑํ๋ ๋ค์ํ ์์(๊ฒ์, ์์ฑ, ์ฆ๊ฐ ๊ธฐ์ )๋ฅผ ๋๋ฌ์ผ ๊ธฐ์ ์ ์ง์คํ์ฌ ์ค๋ช ํฉ๋๋ค.
RAG๋?
์ด ๋ฌธ์ (opens in a new tab)์์ ์๊ฐ๋์๋ฏ์ด, RAG๋ ์๋์ ๊ฐ์ด ์ ์๋ ์ ์์ต๋๋ค:
RAG๋ ์ ๋ ฅ์ ๋ฐ์ ํด๋นํ๋ ์ถ์ฒ(์: ์ํค๋ฐฑ๊ณผ)์์ ๊ด๋ จ ๋ฌธ์๋ฅผ ์ฐพ์๋ ๋๋ค. ์ด ๋ฌธ์๋ค์ ์๋์ ์ ๋ ฅ ํ๋กฌํํธ์ ํจ๊ป ์ปจํ ์คํธ๋ก ์ฐ๊ฒฐ๋์ด, ํ ์คํธ ์์ฑ๊ธฐ๋ฅผ ํตํด ๊ฒฐ๊ณผ๋ฌผ์ ๋ง๋ค์ด๋ ๋๋ค. ์ด ๊ณผ์ ์ ํตํด RAG๋ ๋ณํํ๋ ์ ๋ณด์๋ ์ ์ํ ์ ์์ต๋๋ค. ์ด๋ LLM์ ๊ณ ์ ๋ ๋งค๊ฐ ๋ณ์์ ๋ํ ํจ๊ณผ์ ์ธ ํด๊ฒฐ์ฑ ์ด ๋ฉ๋๋ค. RAG ๋๋ถ์ ์ธ์ด ๋ชจ๋ธ์ ๋ค์ ํ์ตํ ํ์ ์์ด ๊ฒ์ ๊ธฐ๋ฐ ์์ฑ์ ํตํด ์ต์ ์ ๋ณด์ ๊ธฐ๋ฐํ ์ ๋ขฐํ ์ ์๋ ๊ฒฐ๊ณผ๋ฌผ์ ๋ง๋ค ์ ์์ต๋๋ค.
๊ฐ๋จํ ๋งํด์, RAG์์ ๊ฒ์๋ ์ ๋ณด๋ LLM ์๋ต์ ์ ํ์ฑ, ์ ์ด ๊ฐ๋ฅ์ฑ ๋ฐ ๊ด๋ จ์ฑ์ ๋์ด๋ ๋ฐ ํ์ฉ๋ฉ๋๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์, ๋ณํํ๋ ํ๊ฒฝ์์ ๋ฐ์ํ ์ ์๋ ๊ฑฐ์ง๋ ์ ๋ณด ์์ฑ์ด๋ ์ฑ๋ฅ ๋ฌธ์ ๋ฅผ ์ค์ด๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
RAG๋ ์ฌ์ ๊ต์ก(Pre-traing) ๋ฐฉ๋ฒ์ ๊ฐ์ ๊ณผ ๊ด๋ จ์ด ์์ต๋๋ค. ๊ทธ๋ฌ๋, ํ์ฌ๋ RAG์ ChatGPT (opens in a new tab)๋ย Mixtral (opens in a new tab)๊ณผ ๊ฐ์ ์ฑ๋ฅ์ด ๋ฐ์ด๋ ํ์ธ ํ๋๋ ๋ชจ๋ธ์ ์ฅ์ ์ ๊ฒฐํฉํ๋ ๋ฐ ์ค์ ์ ๋๊ณ ์์ต๋๋ค. ์๋ ์ฐจํธ๋ RAG ์ฐ๊ตฌ์ ๋ฐ์ ์ ๋ณด์ฌ์ค๋๋ค.
์๋ ๊ทธ๋ฆผ์ RAG ์์ฉ ํ๋ก๊ทธ๋จ์ ์ผ๋ฐ์ ์ธ ์ํฌํ๋ก์ฐ๋ฅผ ๋ณด์ฌ์ค๋๋ค:
์ ๊ทธ๋ฆผ์์ ๋์จ ๋ค์ํ ๋จ๊ณ ๋ฐ ๊ตฌ์ฑ ์์๋ฅผ ์ค๋ช ํด๋ณด๊ฒ ์ต๋๋ค:
- ์ ๋ ฅ: LLM ์์คํ ์ด ์๋ตํด์ผ ํ ์ง๋ฌธ์ '์ ๋ ฅ'์ด๋ผ๊ณ ํฉ๋๋ค. RAG๋ฅผ ์ฌ์ฉํ์ง ์๋ ๊ฒฝ์ฐ, LLM์ ์ง์ ์ง๋ฌธ์ ๋๋ตํฉ๋๋ค.
- ์์ธ ์์ฑ: RAG๋ฅผ ์ฌ์ฉํ ๋๋ ๊ด๋ จ ๋ฌธ์๋ค์ด ๋จผ์ ์์ ๋จ์๋ก ๋๋์ด ์์ธํ๋ฉ๋๋ค. ์ถ๋ก ๊ณผ์ ์์๋ ์ง๋ฌธ๋ ๋น์ทํ ๋ฐฉ์์ผ๋ก ์๋ฒ ๋ฉ๋ฉ๋๋ค.
- ๊ฒ์: ์ง๋ฌธ๊ณผ ๊ด๋ จ๋ ๋ฌธ์๋ค์ ์์ธ๋ ๋ฒกํฐ์ ๋น๊ตํ์ฌ ๊ฒ์๋ฉ๋๋ค. ์ด ๋ฌธ์๋ค์ '๊ด๋ จ ๋ฌธ์(Relevant Documents)'๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
- ์์ฑ: ๊ด๋ จ ๋ฌธ์๋ค์ ์๋์ ์ง๋ฌธ๊ณผ ํจ๊ป ์ถ๊ฐ ์ปจํ ์คํธ๋ก ๊ฒฐํฉ๋ฉ๋๋ค. ์ด ๊ฒฐํฉ๋ ํ ์คํธ์ ์ง๋ฌธ์ ๋ชจ๋ธ์ ์ ๋ฌ๋์ด ์์คํ ์ ์ต์ข ์๋ต์ ์์ฑํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
์ ๊ณต๋ ์์์์, ๋ชจ๋ธ๋ง์ ์ฌ์ฉํ์ ๋ ํ์ฌ ์ฌ๊ฑด์ ๋ํ ์ง์ ๋ถ์กฑ์ผ๋ก ์ง๋ฌธ์ ์๋ตํ์ง ๋ชปํ์์ต๋๋ค. ๋ฐ๋ฉด, RAG๋ฅผ ์ฌ์ฉํ ๋ ์์คํ ์ ๋ชจ๋ธ์ด ์ง๋ฌธ์ ์ ์ ํ๊ฒ ๋๋ตํ ์ ์๋๋ก ํ์ํ ์ ๋ณด๋ฅผ ์ ๊ณตํด์ฃผ์์ต๋๋ค.
RAG ํจ๋ฌ๋ค์
์ต๊ทผ ๋ช ๋ ๋์ RAG ์์คํ ์ Naive RAG์์ Advanced RAG, Modular RAG๋ก ๋ฐ์ ํด์์ต๋๋ค. ์ด๋ฌํ ๋ฐ์ ์ ์ฑ๋ฅ๊ณผ ๋น์ฉ, ํจ์จ์ฑ๊ณผ ๊ด๋ จ๋ ํน์ ์ ํ ์ฌํญ์ ํด๊ฒฐํ๊ธฐ ์ํ ๊ฒ์ ๋๋ค.
Naive RAG
Naive RAG๋ ์์ธ ์์ฑ๊ณผ ๊ฒ์, ์์ฑ ์์ผ๋ก ์ ํต์ ์ธ ๋จ๊ณ๋ฅผ ๊ฑฐ์นฉ๋๋ค. ์ฌ์ฉ์์ ์ ๋ ฅ์ ๊ด๋ จ ๋ฌธ์๋ฅผ ์ฐพ๋ ๋ฐ ์ฌ์ฉ๋๊ณ , ์ด ๋ฌธ์๋ค์ ์ต์ข ์๋ต์ ์์ฑํ๋ ๋ชจ๋ธ์ ์ ๋ฌ๋๊ธฐ ์ ์ ํ๋กฌํํธ์ ๊ฒฐํฉ๋ฉ๋๋ค. ์ฌ๋ฌ ๋จ๊ณ์ ๋ํ ์ํธ์์ฉ์ด ํ์ํ ์์ฉ ํ๋ก๊ทธ๋จ์์๋ ๋ํ ์ด๋ ฅ์ ํ๋กฌํํธ์ ํตํฉํ ์ ์์ต๋๋ค.
Naive RAG๋ ๊ฒ์๋ ๋ฌธ์์ ์์๋ ์ ํ๋ ๋ฌธ์ (๋ฎ์ ์ ๋ฐ๋), ๊ด๋ จ ๋ฌธ์๋ฅผ ์ฐพ์ง ๋ชปํ๋ ๋ฌธ์ (๋ฎ์ ์ฌํ์จ) ๋ฑ์ ํ๊ณ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค. ๋ํ, RAG ์์คํ ์ด ํด๊ฒฐํด์ผ ํ ์ฃผ์ํ ๋ฌธ์ ์ค ํ๋๊ฐ LLM์๊ฒ ์ค๋๋ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ค๋ ๊ฒ์ ๋๋ค. ์ด๋ก ์ธํด ์๋ชป๋ ์ ๋ณด ์์ฑ์ด๋ ๋ถ์ ํํ ์๋ต์ด ๋ํ๋ ์ ์์ต๋๋ค.
Naive RAG์์ ์ฆ๊ฐ์ ์ ์ฉํ ๋, ์ค๋ณต์ด๋ ๋ฐ๋ณต๊ณผ ๊ฐ์ ๋ฌธ์ ๋ ๋ฐ์ํ ์ ์์ต๋๋ค. ๋ํ ์ฌ๋ฌ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ์ฌ์ฉํ ๋, ์์ ๋งค๊ธฐ๊ธฐ์ ์คํ์ผ/ํค ์กฐ์ ๋ ์ค์ํฉ๋๋ค. ๋ ๋ค๋ฅธ ๋ฌธ์ ๋ ์์ฑ ์์ ์ด ๊ฒ์๋ ์ ๋ณด์ ์ง๋์น๊ฒ ์์กดํ๊ฒ ๋์ด ๋ชจ๋ธ์ด ๊ฒ์๋ ๋ด์ฉ์ ๋จ์ ๋ฐ๋ณตํ๊ฒ ๋๋ ๊ฒ์ ๋๋ค.
Advanced RAG
Advanced RAG๋ ๊ธฐ์กด์ Naive RAG์์ ๋ฐ์ํ๋ ๋ฌธ์ ๋ค์ ํด๊ฒฐํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๊ฒ์ ํ์ง์ ๊ฐ์ ํ๋ ๊ฒ์ธ๋ฐ, ์ฌ์ ๊ฒ์(Pre-Retrieval)๊ณผ ๊ฒ์(Retrieval), ์ฌํ ๊ฒ์(Post-Retrieval) ๊ณผ์ ์ ์ต์ ํํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
์ฌ์ ๊ฒ์ ๊ณผ์ ์ ๋ฐ์ดํฐ ์์ธ ์์ฑ์ ์ต์ ํํ๋ ๊ฒ์ ํฌํจํ๋ฉฐ, ์ด ๊ณผ์ ์์๋ ๋ฐ์ดํฐ์ ์ง์ ๋์ด๊ธฐ ์ํด ๋ค์ฏ ๊ฐ์ง ๋จ๊ณ(๋ฐ์ดํฐ ์ธ๋ถํ, ์์ธ ๊ตฌ์กฐ ์ต์ ํ, ๋ฉํ๋ฐ์ดํฐ ์ถ๊ฐ, ์ ๋ ฌ ์ต์ ํ, ํผํฉ ๊ฒ์)๋ฅผ ๊ฑฐ์นฉ๋๋ค.
์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๊ฐ์ ํ๋ ๊ฒ์ผ๋ก ๊ฒ์์ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ํ์ธ ํ๋ํ๊ฑฐ๋ ์ปจํ ์คํธ๋ฅผ ๋ ์ ์ดํดํ๋ ๋์ ์๋ฒ ๋ฉ(์: OpenAI์ embeddings-ada-02 ๋ชจ๋ธ)์ ์ฌ์ฉํ๋ ๊ฒ์ผ๋ก ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๊ฐ์ ํ ์ ์์ต๋๋ค.
์ฌํ ๊ฒ์ ์ต์ ํ๋ ์ปจํ ์คํธ ์๋์ฐ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ ๋ฟ๋ง ์๋๋ผ ์ก์์ด ๋ง๊ฑฐ๋ ํ์๊ฐ ์๋ ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ ์ ์๋๋ก ํฉ๋๋ค. ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ ์ฌ์์ ๋งค๊ธฐ๊ธฐ(re-ranking)์ ๋๋ค. ์ด ๋ฐฉ๋ฒ์ ๊ด๋ จ ์ปจํ ์คํธ๋ฅผ ํ๋กฌํํธ์ ๊ฐ์ฅ์๋ฆฌ๋ก ์ฌ๋ฐฐ์นํ๊ฑฐ๋ ์ง๋ฌธ๊ณผ ๊ด๋ จ ํ ์คํธ ์ฒญํฌ ์ฌ์ด์ ์๋ฏธ๋ก ์ ์ ์ฌ์ฑ์ ๋ค์ ๊ณ์ฐํ๋ ๊ฒ์ ํฌํจํ ์ ์์ต๋๋ค. ํ๋กฌํํธ ์์ถ๋ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ๋ฐ ์ ์ฉํ ์ ์์ต๋๋ค.
Modular RAG
Modular RAG๋ ๊ฒ์ ๊ธฐ๋ฅ๊ณผ ๊ฐ์ ๋ค์ํ ๊ธฐ๋ฅ ๋ชจ๋์ ํตํฉํ์ฌ ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์ ์ฌ์ฑ ๊ฒ์์ ์ํ ๊ฒ์ ๋ชจ๋์ ํตํฉํ๊ณ ๊ฒ์๊ธฐ๋ฅผ ํ์ธ ํ๋ํ๋ ๋ฐฉ์์ด ๋ ์ ์์ต๋๋ค. Naive RAG์ Advanced RAG๋ ๋ชจ๋ Modular RAG์ ํน์ ํํ๋ก ๋ณผ ์ ์์ต๋๋ค. ํ์ฅ๋ RAG ๋ชจ๋์๋ ๊ฒ์, ๋ฉ๋ชจ๋ฆฌ, ์ตํฉ, ๋ผ์ฐํ , ์์ธก, ํ์คํฌ ์ด๋ํฐ ๋ฑ ๋ค์ํ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ๋ชจ๋์ด ํฌํจ๋ ์ ์์ผ๋ฉฐ, ์ด๋ค์ ํน์ ๋ฌธ์ ๋งฅ๋ฝ์ ๋ง๊ฒ ์กฐ์ ๋ ์ ์์ต๋๋ค. ๋ฐ๋ผ์ Modular RAG๋ ๋ชจ๋์ ์ถ๊ฐํ๊ฑฐ๋ ๊ต์ฒดํ๊ณ ์์ ์๊ตฌ ์ฌํญ์ ๋ง๊ฒ ๋ชจ๋ ๊ฐ์ ํ๋ฆ์ ์กฐ์ ํ ์ ์๋ ๋ ํฐ ๋ค์์ฑ๊ณผ ์ ์ฐ์ฑ์ ์ ๊ณตํฉ๋๋ค.
RAG ์์คํ ๊ตฌ์ถ์ ์ ์ฐ์ฑ์ด ์ฆ๊ฐํจ์ ๋ฐ๋ผ, RAG ํ์ดํ๋ผ์ธ์ ์ต์ ํํ๊ธฐ ์ํ ์ฌ๋ฌ ๊ธฐ์ ์ด ์ ์๋์์ต๋๋ค:
- ํ์ด๋ธ๋ฆฌ๋ ๊ฒ์ ํ์: ์ด ์ ๊ทผ๋ฒ์ ํค์๋ ๊ธฐ๋ฐ ๊ฒ์๊ณผ ์๋ฏธ๋ก ์ ๊ฒ์์ ๊ฒฐํฉํ์ฌ ๋ ๊ด๋ จ์ฑ ๋๊ณ ์ปจํ ์คํธ๊ฐ ํ๋ถํ ์ ๋ณด๋ฅผ ๊ฒ์ํฉ๋๋ค. ๋ค์ํ ์ง๋ฌธ ์ ํ๊ณผ ์ ๋ณด ์๊ตฌ ์ฌํญ์ ์ฒ๋ฆฌํ๋ ๋ฐ ์ ์ฉํ ์ ์์ต๋๋ค.
- ์ฌ๊ท์ ๊ฒ์ ๋ฐ ์ง์ ์์ง: ์ด ๋ฐฉ๋ฒ์ ์์ ์๋ฏธ ๋จ์์ธ ์ฒญํฌ(Chunk)์์ ์์ํ์ฌ ์ ์ง์ ์ผ๋ก ์ปจํ ์คํธ๋ฅผ ํ์ฅํด ๋๊ฐ๋ฉฐ ๋ ํฐ ์ฒญํฌ๋ฅผ ๊ฒ์ํ๋ ์ฌ๊ท์ ์ธ ๊ณผ์ ์ ๊ฑฐ์นฉ๋๋ค. ์ด๋ฌํ ์ ๊ทผ ๋ฐฉ์์ ๊ฒ์์ ํจ์จ์ฑ๊ณผ ํ๋ถํ ์ปจํ ์คํธ๋ฅผ ๊ฐ์ง ์ ๋ณด ์ฌ์ด์ ๊ท ํ์ ๋ง์ถ๋ ๋ฐ ํจ๊ณผ์ ์ ๋๋ค.
- ์คํ ๋ฐฑ ํ๋กฌํํธ: ์ด ํ๋กฌํํ ๊ธฐ์ (opens in a new tab)์ LLM์ ์ถ๋ก ์ ์ํ ๊ฐ๋ ๊ณผ ์์น์ ์์ฑํ๋๋ก ์ ๋ํฉ๋๋ค. ์ด ํ๋กฌํํธ๊ฐ RAG ํ๋ ์์ํฌ์ ์ ์ฉ๋ ๋, LLM์ ๊ตฌ์ฒด์ ์ธ ์ฌ๋ก์์ ๋ฒ์ด๋ ๋ ๋์ ๋ฒ์์ ์ถ๋ก ์ ํ ์ ์๊ฒ ๋๋ฏ๋ก ์ ๋ขฐ๋๊ฐ ๋์ ์๋ต์ ์์ฑํ ์ ์๊ฒ ๋ฉ๋๋ค.
- ํ์ ์ง์: ๋ค์ํ ์ง์ ์ ๋ต์ ํ์ฉํ์ฌ ๋ณต์กํ ์ง๋ฌธ์ ์ฌ๋ฌ ๊ฐ์ ํ์ ์ง๋ฌธ์ผ๋ก ๋ถํ ํ ์ ์์ต๋๋ค. ์ด๋ ํธ๋ฆฌ ๊ตฌ์กฐ๋ก ์ง์ํ๊ฑฐ๋ ์์ฐจ์ ์ผ๋ก ์ฒญํฌ๋ฅผ ์ง์ํ๋ ๋ฑ ๋ค์ํ ์๋๋ฆฌ์ค์ ์ ์ฉ ๊ฐ๋ฅํฉ๋๋ค. LlamaIndex๋ ํ์ ์ง๋ฌธ ์ง์ ์์ง (opens in a new tab)์ ์ ๊ณตํ์ฌ ์ด๋ฌํ ํ์ ์ง๋ฌธ์ ์ฌ์ฉํด ๋ค์ํ ๋ฐ์ดํฐ ์์ค๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.
- ๊ฐ์ ๋ฌธ์ ์๋ฒ ๋ฉ: HyDE (opens in a new tab)๋ ์ง๋ฌธ์ ๋ํ ๊ฐ์์ ๋ต๋ณ์ ์์ฑํ๊ณ ์ด ๋ต๋ณ์ ์๋ฒ ๋ฉํ๋ ์์ ์ ์ํํฉ๋๋ค. ์ง๋ฌธ์ ์ง์ ์ฌ์ฉํ๋ ๊ฒ ๋์ ์ ์์ฑ๋ ๊ฐ์ ๋ต๋ณ๊ณผ ์ ์ฌํ ๋ฌธ์๋ฅผ ๊ฒ์ํฉ๋๋ค.
RAG ํ๋ ์์ํฌ
์ด ๋จ๋ฝ์์๋ RAG ์์คํ ์ ๊ตฌ์ฑ ์์์ธ ๊ฒ์(Retrieval), ์์ฑ(Generation), ์ฆ๊ฐ(Augmentation)์ ํต์ฌ ๋ด์ฉ์ ์ค๋ช ํฉ๋๋ค.
๊ฒ์
๊ฒ์์ RAG ์์คํ ์์ ๊ฒ์๊ธฐ๋ก๋ถํฐ ๊ด๋ จ์ฑ ๋์ ๊ด๋ จ์ฑ์ ๊ฐ์ง ๋ฌธ๋งฅ์ ๊ฒ์ํ๋ ๋ถ๋ถ์ ๋๋ค. ๊ฒ์๊ธฐ์ ์ฑ๋ฅ์ ๋์ด๋ ค๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ฌ๋ฌ ๋ฐฉ๋ฒ์ ์ฌ์ฉํด๋ณผ ์ ์์ต๋๋ค:
์๋ฏธ ํํ ๊ฐ์ ํ๊ธฐ
๊ฒ์๊ธฐ์ ํต์ฌ์ธ, ์๋ฏธ ํํ์ ์ง์ ์ ์ผ๋ก ๊ฐ์ ํ๋ ๊ณผ์ ์ ์ดํด๋ณด๊ฒ ์ต๋๋ค. ์ฌ๊ธฐ์ ๊ณ ๋ คํด์ผ ํ ์ฌํญ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ์ฒญํน(Chunking): ๋ค๋ฃจ๊ณ ์๋ ์ฝํ ์ธ ์ ์๋ต์ ์์ฑํ๋ ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ณ ๋ คํ์ฌ ์ต์ ์ ์ฒญํน ๋ฐฉ๋ฒ์ ์ ํํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ๋ชจ๋ธ๋ง๋ค ๋ธ๋ก ํฌ๊ธฐ์ ๋ฐ๋ฅธ ์ฑ๋ฅ ์ฐจ์ด๊ฐ ์กด์ฌํฉ๋๋ค. Sentence transformers๋ ๋จ์ผ ๋ฌธ์ฅ์์, text-embedding-ada-002๋ 256 ๋๋ 512 ํ ํฐ ๋ธ๋ก์์ ๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค. ๋ํ, ์ฌ์ฉ์ ์ง๋ฌธ์ ๊ธธ์ด, ์ ํ๋ฆฌ์ผ์ด์ , ํ ํฐ ์ ํ ๋ฑ ์ฌ๋ฌ ์์๋ฅผ ๊ณ ๋ คํ ์ ์์ต๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ๋ค์ํ ์ฒญํน ๋ฐฉ๋ฒ์ ์คํํด๋ณด๋ฉด์ RAG ์์คํ ์ ๊ฒ์ ์ฑ๋ฅ์ ์ต์ ํํฉ๋๋ค.
- ์๋ฒ ๋ฉ ๋ชจ๋ธ ํ์ธ ํ๋: ์ฒญํน ๋ฐฉ๋ฒ์ ๊ฒฐ์ ํ๋ค๋ฉด, ํ์ธ ํ๋์ ๊ณ ๋ คํ ์ ์์ต๋๋ค. ํนํ, ์ ๋ฌธ์ ์ธ ๋ถ์ผ๋ฅผ ๋ค๋ฃฐ ๋ ํ์ธ ํ๋์ ํ์ง ์์ผ๋ฉด ์ ํ๋ฆฌ์ผ์ด์ ์์ ์ฌ์ฉ์์ ์ง๋ฌธ์ ์ ๋๋ก ์ดํดํ์ง ๋ชปํ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค. ๊ด๋ฒ์ํ ๋๋ฉ์ธ ์ง์์ด๋ ํน์ ์์ ์ ์ ์ฒ๋ฆฌํ๊ธฐ ์ํด ํ์ธ ํ๋์ ๊ณ ๋ คํ ์ ์์ต๋๋ค. BAAI์์ ๊ฐ๋ฐํ BGE-large-EN (opens in a new tab)์ ๊ฒ์ ๊ด๋ จ์ฑ์ ๋์ด๊ธฐ ์ํด ํ์ธ ํ๋ํ๊ธฐ์ ์ ํฉํ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๋๋ค.
์ง๋ฌธ๊ณผ ๋ฌธ์ ์ ๋ ฌํ๊ธฐ
์ฌ์ฉ์์ ์ง๋ฌธ์ ์๋ฏธ ์ ๋ณด๊ฐ ๋ถ์กฑํ๊ฑฐ๋ ์ ๋งคํ ํํ์ด ์์ ๊ฒฝ์ฐ, ์ ๋ ฌ(Alignment) ๊ธฐ์ ์ ์ ์ฉํด๋ณผ ์ ์์ต๋๋ค. ์ ๋ ฌ์ ์๋ฏธ ๊ณต๊ฐ ์์์ ์ฌ์ฉ์์ ์ง๋ฌธ์ ๋ฌธ์์ ์ผ์น์ํค๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์ด๋ฅผ ์ํ ์ ๊ทผ ๋ฐฉ์์ผ๋ก๋ ๋ค์๊ณผ ๊ฐ์ ๊ฒ๋ค์ด ์์ต๋๋ค:
- ์ง๋ฌธ ๋ค์ ์์ฑํ๊ธฐ: Query2Doc (opens in a new tab),ย ITER-RETGEN (opens in a new tab), HyDE ๋ฑ ๋ค์ํ ๊ธฐ์ ์ ํ์ฉํด ์ง๋ฌธ์ ๋ค์ ์์ฑํ๋ ๋ฐ ์ด์ ์ ๋ง์ถฅ๋๋ค.
- ์๋ฒ ๋ฉ ๋ณํํ๊ธฐ: ์ง๋ฌธ ์๋ฒ ๋ฉ์ ํํ์ ์ต์ ํํ์ฌ ํน์ ์์ ์ ๋ ์ ๋ถํฉํ๋ ์ ์ฌ ๊ณต๊ฐ์ผ๋ก ๋ง์ถ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
๊ฒ์๊ธฐ์ LLM ์ ๋ ฌํ๊ธฐ
๊ฒ์๊ธฐ์ ์ถ๋ ฅ ๊ฒฐ๊ณผ๋ฅผ LLM์ด ์ ํธํ๋ ๋ฐฉํฅ์ผ๋ก ์ ๋ ฌํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
- ๊ฒ์๊ธฐ ํ์ธ ํ๋: LLM์ ํผ๋๋ฐฑ์ ํ์ฉํ์ฌ ๊ฒ์ ๋ชจ๋ธ์ ๊ฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. AAR (opens in a new tab), REPLUG (opens in a new tab), UPRISE (opens in a new tab) ๋ฑ์ผ๋ก ๊ฒ์๊ธฐ์ LLM์ ์ ๋ ฌํ ์ ์์ต๋๋ค.
- ์ด๋ํฐ: PRCA (opens in a new tab), RECOMP (opens in a new tab), PKG (opens in a new tab) ๋ฑ์ ์ธ๋ถ ์ด๋ํฐ๋ฅผ ๋์ ํ์ฌ ๊ฒ์๊ธฐ์ LLM์ ์ ๋ ฌํด ๋ณผ ์ ์์ต๋๋ค.
์์ฑ
RAG ์์คํ ์์ ์์ฑ๊ธฐ(Generator)๋ ๊ฒ์๋ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ฐ์ค๋ฌ์ด ํ ์คํธ๋ฅผ ์์ฑํ์ฌ ์ต์ข ์ถ๋ ฅ์ ๋ง๋ค์ด๋ด๋ ์ญํ ์ ํฉ๋๋ค. ์ด ๊ณผ์ ์๋ ๋ค์ํ ์ ๋ ฅ ๋ฐ์ดํฐ๊ฐ ํฌํจ๋๋ฉฐ, ๋๋ก๋ ์ง๋ฌธ๊ณผ ๋ฌธ์์์ ํ์๋ ์ ๋ ฅ ๋ฐ์ดํฐ์ ์ธ์ด ๋ชจ๋ธ์ ์ ์์ํค๊ธฐ ์ํ ์ถ๊ฐ์ ์ธ ๋ ธ๋ ฅ์ด ํ์ํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ฌธ์ ๋ ๊ฒ์ ์ดํ์ ํ์ฒ๋ฆฌ(Post-processing) ๋ฐ ํ์ธ ํ๋์ ํตํด ํด๊ฒฐํ ์ ์์ต๋๋ค.
- ๊ฒ์ ํ์ฒ๋ฆฌ์์ ๊ณ ์ ๋ LLM ํ์ฉ: ์ด ๋ฐฉ๋ฒ์ LLM์ ๋ณ๊ฒฝํ์ง ์๊ณ , ์ ๋ณด ์์ถ์ด๋ ๊ฒฐ๊ณผ ์ฌ์์ํ์ ๊ฐ์ ์์ ์ ํตํด ๊ฒ์ ๊ฒฐ๊ณผ์ ํ์ง์ ํฅ์์ํค๋ ๋ฐ ์ค์ ์ ๋ก๋๋ค. ์ ๋ณด ์์ถ์ ๋ ธ์ด์ฆ๋ฅผ ์ค์ด๊ณ LLM์ ์ปจํ ์คํธ ๊ธธ์ด ์ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ฉฐ ์์ฑ ์ฑ๋ฅ์ ๊ฐ์ ํฉ๋๋ค. ์ฌ์์ํ๋ ๊ด๋ จ์ฑ์ด ๋์ ๋ฌธ์๋ฅผ ์์์ ๋ฐฐ์นํ๋๋ก ๊ฒ์ ๊ฒฐ๊ณผ์ ์์๋ฅผ ์กฐ์ ํฉ๋๋ค.
- RAG๋ฅผ ์ํ LLM ํ์ธ ํ๋: RAG ์์คํ ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด, ์์ฑ๊ธฐ๋ฅผ ์ถ๊ฐ๋ก ์ต์ ํํ๊ฑฐ๋ ํ์ธ ํ๋ํ์ฌ ๊ฒ์๋ ๋ฌธ์๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๋ ๋์์ ์์ฐ์ค๋ฌ์ด ํ ์คํธ๋ฅผ ์์ฑํ๋๋ก ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
์ฆ๊ฐ
์ฆ๊ฐ(Augmentation)์ ๊ฒ์๋ ํจ์์ง(Passage)์ ๋ฌธ๋งฅ์ ํ์ฌ ์์ฑ ์์ ๊ณผ ํจ๊ณผ์ ์ผ๋ก ํตํฉํ๋ ๊ณผ์ ์ ์๋ฏธํฉ๋๋ค. ์ฆ๊ฐ ๊ณผ์ , ์ฆ๊ฐ ๋จ๊ณ, ๊ทธ๋ฆฌ๊ณ ์ฆ๊ฐ ๋ฐ์ดํฐ์ ๋ํด ๋ ผ์ํ๊ธฐ์ ์์, RAG์ ํต์ฌ ๊ตฌ์ฑ ์์๋ฅผ ์ดํด๋ณด๊ฒ ์ต๋๋ค:
๊ฒ์ ์ฆ๊ฐ์ ์ฌ์ ํ์ต, ํ์ธ ํ๋, ์ถ๋ก ๊ณผ ๊ฐ์ ๋ค์ํ ๋จ๊ณ์ ์ ์ฉ๋ ์ ์์ต๋๋ค.
-
์ฆ๊ฐ ๋จ๊ณ ๊ฐ์ : RETRO (opens in a new tab)๋ ๋๊ท๋ชจ ์ฌ์ ํ์ต์ ์ํ ๊ฒ์ ์ฆ๊ฐ ์์คํ ์ ๋๋ค. ์ด ์์คํ ์ ์ธ๋ถ ์ง์์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ์ถ๊ฐ ์ธ์ฝ๋๋ฅผ ์ฌ์ฉํฉ๋๋ค. RETRO๋ RAG ์์คํ ๊ณผ ๊ฒฐํฉ๋์ด ๊ฐ๋ฐ ๋ฐ ์ฑ๋ฅ ํฅ์์ ๊ธฐ์ฌํ ์ ์์ผ๋ฉฐ, ์ถ๋ก ๋จ๊ณ์์๋ RAG ํ๋ก์ธ์ค๋ฅผ ๋ณด๋ค ์ ๊ตํ๊ฒ ๋ง๋ค๊ณ ํน์ ์์ ์๊ตฌ ์ฌํญ์ ๋ง๊ฒ ๊ฒ์๋ ์ฝํ ์ธ ๋ฅผ ํจ์จ์ ์ผ๋ก ํตํฉํ๊ธฐ ์ํด ๋ค์ํ ๊ธฐ์ ์ ์ ์ฉํฉ๋๋ค.
-
์ฆ๊ฐ ์์ค์ ์ค์์ฑ: RAG ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ฆ๊ฐ ๋ฐ์ดํฐ ์์ค์ ์ ํ์ ๋ฐ๋ผ ํฌ๊ฒ ๋ฌ๋ผ์ง ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ๋ ๋น์ ํ ๋ฐ์ดํฐ, ์ ํ ๋ฐ์ดํฐ, LLM ์์ฑ ๋ฐ์ดํฐ๋ก ๋ถ๋ฅํ ์ ์์ต๋๋ค.
-
์ฆ๊ฐ ํ๋ก์ธ์ค์ ๋ค์์ฑ: ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ์ ์ํด ๋ค์ํ ์ฆ๊ฐ ๋ฐฉ๋ฒ์ด ์ ์๋์์ต๋๋ค:
- ๋ฐ๋ณต ๊ฒ์: ์ด ๋ฐฉ์์ ๋ชจ๋ธ์ด ์ ๋ณด์ ๊น์ด์ ๊ด๋ จ์ฑ์ ํฅ์์ํค๊ธฐ ์ํด ์ฌ๋ฌ ๊ฒ์ ์ฃผ๊ธฐ๋ฅผ ์ํํฉ๋๋ค. RETRO (opens in a new tab)์ GAR-meets-RAG (opens in a new tab)๋ ๋ฐ๋ณต ๊ฒ์์ ํ์ฉํ๋ ์ฃผ๋ชฉํ ๋งํ ์์์ ๋๋ค.
- ์ฌ๊ท ๊ฒ์: ์ด ๋ฐฉ์์ ํ ๊ฒ์ ๋จ๊ณ์ ๊ฒฐ๊ณผ๋ฅผ ๋ค์ ๊ฒ์ ๋จ๊ณ์ ์ ๋ ฅ์ผ๋ก ์ฌ๊ท์ ์ผ๋ก ์ฌ์ฉํฉ๋๋ค. ์ด๋ฅผ ํตํด ํ์ ์ฐ๊ตฌ ๋ฐ ๋ฒ๋ฅ ์ฌ๋ก ๋ถ์๊ณผ ๊ฐ์ ๋ณต์กํ ๋ค๋จ๊ณ ์ฟผ๋ฆฌ์ ๋ํ ์ ๋ณด๋ฅผ ๊น์ด ์๊ฒ ํ์ํ ์ ์์ต๋๋ค. IRCoT (opens in a new tab)์ Tree of Clarifications (opens in a new tab)๊ฐ ์ฌ๊ท ๊ฒ์์ ์ฌ์ฉํ๋ ์ฃผ์ ์์์ ๋๋ค.
- ์ ์ ๊ฒ์: ์ด ๋ฐฉ์์ ์ต์ ์ ๊ฒ์ ์์ ๊ณผ ์ฝํ ์ธ ๋ฅผ ๊ฒฐ์ ํจ์ผ๋ก์จ ํน์ ์๊ตฌ์ ๋ง๊ฒ ๊ฒ์ ํ๋ก์ธ์ค๋ฅผ ์กฐ์ ํฉ๋๋ค. FLARE (opens in a new tab)์ Self-RAG (opens in a new tab)๋ ์ ์ํ ๊ฒ์์ ํ์ฉํ๋ ์ฃผ์ ์ ๊ทผ ๋ฐฉ์์ ๋๋ค.
์๋ ๊ทธ๋ฆผ์ ์ฆ๊ฐ ๋จ๊ณ, ์์ค, ํ๋ก์ธ์ค ๋ฑ RAG ์ฐ๊ตฌ๋ฅผ ๋ค์ํ ์ฆ๊ฐ ์ธก๋ฉด์ผ๋ก ์์ธํ๊ฒ ๋ฌ์ฌํ๊ณ ์์ต๋๋ค.
RAG vs. ํ์ธ ํ๋
RAG์ ํ์ธ ํ๋ ๊ฐ์ ์ฐจ์ด์ ๊ณผ ๊ฐ๊ฐ์ ์ ํฉํ ์ํฉ์ ๋ํ ํ ๋ก ์ด ํ๋ฐํ ์ด๋ฃจ์ด์ง๊ณ ์์ต๋๋ค. ์ด ๋ ๋ถ์ผ์ ์ฐ๊ตฌ์ ๋ฐ๋ฅด๋ฉด, RAG๋ ์๋ก์ด ์ง์์ ํตํฉํ๋ ๋ฐ์ ํจ๊ณผ์ ์ธ ๋ฐ๋ฉด, ํ์ธ ํ๋์ ๋ด๋ถ ์ง์, ์ถ๋ ฅ ํ์ ๋ฐ ๋ณต์กํ ์๊ตฌ์ฌํญ์ ์ดํดํ๋ ๋ฅ๋ ฅ์ ๊ฐ์ ํจ์ผ๋ก์จ ๋ชจ๋ธ์ ์ฑ๋ฅ๊ณผ ํจ์จ์ฑ์ ๋์ผ ์ ์๋ค๊ณ ํฉ๋๋ค. ์ด ๋ ๋ฐฉ๋ฒ์ ์ํธ ๋ฐฐํ์ ์ด์ง ์์ผ๋ฉฐ, ๋ณต์กํ๊ณ ์ง์ ์ง์ฝ์ ์ด๋ฉฐ ํ์ฅ ๊ฐ๋ฅํ ์์ฉ ํ๋ก๊ทธ๋จ์ LLM์ ์ฌ์ฉํจ์ ์์ด, ๋น ๋ฅด๊ฒ ๋ณํํ๋ ์ง์์ ๋ํ ์ ๊ทผ๊ณผ ํน์ ํ์, ์ด์กฐ, ์คํ์ผ์ ๊ฐ์ถ ๋ง์ถคํ ์๋ต์ด ํ์ํ ๋ ์๋ก๋ฅผ ๋ณด์ํ๋ฉฐ ๋ฐ๋ณต์ ์ธ ๊ฐ์ ๊ณผ์ ์ ๊ฑฐ์น ์ ์์ต๋๋ค. ์ด์ ๋๋ถ์ด, ํ๋กฌํํ ์์ง๋์ด๋ง์ ๋ชจ๋ธ์ ๊ธฐ๋ณธ ๊ธฐ๋ฅ์ ํ์ฉํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ์ต์ ํํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํ ์ ์์ต๋๋ค. ์๋๋ RAG๊ฐ ๋ค๋ฅธ ๋ชจ๋ธ ์ต์ ํ ๋ฐฉ๋ฒ๋ค๊ณผ ๋น๊ตํ์ ๋ ๊ฐ๋ ๋ค์ํ ํน์ฑ์ ๋ณด์ฌ์ฃผ๋ ๊ทธ๋ฆผ์ ๋๋ค:
์๋๋ RAG์ ํ์ธ ํ๋๋ ๋ชจ๋ธ๋ค ๊ฐ์ ํน์ง์ ๋น๊ตํ ๋ ผ๋ฌธ์์ ๊ฐ์ ธ์จ ํ์ ๋๋ค:
RAG ํ๊ฐ
LLM์ ๋ค์ํ ์ธก๋ฉด์ ๋ํด์ ์ฑ๋ฅ์ ์ธก์ ํ๋ ๊ฒ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก, RAG๋ฅผ ํ๊ฐํ๋ ๊ฒ์ ๋ค์ํ ์ ํ๋ฆฌ์ผ์ด์ ์๋๋ฆฌ์ค์์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ดํดํ๊ณ ์ต์ ํํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํฉ๋๋ค. ์ ํต์ ์ผ๋ก RAG ์์คํ ์ F1์ด๋ EM ๊ฐ์ ํน์ ์์ ์ ์ด์ ์ ๋ง์ถ ํ๊ฐ ์งํ๋ฅผ ํตํด ํ๊ฐ๋์์ต๋๋ค. ์๋ฅผ ๋ค์ด, RaLLe (opens in a new tab)๋ ์ง์ ์ง์ฝ์ ์์ ์์ ๊ฒ์ ๊ธฐ๋ฅ์ ๊ฐํํ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
RAG ํ๊ฐ๋ ๊ฒ์๋ ๋ด์ฉ๊ณผ ์์ฑ๋ ์ฝํ ์ธ ์ ํ์ง์ ๋ชจ๋ ํ๊ฐํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ๊ฒ์ ํ์ง์ NDCG์ ์ ์ค๋ฅ ๊ฐ์, ์ถ์ฒ ์์คํ ์ด๋ ์ ๋ณด ๊ฒ์ ๋ถ์ผ์์ ์ฌ์ฉ๋๋ ํ๊ฐ ์งํ๋ก ์ธก์ ๋ฉ๋๋ค. ์์ฑ ํ์ง ํ๊ฐ๋ 2๊ฐ์ง์ ๊ฒฝ์ฐ๋ก ๋๋์ด์ง๋๋ค. ๋ ์ด๋ธ์ด ์ง์ ๋์ง ์์ ์ฝํ ์ธ ์ ๊ฒฝ์ฐ ๊ด๋ จ์ฑ๊ณผ ์ ํด์ฑ์, ๋ ์ด๋ธ์ด ์๋ ์ฝํ ์ธ ์ ๊ฒฝ์ฐ ์ ํ์ฑ์ ํ๊ฐํฉ๋๋ค. RAG ํ๊ฐ ๋ฐฉ๋ฒ์ ์๋์ ์ด๊ฑฐ๋ ์๋ํ๋ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
RAG ํ๋ ์์ํฌ์ ํ๊ฐ๋ ์ธ ๊ฐ์ง ์ฃผ์ ํ์ง ์งํ์ ๋ค ๊ฐ์ง ๋ฅ๋ ฅ์ ์ค์ฌ์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค. ํ์ง ์งํ์๋ ๊ฒ์๋ ๋ด์ฉ์ ๊ด๋ จ์ฑ, ๋ต๋ณ์ ์ถฉ์ค์ฑ, ๊ทธ๋ฆฌ๊ณ ์ ์๋ ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ ๊ด๋ จ์ฑ์ด ํฌํจ๋ฉ๋๋ค. ๋ํ, RAG ์์คํ ์ ์ ์์ฑ๊ณผ ํจ์จ์ฑ์ ์ธก์ ํ๋ ๋ฐ ๋์์ด ๋๋ ๋ค ๊ฐ์ง ๋ฅ๋ ฅ๋ ํ๊ฐ์ ์์ด ์ค์ํ ์์์ ๋๋ค. ์ฌ๊ธฐ์๋ ์ก์์ ๋ํ ๊ฒฌ๊ณ ์ฑ, ๋ถ์ ์ ํ ๋ด์ฉ์ ๊ฑฐ๋ถํ๋ ๋ฅ๋ ฅ, ๋ค์ํ ์ ๋ณด๋ฅผ ํตํฉํ๋ ๋ฅ๋ ฅ, ๊ทธ๋ฆฌ๊ณ ๋ฐ์ฌ์ค์ ์ํฉ์ ๋ํ ๊ฒฌ๊ณ ์ฑ์ด ํฌํจ๋ฉ๋๋ค. ์๋๋ RAG ์์คํ ์ ๋ค์ํ ์ธก๋ฉด์ ํ๊ฐํ๋ ๋ฐ ์ฌ์ฉ๋๋ ์ฃผ์ ํ๊ฐ ์งํ๋ฅผ ์์ฝํ ๋ด์ฉ์ ๋๋ค:
RAG ๋ชจ๋ธ ํ๊ฐ์๋ RGB (opens in a new tab), RECALL (opens in a new tab)๊ณผ ๊ฐ์ ์ฌ๋ฌ ๋ฒค์น๋งํฌ๊ฐ ์ฌ์ฉ๋ฉ๋๋ค. ์ด์ ํจ๊ป, ย RAGAS (opens in a new tab)์ย ARES (opens in a new tab),ย TruLens (opens in a new tab) ๊ฐ์ ๋ค์ํ ๋๊ตฌ๋ค์ด RAG ์์คํ ํ๊ฐ ๊ณผ์ ์ ์๋ํํ๊ธฐ ์ํด ๊ฐ๋ฐ๋์์ต๋๋ค. ์ด๋ฌํ ์์คํ ์ค ์ผ๋ถ๋ ์์ ์ ์๋ ํ์ง ์งํ๋ฅผ ์ํด LLM์ ์ฌ์ฉํฉ๋๋ค.
RAG์ ๋์ ๊ณผ์ ์ ๋ฏธ๋
RAG ์์คํ ์ ๊ฒ์, ์ฆ๊ฐ, ์์ฑ ๋ฅ๋ ฅ์ ํฅ์์ํค๊ธฐ ์ํ ์ฌ๋ฌ ์ ๊ทผ ๋ฐฉ๋ฒ์ด ์กด์ฌํฉ๋๋ค. Gao et al., 2023 (opens in a new tab) ์์ ๊ฐ์กฐํ ๊ฒ์ฒ๋ผ, RAG ์์คํ ์ ๊ฐ๋ฐํ๊ณ ๊ฐ์ ํ๋ ๊ณผ์ ์๋ ๋ค์๊ณผ ๊ฐ์ ๋์ ๊ณผ์ ๊ฐ ์์ต๋๋ค:
- ์ปจํ ์คํธ ๊ธธ์ด: LLM์ ์ปจํ ์คํธ ์๋์ฐ ํฌ๊ธฐ๊ฐ ํ์ฅ๋จ์ ๋ฐ๋ผ, RAG๊ฐ ๋์ ๊ด๋ จ์ฑ๊ณผ ์ค์ํ ์ปจํ ์คํธ๋ฅผ ํฌ์ฐฉํ๊ธฐ ์ํด ์ด๋ป๊ฒ ์ ์ํด์ผ ํ ์ง์ ๋ํ ๊ณผ์ ๊ฐ ์์ต๋๋ค.
- ๊ฒฌ๊ณ ์ฑ: ๋ฐ์ฌ์ค์ ์ด๊ณ ์ ๋์ ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฅ๋ ฅ์ RAG์์ ์ธก์ ํ๊ณ ๊ฐ์ ํด์ผ ํ ์ค์ํ ๋ถ๋ถ์ ๋๋ค.
- ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ๋ฒ: RAG์ ํ์ธ ํ๋๋ ๋ชจ๋ธ์ ์ด๋ป๊ฒ ์ต์ ํํ๋์ง์ ๋ํด ๋ ์ ์ดํดํ๊ธฐ ์ํ ์ง์์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
- LLM ์ญํ ํ์ฅ: LLM์ ์ญํ ๊ณผ ๋ฅ๋ ฅ์ ์ฆ๊ฐ์์ผ RAG ์์คํ ์ ๊ฐํํ๋ ๊ฒ์ด ์ฃผ๋ชฉ๋ฐ๊ณ ์์ต๋๋ค.
- ์ค์ผ์ผ๋ง ๋ฒ์น: LLM์ ์ค์ผ์ผ๋ง ๋ฒ์น์ด RAG ์์คํ ์ ์ด๋ป๊ฒ ์ ์ฉ๋๋์ง์ ๋ํ ์ฐ๊ตฌ๋ ์ฌ์ ํ ์ด๊ธฐ ๋จ๊ณ์ ์์ต๋๋ค.
- ์์ฉํ ์ค๋น๊ฐ ๋ RAG: ์ค์ ๋ก ์ฌ์ฉ๋ ์ ์๋ RAG ์์คํ ์ ์ฑ๋ฅ, ํจ์จ์ฑ, ๋ฐ์ดํฐ ๋ณด์, ๊ฐ์ธ ์ ๋ณด ๋ณดํธ ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ๋ฐ์ด๋ ์์ง๋์ด๋ง ๊ธฐ์ ์ ์๊ตฌํฉ๋๋ค.
- ๋ค์ค ๋ชจ๋ฌ RAG: RAG ์์คํ ์ ๋ํ ๋ง์ ์ฐ๊ตฌ ๋ ธ๋ ฅ์ด ์์์ง๋ง, ๋๋ถ๋ถ ํ ์คํธ ๊ธฐ๋ฐ ์์ ์ ์ค์ฌ์ผ๋ก ์ด๋ฃจ์ด์ก์ต๋๋ค. ์ด๋ฏธ์ง, ์ค๋์ค, ๋น๋์ค, ์ฝ๋ ๋ฑ๊ณผ ๊ฐ์ ๋ค์ํ ๋๋ฉ์ธ์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด RAG ์์คํ ์ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ํ์ฅํ๋ ๋ฐ์ ๋ํ ๊ด์ฌ์ด ์ฆ๊ฐํ๊ณ ์์ต๋๋ค.
- ํ๊ฐ: RAG๋ฅผ ์ฌ์ฉํ ๋ณต์กํ ์์ฉ ํ๋ก๊ทธ๋จ ๊ฐ๋ฐ์ด ํ๋๋จ์ ๋ฐ๋ผ, ์ปจํ ์คํธ ๊ด๋ จ์ฑ, ์ฐฝ์์ฑ, ์ฝํ ์ธ ๋ค์์ฑ, ์ฌ์ค์ฑ ๋ฑ์ ๋ ์ ํํ๊ฒ ํ๊ฐํ ์ ์๋ ์ฌ์ธํ ๋ฉํธ๋ฆญ๊ณผ ํ๊ฐ ๋๊ตฌ ๊ฐ๋ฐ์ ์ฃผ๋ชฉ์ด ์ง์ค๋๊ณ ์์ต๋๋ค. ๋ํ RAG์ ๋ํ ํด์ ๊ฐ๋ฅ์ฑ ์ฐ๊ตฌ์ ๋๊ตฌ ๊ฐ๋ฐ์ ํ์์ฑ๋ ์ฆ๊ฐํ๊ณ ์์ต๋๋ค.
RAG ๋๊ตฌ
RAG ์์คํ ์ ๊ตฌ์ถํ๊ธฐ ์ํ ์ธ๊ธฐ ์๋ ๋๊ตฌ๋ค๋ก๋ LangChain (opens in a new tab), LlamaIndex (opens in a new tab), DSPy (opens in a new tab)๊ฐ ์์ต๋๋ค. ์ด์ ํจ๊ป ๋ค์ํ ๋ชฉ์ ์ ์ํ ๋๊ตฌ๋ ์กด์ฌํฉ๋๋ค. ์๋ฅผ ๋ค์ด Flowise AI (opens in a new tab) ์ฝ๋๋ฅผ ๊ฑฐ์ ์์ฑํ์ง ์๋, ์ฌ์ฉ์ด ๊ฐํธํ ์๋ฃจ์ ์ ์ ๊ณตํ์ฌ RAG ์ ํ๋ฆฌ์ผ์ด์ ๊ตฌ์ถ์ ์ฉ์ดํ๊ฒ ํฉ๋๋ค. ๋ค๋ฅธ ์ฃผ๋ชฉํ ๋งํ ๊ธฐ์ ๋ก๋ HayStack (opens in a new tab), Meltano (opens in a new tab), Cohere Coral (opens in a new tab) ๋ฑ์ด ์์ต๋๋ค. ๋ํ, ์ํํธ์จ์ด ๋ฐ ํด๋ผ์ฐ๋ ์๋น์ค ์ ๊ณต์ ์ฒด๋ค๋ RAG ์ค์ฌ ์๋น์ค๋ฅผ ์ ๊ณตํ๊ณ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, Weaviate์ Verba๋ ๊ฐ์ธ ๋น์ ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ตฌ์ถํ๋ ๋ฐ ์ ์ฉํ๋ฉฐ, Amazon์ Kendra๋ ์ง๋ฅ์ ์ธ ๋น์ฆ๋์ค ๊ฒ์ ์๋น์ค๋ฅผ ์ ๊ณตํฉ๋๋ค.
๊ฒฐ๋ก
๊ฒฐ๋ก ์ ์ผ๋ก, RAG ์์คํ ์ ๋์ฑ ๊ณ ๊ธํ๋ ํจ๋ฌ๋ค์์ ๊ฐ๋ฐ์ ํฌํจํ์ฌ ๊ธ์ํ๊ฒ ๋ฐ์ ํ๊ณ ์์ผ๋ฉฐ, ์ด๋ ๋ค์ํ ๋ถ์ผ์์ RAG์ ์ฑ๋ฅ๊ณผ ์ ์ฉ์ฑ์ ๋์ด๊ณ ์ฌ์ฉ์ ๋ง์ถคํ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. RAG ์ ํ๋ฆฌ์ผ์ด์ ์ ๋ํ ์์ฒญ๋ ์์๊ฐ ์์ผ๋ฉฐ, ์ด๋ RAG ์์คํ ์ ๋ค์ํ ๊ตฌ์ฑ ์์๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํ ๊ฐ๋ฐ์ ๋น ๋ฅด๊ฒ ํ๊ณ ์์ต๋๋ค. ํ์ด๋ธ๋ฆฌ๋ ๋ฐฉ๋ฒ๋ก ์์ ์์ฒด ๊ฒ์์ ์ด๋ฅด๊ธฐ๊น์ง, ์ด๊ฒ๋ค์ ํ์ฌ RAG ๋ชจ๋ธ์ ์ฐ๊ตฌ ๋ถ์ผ ์ค ์ผ๋ถ์ ๋๋ค. ๋ง์ง๋ง์ผ๋ก, ๋ ๋์ ํ๊ฐ ๋๊ตฌ์ ์งํ์ ๋ํ ์์๋ ์ฆ๊ฐํ๊ณ ์์ต๋๋ค. ์๋ ๊ทธ๋ฆผ์ ์ง๊ธ๊น์ง ๋ค๋ฃฌ RAG ์ํ๊ณ, RAG ๊ฐ์ ์ ์ํ ๊ธฐ์ , ๋์ ๊ณผ์ ๋ฐ ๊ธฐํ ๊ด๋ จ ์ธก๋ฉด์ ์์ฝํ ๊ฒ์ ๋๋ค:
๊ทธ๋ฆผ ์ถ์ฒ: Retrieval-Augmented Generation for Large Language Models: A Survey (opens in a new tab)
RAG ์ฐ๊ตฌ ์ธ์ฌ์ดํธ
์๋ ํ์์ RAG์ ์ฃผ์ ์ธ์ฌ์ดํธ์ ์ต์ ๊ฐ๋ฐ ์ฌํญ์ ์๊ฐํ๋ ์ฐ๊ตฌ ๋ ผ๋ฌธ ๋ชจ์์ ํ์ธํ ์ ์์ต๋๋ค.
์ธ์ฌ์ดํธ | ๋ ผ๋ฌธ | ๋ ์ง |
---|---|---|
RAG ์์คํ ์์ ์์ฑ์ ๊ฒฌ๊ณ ์ฑ์ ํฅ์์ํค๊ธฐ ์ํด Corrective Retrieval Augmented Generation(CRAG)์ ์ ์ํฉ๋๋ค. ํต์ฌ ์์ด๋์ด๋ ๊ฒ์๊ธฐ๋ฅผ ์ํ ์๊ธฐ ์์ ๊ตฌ์ฑ ์์๋ฅผ ๊ตฌํํ๊ณ ์์ฑ์ ์ฆ๊ฐํ๊ธฐ ์ํด ๊ฒ์๋ ๋ฌธ์์ ํ์ฉ๋๋ฅผ ๊ฐ์ ํ๋ ๊ฒ์ ๋๋ค. ๊ฒ์ ํ๊ฐ๊ธฐ๋ ์ฟผ๋ฆฌ๋ฅผ ๊ณ ๋ คํ ๋ ๊ฒ์๋ ๋ฌธ์์ ์ ๋ฐ์ ์ธ ํ์ง์ ํ๊ฐํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค. ์น ๊ฒ์ ๋ฐ ์ต์ ํ๋ ์ง์ ํ์ฉ ์์ ์ ์ฌ์ฉํ๋ฉด ์๋ ์๊ฐ ์์ ๋ฐ ๊ฒ์๋ ๋ฌธ์์ ํจ์จ์ ํ์ฉ์ ๊ฐ์ ํ ์ ์์ต๋๋ค. | https://arxiv.org/abs/2401.15884 (opens in a new tab) | 2024๋ 1์ |
ํ ์คํธ ์ฒญํฌ๋ฅผ ์ฌ๊ท์ ์ผ๋ก ์๋ฒ ๋ฉ, ํด๋ฌ์คํฐ๋ง ๋ฐ ์์ฝํ์ฌ ์๋์์ ์๋ก ๋ค์ํ ์์ค์ ์์ฝ์ด ์๋ ํธ๋ฆฌ๋ฅผ ๊ตฌ์ฑํฉ๋๋ค. ์ถ๋ก ์ ์ ์๋ RAPTOR ๋ชจ๋ธ์ ํธ๋ฆฌ์์ ๊ฒ์ํ์ฌ ๊ธธ์ด๊ฐ ๊ธด ๋ฌธ์์์ ์๋ก ๋ค๋ฅธ ์ถ์ํ ์์ค์ ์ ๋ณด๋ฅผ ํตํฉํฉ๋๋ค. | https://arxiv.org/abs/2401.18059 (opens in a new tab) | 2024๋ 1์ |
๋ค์ค ๋ ์ด๋ธ ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ํจ์จ์ ์ผ๋ก ํด๊ฒฐํ๊ธฐ ์ํ LM๊ณผ ๊ฒ์๊ธฐ ๊ฐ์ ๋ค๋จ๊ณ ์ํธ ์์ฉ์ด ์๋ ์ผ๋ฐ ํ๋ก๊ทธ๋จ์ ๋๋ค. | https://arxiv.org/abs/2401.12178 (opens in a new tab) | 2024๋ 1์ |
๋ค์ํ ์์ ์ ๊ฑธ์ณ ๋ค๊ตญ์ด ์ฌ์ ํ์ต ์ธ์ด ๋ชจ๋ธ์ ์ ๋ก์ท ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด ๋ฆฌ์์ค๊ฐ ํ๋ถํ ์ธ์ด์์ ์๋ฏธ๋ก ์ ์ผ๋ก ์ ์ฌํ ํ๋กฌํํธ๋ฅผ ์ถ์ถํฉ๋๋ค. | https://arxiv.org/abs/2311.06595 (opens in a new tab) | 2023๋ 11์ |
๋ ธ์ด์ฆ๊ฐ ๋ง๊ณ ๊ด๋ จ์ฑ์ด ๋ฎ์ ๋ฌธ์์ ์ง๋ฉดํ๊ณ ์ ์ ์๋ ์๋๋ฆฌ์ค๋ฅผ ์ฒ๋ฆฌํ ๋ RAG์ ๊ฒฌ๊ณ ์ฑ์ ๊ฐ์ ํฉ๋๋ค. ๊ฒ์๋ ๋ฌธ์์ ๋ํ ์์ฐจ์ ๋ ์ ๋ฉ๋ชจ๋ฅผ ์์ฑํ์ฌ ์ฃผ์ด์ง ์ง๋ฌธ๊ณผ์ ๊ด๋ จ์ฑ์ ์ฒ ์ ํ ํ๊ฐํ๊ณ ์ ๋ณด๋ฅผ ํตํฉํ์ฌ ์ต์ข ๋ต๋ณ์ ์ค๋นํ ์ ์์ต๋๋ค. | https://arxiv.org/abs/2311.09210 (opens in a new tab) | 2023๋ 11์ |
๋ ์์ ๋ต๋ณ ์์ฑ ํ๋ก์ธ์ค๋ฅผ ์ต์ ํํ๊ธฐ ์ํด ํ์ ์ ๋ณด์ ๊ธฐ์ฌํ์ง ์์ ์ ์๋ ํ ํฐ์ ์ ๊ฑฐํฉ๋๋ค. ์คํ ์๊ฐ์ ์ต๋ 62.2% ์ค์ด๊ณ ์ฑ๋ฅ์ 2%๋ง ๊ฐ์ํฉ๋๋ค. | https://arxiv.org/abs/2310.13682 (opens in a new tab) | 2023๋ 10์ |
์ง์ ์ฆ๊ฐ LM์ ์ถ๋ ฅ๊ณผ ์ง์์ ๋ณ๋์ ๊ฒ์ฆ๊ธฐ๋ก ํ์ธํ๊ธฐ ์ํด ์์ LM ๊ฒ์ฆ๊ธฐ๋ฅผ ์ง์นจ ํ๋ํฉ๋๋ค. ๋ชจ๋ธ์ด ์ฃผ์ด์ง ์ฟผ๋ฆฌ์ ๊ด๋ จ๋ ์ง์์ ๊ฒ์ํ์ง ๋ชปํ๊ฑฐ๋ ๋ชจ๋ธ์ด ์์ฑ๋ ํ ์คํธ์์ ๊ฒ์๋ ์ง์์ ์ถฉ์คํ๊ฒ ๋ฐ์ํ์ง ๋ชปํ ์ ์๋ ์๋๋ฆฌ์ค๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค. | https://arxiv.org/abs/2310.12836 (opens in a new tab) | 2023๋ 10์ |
RAG์ ํ์ํ ๋ ธ์ด์ฆ ๊ฒฌ๊ณ ์ฑ, ๋ถ์ ๊ฑฐ๋ถ, ์ ๋ณด ํตํฉ ๋ฐ ๋ฐ์ฌ์ค์ ๊ฒฌ๊ณ ์ฑ์ ํฌํจํ 4๊ฐ์ง ๊ธฐ๋ณธ ๋ฅ๋ ฅ์์ ๋ค์ํ LLM์ ์ฑ๋ฅ์ ๋ถ์ํ๋ ๋ฒค์น๋งํฌ์ ๋๋ค. | https://arxiv.org/abs/2309.01431 (opens in a new tab) | 2023๋ 10์ |
๊ฒ์ ๋ฐ ์๊ธฐ ์ฑ์ฐฐ์ ํตํด LM์ ํ์ง๊ณผ ์ฌ์ค์ฑ์ ํฅ์์ํค๋ Self-Reflective Retrieval-Augmented Generation(Self-RAG) ํ๋ ์์ํฌ๋ฅผ ์๊ฐํฉ๋๋ค. LM์ ํ์ฉํ์ฌ ๋จ๋ฝ์ ์ ์์ ์ผ๋ก ๊ฒ์ํ๊ณ ๋ฐ์ฌ ํ ํฐ์ ์ฌ์ฉํ์ฌ ๊ฒ์๋ ๋จ๋ฝ๊ณผ ์์ฒด ์์ฑ์ ๋ํด ์์ฑํ๊ณ ๋ฐ์ํฉ๋๋ค. | https://arxiv.org/abs/2310.11511 (opens in a new tab) | 2023๋ 10์ |
์์ฑ ์ฆ๊ฐ ๊ฒ์(GAR)์ ํตํด ๊ฒ์์ ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ ํ๊ณ RAG๋ฅผ ํตํด ๋ค์ ์ฐ๊ธฐ๋ฅผ ๊ฐ์ ํ์ฌ ์ ๋ก์ท ์ ๋ณด ๊ฒ์์ ๊ฐ์ ํฉ๋๋ค. ๋ค์ ์ฐ๊ธฐ-๊ฒ์ ๋จ๊ณ๋ ์ฌํ์จ์ ๊ฐ์ ํ๊ณ ์ฌ์์ํ ๋จ๊ณ๋ ์ ๋ฐ๋๋ฅผ ๊ฐ์ ํฉ๋๋ค. | https://arxiv.org/abs/2310.20158 (opens in a new tab) | 2023๋ 10์ |
๊ธฐ๋ณธ 43B GPT ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ 48B ๊ฒ์ ๋ชจ๋ธ์ ์ฌ์ ํ์ตํ๊ณ 1.2์กฐ ํ ํฐ์์ ๊ฒ์ํฉ๋๋ค. ์ด ๋ชจ๋ธ์ ๊ด๋ฒ์ํ ์ ๋ก์ท ์์ ์์ ์ง์นจ ์กฐ์ ๋ GPT๋ณด๋ค ์๋นํ ๊ฐ์ ์ ๋ณด์ฌ์ฃผ๊ธฐ ์ํด ์ถ๊ฐ๋ก ์ง์นจ ์กฐ์ ๋ฉ๋๋ค. | https://arxiv.org/abs/2310.07713 (opens in a new tab) | 2023๋ 10์ |
๋ ๊ฐ์ง ๊ณ ์ ํ ๋ฏธ์ธ ์กฐ์ ๋จ๊ณ๋ฅผ ํตํด ๊ฒ์ ๊ธฐ๋ฅ์ ๊ฐ์ถ LLM์ ๊ฐ์กฐํฉ๋๋ค. ํ๋๋ ์ฌ์ ํ์ต๋ LM์ ์ ๋ฐ์ดํธํ์ฌ ๊ฒ์๋ ์ ๋ณด๋ฅผ ๋ ์ ์ฌ์ฉํ๊ณ ๋ค๋ฅธ ํ๋๋ LM์ด ์ ํธํ๋ ๋๋ก ๋ ๊ด๋ จ์ฑ ์๋ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํ๋๋ก ๊ฒ์๊ธฐ๋ฅผ ์ ๋ฐ์ดํธํฉ๋๋ค. ์ง์ ํ์ฉ๊ณผ ๋งฅ๋ฝ ์ธ์์ด ๋ชจ๋ ํ์ํ ์์ ์ ๋ํด ๋ฏธ์ธ ์กฐ์ ํจ์ผ๋ก์จ ๊ฐ ๋จ๊ณ๋ ์ฑ๋ฅ ํฅ์์ ๊ฐ์ ธ์ต๋๋ค. | https://arxiv.org/abs/2310.01352 (opens in a new tab) | 2023๋ 10์ |
RAG๋ฅผ ๋ฌด๊ดํ ๋ด์ฉ์ ๊ฒฌ๊ณ ํ๊ฒ ๋ง๋๋ ๋ฐฉ๋ฒ์ ๋๋ค. ํ์ต ์๊ฐ์ ๊ด๋ จ ๋ฐ ๋ฌด๊ดํ ๋ฌธ๋งฅ์ ํผํฉํ์ฌ ์ฌ์ฉํ์ฌ ์ธ์ด ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ์ฌ ๊ฒ์๋ ๋จ๋ฝ์ ์ ์ ํ ํ์ฉํ๋๋ก ์๋์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์ฑํฉ๋๋ค. | https://arxiv.org/abs/2310.01558 (opens in a new tab) | 2023๋ 10์ |
4K ์ปจํ ์คํธ ์ฐฝ์ด ์๋ LLM์ ๊ธด ์ปจํ ์คํธ ์์ ์์ ์์น ๋ณด๊ฐ์ ํตํด 16K ์ปจํ ์คํธ ์ฐฝ์ผ๋ก ๋ฏธ์ธ ์กฐ์ ๋ LLM๊ณผ ๋น๊ตํ ๋งํ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ธฐ ์ํด ์์ฑ ์ ๋จ์ํ ๊ฒ์ ์ฆ๊ฐ์ ์ฌ์ฉํ๋ค๋ ๊ฒ์ ๋ฐ๊ฒฌํ์ต๋๋ค. | https://arxiv.org/abs/2310.03025 (opens in a new tab) | 2023๋ 10์ |
๋ฌธ๋งฅ ๋ด ํตํฉ ์ ์ ๊ฒ์๋ ๋ฌธ์๋ฅผ ํ ์คํธ ์์ฝ์ผ๋ก ์์ถํ์ฌ ๊ณ์ฐ ๋น์ฉ์ ์ค์ด๊ณ LM์ด ๊ธด ๊ฒ์ ๋ฌธ์์์ ๊ด๋ จ ์ ๋ณด๋ฅผ ์๋ณํด์ผ ํ๋ ๋ถ๋ด์ ๋์ด์ค๋๋ค. | https://arxiv.org/abs/2310.04408 (opens in a new tab) | 2023๋ 10์ |
๋งค๊ฐ๋ณ์ ๋ฐ ๋น๋งค๊ฐ๋ณ์ ์ง์์ ๋ชจ๋ ํ์ฉํ๊ณ ๊ฒ์-์์ฑ ์ํธ ์์ฉ์ ํตํด ์ฌ๋ฐ๋ฅธ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ์ฐพ๋ ๋ฐ ๋์์ด ๋๋ ๋ฐ๋ณต์ ๊ฒ์-์์ฑ ํ์ ํ๋ ์์ํฌ์ ๋๋ค. ๋ค๋จ๊ณ ์ถ๋ก ์ด ํ์ํ ์์ ์ ์ ์ฉํ๋ฉฐ ์ ๋ฐ์ ์ผ๋ก LLM์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํต๋๋ค. | https://arxiv.org/abs/2310.05149 (opens in a new tab) | 2023๋ 10์ |
๋ชจํธํ ์ง๋ฌธ์ ๋ํ ๋ชจํธ์ฑ ํด์ ํธ๋ฆฌ๋ฅผ ์ฌ๊ท์ ์ผ๋ก ๊ตฌ์ฑํ๋ Tree of Clarifications(ToC) ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ํธ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ๊ธด ์์์ ๋ต๋ณ์ ์์ฑํฉ๋๋ค. | https://arxiv.org/abs/2310.14696 (opens in a new tab) | 2023๋ 10์ |
LLM์ด ์ด์ ์ ์ ํ๋ ์ง๋ฌธ์ ์ฐธ์กฐํ๊ณ ์๋ก์ด ์ง๋ฌธ์ ๋ง๋ฌ์ ๋ ์ ์์ ์ผ๋ก ์ธ๋ถ ๋ฆฌ์์ค๋ฅผ ์์ฒญํ ์ ์๊ฒ ํ๋ ์ ๊ทผ ๋ฐฉ์์ ๋๋ค. | https://arxiv.org/abs/2310.05002 (opens in a new tab) | 2023๋ 10์ |
์ฌ๋์ ์ฃผ์์ ์์กดํ์ง ์๊ณ ๋ ๋ค์ํ ์ฐจ์(์ฆ, ๊ด๋ จ ๋ฐ ์ง์ค๋ ๋ฌธ๋งฅ ๋จ๋ฝ์ ์๋ณํ๋ ๊ฒ์ ์์คํ ์ ๋ฅ๋ ฅ, ๊ทธ๋ฌํ ๋จ๋ฝ์ ์ถฉ์คํ๊ฒ ํ์ฉํ๋ LLM์ ๋ฅ๋ ฅ ๋๋ ์์ฑ ์์ฒด์ ํ์ง)์ ํ๊ฐํ๋ ๋ฐ ์ฌ์ฉํ ์ ์๋ ์ผ๋ จ์ ๋ฉํธ๋ฆญ์ ๋๋ค. | https://arxiv.org/abs/2309.15217 (opens in a new tab) | 2023๋ 9์ |
๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋จผ์ ํ๋กฌํํธํ์ฌ ์ฃผ์ด์ง ์ง๋ฌธ์ ๊ธฐ๋ฐ์ผ๋ก ๋ฌธ๋งฅ ๋ฌธ์๋ฅผ ์์ฑํ ๋ค์ ์์ฑ๋ ๋ฌธ์๋ฅผ ์ฝ์ด ์ต์ข ๋ต๋ณ์ ์์ฑํ๋ generate-then-read(GenRead) ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. | https://arxiv.org/abs/2209.10063 (opens in a new tab) | 2023๋ 9์ |
DiversityRanker ๋ฐ LostInTheMiddleRanker์ ๊ฐ์ ๋ญ์ปค๊ฐ RAG ์์คํ ์์ LLM ์ปจํ ์คํธ ์ฐฝ ํ์ฉ์ ์ต์ ํํ๋ ์ ๋ณด๋ฅผ ์ ํํ๊ณ ํ์ฉํ๋ ๋ฐ ์ด๋ป๊ฒ ์ฌ์ฉ๋ ์ ์๋์ง ๋ณด์ฌ์ค๋๋ค. | https://towardsdatascience.com/enhancing-rag-pipelines-in-haystack-45f14e2bc9f5 (opens in a new tab) | 2023๋ 8์ |
LLM์ ๋ค์ํ ์ง์ ๋ฒ ์ด์ค(KB)์ ์ฐ๊ฒฐํ์ฌ ์ง์์ ๊ฒ์๊ณผ ์ ์ฅ์ ๋ชจ๋ ์ฉ์ดํ๊ฒ ํฉ๋๋ค. ๊ฒ์ ํ๋ก์ธ์ค๋ KB ์์ ์ ์ํ ๋ฏธ๋ฆฌ ์ ์๋ ํจ์๋ก ์ฝ๋ ํ์์ผ๋ก KB์ ๋ํ ๊ฒ์ ์ธ์ด๋ฅผ ์์ฑํ๋ ์ฌ๊ณ ํ๋กฌํํ ํ๋ก๊ทธ๋จ์ ์ฌ์ฉํฉ๋๋ค. ๋ํ ๊ฐ๋ณ ์ฌ์ฉ์ ์๊ตฌ ์ฌํญ์ ๋ง๊ฒ ๊ฐ์ธํ๋ KB์ ์ง์์ ์ ์ฅํ ์ ์๋ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค. | https://arxiv.org/abs/2308.11761 (opens in a new tab) | 2023๋ 8์ |
๊ฒ์ ์ฆ๊ฐ ๋ง์คํฌ ์ธ์ด ๋ชจ๋ธ๋ง๊ณผ ์ ๋์ฌ ์ธ์ด ๋ชจ๋ธ๋ง์ ๊ฒฐํฉํ ๋ชจ๋ธ์ ์ ์ํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ์ถ๊ฐ ๊ต์ก ์์ด๋ ๋ชจ๋ธ์ด ๋ ๋ง์ ๋ฌธ๋งฅ ๋ด ์์ ๋ฅผ ํ์ฉํ ์ ์๋๋ก ํ์ฌ ๋ช ์ท ์ฑ๋ฅ์ ํฅ์์ํค๋ Fusion-in-Context Learning์ ๋์ ํฉ๋๋ค. | https://arxiv.org/abs/2308.07922 (opens in a new tab) | 2023๋ 8์ |
RaLLe์ ์ง์ ์ง์ฝ์ ์์ ์ ์ํ RAG ์์คํ ์ ๊ฐ๋ฐ, ํ๊ฐ ๋ฐ ์ต์ ํํ๊ธฐ ์ํ ์คํ ์์ค ํ๋ ์์ํฌ์ ๋๋ค. | https://arxiv.org/abs/2308.10633 (opens in a new tab) | 2023๋ 8์ |
LLM์ ์ฑ๋ฅ์ ๊ด๋ จ ์ ๋ณด์ ์์น๋ฅผ ๋ณ๊ฒฝํ ๋ ํฌ๊ฒ ์ ํ๋ ์ ์์ผ๋ฉฐ, ์ด๋ LLM์ด ๊ธด ์ ๋ ฅ ์ปจํ ์คํธ์ ์ ๋ณด๋ฅผ ๊ฐ๊ฑดํ๊ฒ ํ์ฉํ์ง ์๋๋ค๋ ๊ฒ์ ๋ํ๋ ๋๋ค. | https://arxiv.org/abs/2307.03172 (opens in a new tab) | 2023๋ 7์ |
์์ ์งํฅ์ ๋ฐฉ์์ผ๋ก ๊ฒ์๊ณผ ์์ฑ์ ์๋์ง ํจ๊ณผ์ ์ผ๋ก ๊ฒฐํฉํฉ๋๋ค. ๋ชจ๋ธ ์ถ๋ ฅ์ ์์ ์ ์๋ฃํ๋ ๋ฐ ํ์ํ ์ฌํญ์ ๋ณด์ฌ์ฃผ๋ ๋ฐ ์ฌ์ฉ๋๋ฉฐ, ๋ค์ ๋ฐ๋ณต์์ ๋ ๋์ ์ถ๋ ฅ์ ์์ฑํ๋ ๋ฐ ๋์์ด ๋๋ ๋ณด๋ค ๊ด๋ จ์ฑ ์๋ ์ง์์ ๊ฒ์ํ๊ธฐ ์ํ ์ ์ฉํ ๋งฅ๋ฝ์ ์ ๊ณตํฉ๋๋ค. | https://arxiv.org/abs/2305.15294 (opens in a new tab) | 2023๋ 5์ |
์์ฑ ๊ณผ์ ์์ ์ธ์ ๋ฌด์์ ๊ฒ์ํ ์ง ๋ฅ๋์ ์ผ๋ก ๊ฒฐ์ ํ๋ ๋ฐฉ๋ฒ์ธ ๋ฅ๋ RAG์ ์ผ๋ฐํ๋ ๊ด์ ์ ์ ๊ณตํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ์์ธก๋ ๋ค์ ๋ฌธ์ฅ์ ๋ฐ๋ณต์ ์ผ๋ก ์ฌ์ฉํ์ฌ ๋ฏธ๋ ๋ด์ฉ์ ์์ธกํ๋ Forward-Looking Active REtrieval augmented generation(FLARE) ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ์ด๋ ๊ด๋ จ ๋ฌธ์๋ฅผ ๊ฒ์ํ๋ ๋ฐ ์ฌ์ฉ๋๋ ์ฟผ๋ฆฌ๋ก ํ์ฉ๋์ด ์ ๋ขฐ๋๊ฐ ๋ฎ์ ํ ํฐ์ด ํฌํจ๋ ๊ฒฝ์ฐ ๋ฌธ์ฅ์ ์ฌ์์ฑํฉ๋๋ค. | https://arxiv.org/abs/2305.06983 (opens in a new tab) | 2023๋ 5์ |
์ฌ์ ์ ์ ์ ์๊ฑฐ๋ ๊ณต๋์ผ๋ก ๋ฏธ์ธ ์กฐ์ ํ ์ ์๋ ๋์ LM์ ํฅ์์ํค๊ธฐ ์ํด ์ผ๋ฐ ๊ฒ์๊ธฐ๋ฅผ ํ์ฉํ๋ ์ผ๋ฐ ๊ฒ์ ํ๋ฌ๊ทธ์ธ์ ์๊ฐํฉ๋๋ค. | https://arxiv.org/abs/2305.17331 (opens in a new tab) | 2023๋ 5์ |
๋ ๊ฐ์ง ์ฌ์ ํ์ต ์ ๋ต์ ํตํด ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ์ ๋ํ ๋ฐ์ง ๊ฒ์์ ๊ฐ์ ํฉ๋๋ค. ์ฒซ์งธ, ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ์ ๊ตฌ์กฐํ๋์ง ์์ ๋ฐ์ดํฐ ๊ฐ์ ์์ฐ์ค๋ฌ์ด ์ ๋ ฌ์ ํ์ฉํ์ฌ ๊ตฌ์กฐ ์ธ์ ์ฌ์ ํ์ต์ ์ํํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ๋ง์คํฌ๋ ์ํฐํฐ ์์ธก ๋ฐ ๊ตฌ์กฐ์ ์๋ฏธ ์บก์ฒ๋ฅผ ์ํด Masked Entity Prediction์ ๊ตฌํํฉ๋๋ค. | https://arxiv.org/abs/2305.19912 (opens in a new tab) | 2023๋ 5์ |
LLM์ ์ฌ์ค์ ์ ํ์ฑ์ ๋์ด๊ธฐ ์ํด ์ฌ๋ฌ ๋๋ฉ์ธ์ ์ด์ง์ ์ถ์ฒ์์ ๊ทผ๊ฑฐ ์ ๋ณด๋ฅผ ๋์ ์ผ๋ก ํตํฉํฉ๋๋ค. ์๋ก ๋ค๋ฅธ ์ง์ ์ถ์ฒ์ ๋ง์ถฐ์ง ์ฟผ๋ฆฌ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด ์ ์ํ ์ฟผ๋ฆฌ ์์ฑ๊ธฐ๋ฅผ ๋์ ํฉ๋๋ค. ์ด ํ๋ ์์ํฌ๋ ์ ํ ๊ทผ๊ฑฐ์์ ๋ถ์ ํ์ฑ์ด ํ์ ๋จ๊ณ๋ก ์ ํ๋์ง ์๋๋ก ๊ทผ๊ฑฐ๋ฅผ ์ ์ง์ ์ผ๋ก ์์ ํฉ๋๋ค. | https://arxiv.org/abs/2305.13269 (opens in a new tab) | 2023๋ 5์ |
์ง์ ๊ทธ๋ํ(KG)๋ฅผ ์ฌ์ฉํ์ฌ ๋ฌธ๋งฅ ๊ด๋ จ์ฑ์ด ๋๊ณ ์ง์ ๊ธฐ๋ฐ์ ๋ํ๋ฅผ ์์ฑํ๋ ํ๋ ์์ํฌ์ ๋๋ค. ๋จผ์ KG์์ ๊ด๋ จ ํ์ ๊ทธ๋ํ๋ฅผ ๊ฒ์ํ ๋ค์ ๊ฒ์๋ ํ์ ๊ทธ๋ํ์ ์ํด ์กฐ๊ฑดํ๋ ๋จ์ด ์๋ฒ ๋ฉ์ ๊ต๋์์ผ ์ฌ์ค ๊ฐ์ ์ผ๊ด์ฑ์ ์ํํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ์์ฑ๋ ํ ์คํธ๊ฐ ๊ฒ์๋ ํ์ ๊ทธ๋ํ์ ๋์ ์ ์ฌ์ฑ์ ๊ฐ๋๋ก ๋์กฐ ํ์ต์ ํ์ฉํฉ๋๋ค. | https://arxiv.org/abs/2305.18846 (opens in a new tab) | 2023๋ 5์ |
๋ธ๋๋ฐ์ค LLM ๋ฆฌ๋์ ๋ง๊ฒ ์กฐ์ ํ๊ธฐ ์ํด ์์ ์ธ์ด ๋ชจ๋ธ์ ํ์ต ๊ฐ๋ฅํ ์ฌ์์ฑ๊ธฐ๋ก ์ฑํํฉ๋๋ค. ์ฌ์์ฑ๊ธฐ๋ RL์ ์ํด LLM ๋ฆฌ๋์ ํผ๋๋ฐฑ์ ์ฌ์ฉํ์ฌ ํ์ต๋ฉ๋๋ค. ์ฟผ๋ฆฌ ์ต์ ํ์ ์ค์ ์ ๋ ์๋ก์ด ํ๋ ์์ํฌ์ธ Rewrite-Retrieve-Read๋ฅผ ๋ง๋ญ๋๋ค. | https://arxiv.org/abs/2305.14283 (opens in a new tab) | 2023๋ 5์ |
๋ฐ๋ณต์ ์ผ๋ก ๊ฒ์ ์ฆ๊ฐ ์์ฑ๊ธฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฌด์ ํ ๋ฉ๋ชจ๋ฆฌ ํ์ ๋ง๋ค๊ณ ๋ฉ๋ชจ๋ฆฌ ์ ํ๊ธฐ๋ฅผ ์ฌ์ฉํ์ฌ ํ์ ์์ฑ ๋ผ์ด๋์ ๋ฉ๋ชจ๋ฆฌ๋ก ํ๋์ ์ถ๋ ฅ์ ์ ํํฉ๋๋ค. ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ์์ฒด ๋ฉ๋ชจ๋ฆฌ๋ผ๊ณ ํ๋ ์์ฒด ์ถ๋ ฅ์ ํ์ฉํ์ฌ ์์ฑ์ ๊ฐ์ ํ ์ ์์ต๋๋ค. | https://arxiv.org/abs/2305.02437 (opens in a new tab) | 2023๋ 5์ |
๋งค๊ฐ๋ณ์๋ฅผ ๋ณ๊ฒฝํ์ง ์๊ณ ๊ด๋ จ ์ง์์ ์ก์ธ์คํ ์ ์๋๋ก LLM์ ์ง์ ์๋ด ๋ชจ๋์ ์ฅ์ฐฉํฉ๋๋ค. ์ฌ์ค์ (+7.9%), ํ ์ด๋ธ(+11.9%), ์๋ฃ(+3.0%) ๋ฐ ๋ค์ค ๋ชจ๋ฌ(+8.1%) ์ง์์ด ํ์ํ ๋ค์ํ ๋๋ฉ์ธ ์ง์ ์ง์ฝ์ ์์ ์์ "๋ธ๋๋ฐ์ค" LLM์ ์ฑ๋ฅ์ ๊ฐ์ ํฉ๋๋ค. | https://arxiv.org/abs/2305.04757 (opens in a new tab) | 2023๋ 5์ |
LLM์ ์ผ๋ฐ ์ฐ๊ธฐ-์ฝ๊ธฐ ๋ฉ๋ชจ๋ฆฌ ์ ๋์ ์ฅ์ฐฉํ์ฌ ์์ ์ํ์ ํ์์ ๋ฐ๋ผ ํ ์คํธ์์ ์ง์์ ์ถ์ถ, ์ ์ฅ ๋ฐ ํ์ํ ์ ์๋๋ก ํฉ๋๋ค. | https://arxiv.org/abs/2305.14322 (opens in a new tab) | 2023๋ 5์ |
๊ณต์ ์ ์ ์ธ๋ฑ์ค๋ฅผ ๊ตฌ์ถํ๊ณ ํ๋ณด ์ฆ๊ฑฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ ํํ๊ธฐ ์ํด ์์ ๋ถ๊ฐ์ง๋ก ์ ๊ฒ์๊ธฐ๋ฅผ ์ฑํํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ๋ฆฌ๋๋ฅผ ์ํ ์์ ๋ณ ๊ด๋ จ์ฑ์ ๋ฐ๋ผ ๊ฐ์ฅ ๊ฐ๊น์ด ์ฆ๊ฑฐ์ ์์๋ฅผ ์ฌ์กฐ์ ํ๊ธฐ ์ํ ํ๋กฌํํธ ์๋ด ์ฌ์กฐ์ ๊ธฐ๋ฅผ ์ค๊ณํฉ๋๋ค. | https://arxiv.org/abs/2305.17653 (opens in a new tab) | 2023๋ 5์ |
์ฃผ์ด์ง ์ ๋ก์ท ์์ ์ ๋ ฅ์ ๋ํ ํ๋กฌํํธ๋ฅผ ์๋์ผ๋ก ๊ฒ์ํ๋ ๊ฐ๋ฒผ์ฐ๋ฉด์๋ ๋ค์ฌ๋ค๋ฅํ ๊ฒ์๊ธฐ๋ฅผ ํ๋ํ๋ UPRISE(Universal Prompt Retrieval for Improving zero-Shot Evaluation)๋ฅผ ์ ์ํฉ๋๋ค. | https://arxiv.org/abs/2303.08518 (opens in a new tab) | 2023๋ 3์ |
SLM(ํํฐ ์ญํ )๊ณผ LLM(์ฌ์์ ์ง์ ์ญํ )์ ๊ฐ์ ์ ๊ฒฐํฉํ๋ ์ ์ํ ํํฐ ํ ์ฌ์์ ์ง์ ํจ๋ฌ๋ค์์ ๋๋ค. | https://arxiv.org/abs/2303.08559 (opens in a new tab) | 2023๋ 3์ |
์ง์๋ฅผ ๋ฐ๋ฅด๋ LLM์ ์ ๋ก์ท ๋ฐฉ์์ผ๋ก ์ง์ํ์ฌ ๊ด๋ จ์ฑ ํจํด์ ์บก์ฒํ๋ ๊ฐ์ค์ ๋ฌธ์๋ฅผ ์์ฑํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ Contriever๋ ๋ฌธ์๋ฅผ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ก ์ธ์ฝ๋ฉํ์ฌ ์ฝํผ์ค ์๋ฒ ๋ฉ ๊ณต๊ฐ์์ ์ด์์ ์๋ณํ๋ ๋ฐ ์ฌ์ฉ๋๋ฉฐ, ์ฌ๊ธฐ์ ๋ฒกํฐ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ์ ์ฌํ ์ค์ ๋ฌธ์๊ฐ ๊ฒ์๋ฉ๋๋ค. | https://arxiv.org/abs/2212.10496 (opens in a new tab) | 2022๋ 12์ |
ํ์ดํ๋ผ์ธ ์ธ์ ๋ฐ๋ชจ๋ฅผ ๋ถํธ์คํธ๋ฉํ๊ณ ๊ด๋ จ ๊ตฌ์ ์ ๊ฒ์ํ๋ฉฐ ๊ทผ๊ฑฐ ์๋ ์์ธก์ ์์ฑํ๋ ๊ณ ๊ธ ํ๋ก๊ทธ๋จ์ ์์ฑํ๋ Demonstrate-Search-Predict(DSP) ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ, ๋ณด๋ค ์์ ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ ์์ ๋ณํ์ผ๋ก ๋ฌธ์ ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๋ถํดํฉ๋๋ค. | https://arxiv.org/abs/2212.14024 (opens in a new tab) | 2022๋ 12์ |
๊ฒ์์ CoT๋ก ์๋ดํ๊ณ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ์ฌ์ฉํ์ฌ CoT๋ฅผ ๊ฐ์ ํ์ฌ ๊ฒ์๊ณผ CoT ๋จ๊ณ๋ฅผ ๊ต์ฐจํ๋ ๋ค๋จ๊ณ QA ์ ๊ทผ ๋ฐฉ์์ ๋๋ค. ์ด๋ ์ง์ ์ง์ฝ์ ์ธ ๋ค๋จ๊ณ ์ง๋ฌธ์ ๋ํ ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค. | https://arxiv.org/abs/2212.10509 (opens in a new tab) | 2022๋ 12์ |
๊ฒ์ ์ฆ๊ฐ์ด ๊ด๋ จ ์ฌ์ ํ์ต ์ ๋ณด์ ๋ํ ์์กด๋๋ฅผ ์ค์ผ ์ ์์์ ๋ณด์ฌ์ฃผ๋ฉฐ, ์ด๋ RAG๋ฅผ ๋กฑํ ์ผ ์บก์ฒ๋ฅผ ์ํ ์ ๋งํ ์ ๊ทผ ๋ฐฉ์์ผ๋ก ๋ง๋ญ๋๋ค. | https://arxiv.org/abs/2211.08411 (opens in a new tab) | 2022๋ 11์ |
์ํ๋ง์ ํตํด LLM ์์ฒด ๋ฉ๋ชจ๋ฆฌ์์ ํ๋ ๋๋ ์ฌ๋ฌ ๊ฐ์ ๊ด๋ จ ๊ตฌ์ ์ ์์กํ ๋ค์ ์ต์ข ๋ต๋ณ์ ์์ฑํฉ๋๋ค. | https://arxiv.org/abs/2210.01296 (opens in a new tab) | 2022๋ 10์ |
LLM์ ๋ช ๊ฐ์ ์ท ์ฟผ๋ฆฌ ์์ฑ๊ธฐ๋ก ํ์ฉํ๊ณ ์์ฑ๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ ๋ณ ๊ฒ์๊ธฐ๋ฅผ ๋ง๋ญ๋๋ค. | https://arxiv.org/abs/2209.11755 (opens in a new tab) | 2022๋ 9์ |
Atlas๋ฅผ ์ ์ํ๋๋ฐ, ์ด๋ ๋งค์ฐ ์ ์ ์์ ํ์ต ์์ ๋ก ์ง์ ์ง์ฝ์ ์์ ์ ํ์ตํ ์ ์๋ ์ฌ์ ํ์ต๋ ๊ฒ์ ์ฆ๊ฐ ์ธ์ด ๋ชจ๋ธ์ ๋๋ค. | https://arxiv.org/abs/2208.03299 (opens in a new tab) | 2022๋ 8์ |
ํ์ต ๋ฐ์ดํฐ์์ ๊ฒ์ํ์ฌ ๋ค์ํ NLG ๋ฐ NLU ์์ ์์ ์ฑ๊ณผ๋ฅผ ์ฌ๋ฆฝ๋๋ค. | https://arxiv.org/abs/2203.08773 (opens in a new tab) | 2022๋ 3์ |
์ฐ์์ ์ธ ๋ฐ์ดํฐ ์ ์ฅ์ ํญ๋ชฉ ๊ฐ์ ํฌ์ธํฐ๋ฅผ ์ ์ฅํ๊ณ ํด๋น ํญ๋ชฉ์ ์ํ๋ก ํด๋ฌ์คํฐ๋งํ์ฌ ๋ฐ์ดํฐ ์ ์ฅ์ ๊ฒ์์ ๊ทผ์ฌํฉ๋๋ค. ์ถ๋ก ์ kNN-LM์ ๋นํด ํผํ๋ ์ํฐ๋ฅผ ํด์น์ง ์์ผ๋ฉด์ ์ต๊ทผ์ ์ด์ ๊ฒ์๊ธฐ์ ์ต๋ 83%๋ฅผ ์ ์ฝํ ์ ์๋ ๊ฐ์ค ์ ํ ์คํ ๋งํค์ด ๋ง๋ค์ด์ง๋๋ค. | https://arxiv.org/abs/2201.12431 (opens in a new tab) | 2022๋ 1์ |
๋๊ท๋ชจ ์ฝํผ์ค์์ ๊ฒ์๋ ๋ฌธ์ ์ฒญํฌ์ ์กฐ๊ฑดํํ์ฌ ์๊ธฐ ํ๊ท ์ธ์ด ๋ชจ๋ธ์ ๊ฐ์ ํ๋ฉฐ, ์ด๋ ์ ํ ํ ํฐ๊ณผ์ ๋ก์ปฌ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค. 2์กฐ ํ ํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ๊ฒ์ํ์ฌ ๋ชจ๋ธ์ ํฅ์์ํต๋๋ค. | https://arxiv.org/abs/2112.04426 (opens in a new tab) | 2021๋ 12์ |
ํ๋ ๋ค๊ฑฐํฐ๋ธ์ ๊ฐ๊ฑดํ ํ์ต ์ ์ฐจ๋ฅผ ์ด์ฉํ์ฌ ๋ฐ์ง ํจ์์ง ๊ฒ์์ ํ์ฅํจ์ผ๋ก์จ ์ ๋ก์ท ์ฌ๋กฏ ํ๋ง์ ๋ํ ์๋ก์ด ์ ๊ทผ ๋ฐฉ์์ ์ ์ํฉ๋๋ค. | https://arxiv.org/abs/2108.13934 (opens in a new tab) | 2021๋ 8์ |
๋งค๊ฐ๋ณ์ ๋ฉ๋ชจ๋ฆฌ๊ฐ ์ฌ์ ํ์ต๋ seq2seq ๋ชจ๋ธ์ด๊ณ ๋น๋งค๊ฐ๋ณ์ ๋ฉ๋ชจ๋ฆฌ๊ฐ ์ฌ์ ํ์ต๋ ์ ๊ฒฝ ๊ฒ์๊ธฐ๋ก ์ก์ธ์ค๋๋ Wikipedia์ ๋ฐ์ง ๋ฒกํฐ ์ธ๋ฑ์ค์ธ RAG ๋ชจ๋ธ์ ์๊ฐํฉ๋๋ค. ์์ฑ๋ ์ ์ฒด ์ํ์ค์ ๊ฑธ์ณ ๋์ผํ ๊ฒ์๋ ํจ์์ง์ ์กฐ๊ฑดํํ๋ RAG ๊ณต์๊ณผ ํ ํฐ๋ง๋ค ๋ค๋ฅธ ํจ์์ง๋ฅผ ์ฌ์ฉํ๋ RAG ๊ณต์, ๋ ๊ฐ์ง๋ฅผ ๋น๊ตํฉ๋๋ค. | https://arxiv.org/abs/2005.11401 (opens in a new tab) | 2020๋ 5์ |
์์ ์์ ์ง๋ฌธ๊ณผ ํจ์์ง์์ ๊ฐ๋จํ ์ด์ค ์ธ์ฝ๋ ํ๋ ์์ํฌ์ ์ํด ์๋ฒ ๋ฉ์ด ํ์ต๋๋ ๋ฐ์ง ํํ๋ง์ ์ฌ์ฉํ์ฌ ๊ฒ์์ ๊ตฌํํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค. | https://arxiv.org/abs/2004.04906 (opens in a new tab) | 2020๋ 4์ |
References
- A Survey on Hallucination in Large Language Models: Principles,Taxonomy, Challenges, and Open Questions (opens in a new tab)
- Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (opens in a new tab)
- Retrieval-augmented multimodal language modeling (opens in a new tab)
- In-Context Retrieval-Augmented Language Models (opens in a new tab)
- Precise Zero-Shot Dense Retrieval without Relevance Labels (opens in a new tab)
- Shall we pretrain autoregressive language models with retrieval? a comprehensive study. (opens in a new tab)
- REPLUG: Retrieval-Augmented Black-Box Language Models (opens in a new tab)
- Query2Doc (opens in a new tab)
- ITER-RETGEN (opens in a new tab)
- A Survey of Techniques for Maximizing LLM Performance (opens in a new tab)
- HyDE (opens in a new tab)
- Advanced RAG Techniques: an Illustrated Overview (opens in a new tab)
- Best Practices for LLM Evaluation of RAG Applications (opens in a new tab)
- Building Production-Ready RAG Applications (opens in a new tab)
- Evaluating RAG Part I: How to Evaluate Document Retrieval (opens in a new tab)
- Retrieval Augmented Generation meets Reciprocal Rank Fusion and Generated Queries (opens in a new tab)