๐Ÿš€ Master Prompt Engineering and building AI Agents in our NEW courses! Use PROMPTING20 for 20% off โžœ Enroll now

LLM Agents

LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋Š” ๊ณ„ํš ๋ฐ ๋ฉ”๋ชจ๋ฆฌ์™€ ๊ฐ™์€ ํ•ต์‹ฌ ๋ชจ๋“ˆ๊ณผ ๊ฒฐํ•ฉ๋œ LLM์„ ํ†ตํ•ด ๋ณต์žกํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ LLM์€ ์ž‘์—…์ด๋‚˜ ์‚ฌ์šฉ์ž ์š”์ฒญ์„ ์™„๋ฃŒํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ์ž‘์—… ํ๋ฆ„์„ ์ œ์–ดํ•˜๋Š” ์ฃผ์š” ์ปจํŠธ๋กค๋Ÿฌ ๋˜๋Š” '๋‘๋‡Œ' ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. LLM ์—์ด์ „ํŠธ๋Š” ๊ณ„ํš, ๋ฉ”๋ชจ๋ฆฌ, ๋„๊ตฌ์™€ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ํ•ต์‹ฌ ๋ชจ๋“ˆ์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด LLM ์—์ด์ „ํŠธ์˜ ์œ ์šฉ์„ฑ์„ ๋” ์ž˜ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ ๊ด€์‹ฌ์ด ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค:

2023๋…„ ๋ฏธ๊ตญ์˜ ํ‰๊ท  ์ผ์ผ ์นผ๋กœ๋ฆฌ ์„ญ์ทจ๋Ÿ‰์€ ์–ผ๋งˆ์ธ๊ฐ€์š”?

์œ„ ์งˆ๋ฌธ์€ ์ด๋ฏธ ์ถฉ๋ถ„ํ•œ ์ง€์‹์„ ๊ฐ–์ถ˜ LLM์„ ํ†ตํ•ด ๋ฐ”๋กœ ๋‹ตํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋งŒ์•ฝ LLM์ด ํ•ด๋‹น ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ง€์‹์ด ์—†๋‹ค๋ฉด, LLM์€ ๊ฑด๊ฐ• ๊ด€๋ จ ์ •๋ณด๋‚˜ ๋ณด๊ณ ์„œ์— ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ„๋‹จํ•œ RAG ์‹œ์Šคํ…œ์„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ œ ๋ณด๋‹ค ๋ณต์žกํ•œ ์งˆ๋ฌธ์„ ์‹œ๋„ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค:

์ง€๋‚œ 10๋…„ ๋™์•ˆ ๋ฏธ๊ตญ ์„ฑ์ธ์˜ ํ‰๊ท  ์ผ์ผ ์นผ๋กœ๋ฆฌ ์„ญ์ทจ ์ถ”์„ธ๋Š” ์–ด๋–ป๊ฒŒ ๋ณ€ํ–ˆ์œผ๋ฉฐ, ์ด๊ฒƒ์ด ๋น„๋งŒ๋ฅ ์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์ณค๋‚˜์š”? ๋˜ํ•œ, ์ด ๊ธฐ๊ฐ„ ๋™์•ˆ ๋น„๋งŒ๋ฅ  ์ถ”์„ธ์˜ ๊ทธ๋ž˜ํ”ฝ ํ‘œํ˜„์„ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

์ด ์งˆ๋ฌธ์— ๋Œ€๋‹ตํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋‹จ์ˆœํžˆ LLM๋งŒ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์œผ๋กœ๋Š” ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. LLM์„ ์™ธ๋ถ€ ์ง€์‹ ๋ฒ ์ด์Šค์™€ ๊ฒฐํ•ฉํ•œ RAG ์‹œ์Šคํ…œ์„ ๋งŒ๋“œ๋Š” ๊ฒƒ๋„ ์ด๋Ÿฐ ๋ณต์žกํ•œ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋‹ต๋ณ€์„ ์ œ๊ณตํ•˜๊ธฐ์—” ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฐ ์งˆ๋ฌธ์— ๋Œ€์‘ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” LLM์ด ํ•„์š”ํ•œ ๋„๊ตฌ๋ฅผ ํ™œ์šฉํ•˜๊ณ , ๋ชฉํ‘œ๋กœ ํ•˜๋Š” ์ตœ์ข… ์‘๋‹ต์„ ์œ„ํ•œ ์ž‘์—… ํ๋ฆ„์„ ๊ด€๋ฆฌํ•˜๋ฉฐ, ์ž‘์—…์„ ์„ธ๋ถ„ํ™”ํ•˜๋Š” ๊ณผ์ •์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ํ•œ ๊ฐ€์ง€ ํ•ด๊ฒฐ์ฑ…์œผ๋กœ๋Š” LLM ์—์ด์ „ํŠธ๋ฅผ ๊ตฌ์ถ•ํ•˜์—ฌ ๊ฒ€์ƒ‰ API, ๊ฑด๊ฐ• ๊ด€๋ จ ์ถœํŒ๋ฌผ, ์นผ๋กœ๋ฆฌ ์„ญ์ทจ ๋ฐ ๋น„๋งŒ๊ณผ ๊ด€๋ จ๋œ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜๋Š” ๊ณต๊ณต ๋ฐ ์‚ฌ์  ๊ฑด๊ฐ• ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

LLM์€ ๋น„๋งŒ ์ถ”์„ธ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋˜๋Š” ์ฐจํŠธ๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” ์ฝ”๋“œ ์ธํ„ฐํ”„๋ฆฌํ„ฐ ๋„๊ตฌ์— ์ ‘๊ทผํ•ด์•ผ ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋„๊ตฌ๋Š” LLM ์—์ด์ „ํŠธ๊ฐ€ ๊ณ ๋ คํ•  ์ˆ˜ ์žˆ๋Š” ๊ณ ๊ธ‰ ๊ธฐ๋Šฅ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ์ž‘์—… ๊ณ„ํš์„ ์„ธ์šฐ๊ณ  ์ž‘์—… ํ๋ฆ„์„ ๊ด€๋ฆฌํ•˜๋ฉฐ, ์ง„ํ–‰ ์ƒํ™ฉ์„ ์ถ”์ ํ•˜๋Š” ๋ฐ ์œ ์šฉํ•œ ๋ฉ”๋ชจ๋ฆฌ ๋ชจ๋“ˆ์— ๋Œ€ํ•œ ์ ‘๊ทผ๋„ ์ค‘์š”ํ•œ ๊ณ ๋ ค ์‚ฌํ•ญ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.

LLM ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ

"LLM Agent Framework"

์ผ๋ฐ˜์ ์œผ๋กœ LLM ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํ•ต์‹ฌ ๊ตฌ์„ฑ ์š”์†Œ๋กœ ์ด๋ฃจ์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ์‚ฌ์šฉ์ž ์š”์ฒญ(User Request) - ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ์ด๋‚˜ ์š”์ฒญ
  • ์—์ด์ „ํŠธ(Agent)/๋‘๋‡Œ(Brain) - ๊ด€๋ฆฌ์ž์˜ ์—ญํ• ์„ ํ•˜๋Š” ์—์ด์ „ํŠธ์˜ ํ•ต์‹ฌ
  • ๊ณ„ํš(Planning) - ์—์ด์ „ํŠธ๊ฐ€ ๋ฏธ๋ž˜ ํ–‰๋™์„ ๊ณ„ํšํ•˜๋Š” ๊ฒƒ์„ ๋„์›€
  • ๋ฉ”๋ชจ๋ฆฌ(Memory) - ์—์ด์ „ํŠธ์˜ ๊ณผ๊ฑฐ ํ–‰๋™์„ ๊ด€๋ฆฌ

์—์ด์ „ํŠธ

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ์‹œ์Šคํ…œ์˜ ํ•ต์‹ฌ ๋‘๋‡Œ๋กœ์„œ, ์—์ด์ „ํŠธ ๋ชจ๋“ˆ์ด๋‚˜ ๊ด€๋ฆฌ์ž์˜ ์—ญํ• ์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ตฌ์„ฑ ์š”์†Œ๋Š” ์—์ด์ „ํŠธ์˜ ์ž‘๋™ ๋ฐฉ์‹๊ณผ ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ๋„๊ตฌ(๋„๊ตฌ์˜ ์„ธ๋ถ€ ์ •๋ณด ํฌํ•จ)์— ๋Œ€ํ•œ ์ค‘์š”ํ•œ ์„ธ๋ถ€ ์ •๋ณด๋ฅผ ๋‹ด์€ ํ”„๋กฌํ”„ํŠธ ํ…œํ”Œ๋ฆฟ์„ ํ†ตํ•ด ํ™œ์„ฑํ™”๋ฉ๋‹ˆ๋‹ค.

ํ•„์ˆ˜๋Š” ์•„๋‹ˆ์ง€๋งŒ, ์—์ด์ „ํŠธ๋Š” ํŠน์ • ์—ญํ• ์ด๋‚˜ ํŠน์„ฑ์„ ๊ฐ€์ง„ ํŽ˜๋ฅด์†Œ๋‚˜๋กœ ํ”„๋กœํŒŒ์ผ๋ง๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ํ”„๋กœํŒŒ์ผ๋ง ์ •๋ณด๋Š” ์ฃผ๋กœ ํ”„๋กฌํ”„ํŠธ์— ๊ธฐ์žฌ๋˜๋ฉฐ, ์—ญํ•  ์„ธ๋ถ€ ์ •๋ณด, ์„ฑ๊ฒฉ, ์‚ฌํšŒ์  ๋ฐฐ๊ฒฝ, ์ธ๊ตฌ ํ†ต๊ณ„์  ์ •๋ณด ๋“ฑ ๊ตฌ์ฒด์ ์ธ ์‚ฌํ•ญ์„ ํฌํ•จํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Wang et al. 2023 (opens in a new tab)์— ๋”ฐ๋ฅด๋ฉด, ์—์ด์ „ํŠธ ํ”„๋กœํŒŒ์ผ์„ ์ •์˜ํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” ์ˆ˜์ž‘์—…, LLM ์ƒ์„ฑ, ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค.

๊ณ„ํš

ํ”ผ๋“œ๋ฐฑ์—†๋Š” ๊ณ„ํš

๊ณ„ํš ๋ชจ๋“ˆ์€ ์—์ด์ „ํŠธ๊ฐ€ ์‚ฌ์šฉ์ž์˜ ์š”์ฒญ์— ๋‹ตํ•˜๊ธฐ ์œ„ํ•ด ํ•ด๊ฒฐํ•ด์•ผ ํ•  ๋‹จ๊ณ„๋‚˜ ํ•˜์œ„ ์ž‘์—…๋“ค์„ ์„ธ๋ถ„ํ™”ํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋‹จ๊ณ„๋Š” ์—์ด์ „ํŠธ๊ฐ€ ๋ฌธ์ œ๋ฅผ ๋” ํšจ๊ณผ์ ์œผ๋กœ ์ถ”๋ก ํ•˜๊ณ  ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ํ•ด๊ฒฐ์ฑ…์„ ์ฐพ๋Š” ๋ฐ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๊ณ„ํš ๋ชจ๋“ˆ์€ LLM์„ ์ด์šฉํ•˜์—ฌ ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ์— ๋„์›€์ด ๋˜๋Š” ํ•˜์œ„ ์ž‘์—…์„ ํฌํ•จํ•œ ์ƒ์„ธํ•œ ๊ณ„ํš์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ž‘์—… ๋ถ„ํ•ด์— ์‚ฌ์šฉ๋˜๋Š” ์ธ๊ธฐ ์žˆ๋Š” ๊ธฐ์ˆ ๋กœ๋Š” Chain of Thought (opens in a new tab)์™€ Tree of Thoughts (opens in a new tab)๊ฐ€ ์žˆ์œผ๋ฉฐ, ์ด๋Š” ๋‹จ์ผ ๊ฒฝ๋กœ ์ถ”๋ก ๊ณผ ๋‹ค์ค‘ ๊ฒฝ๋กœ ์ถ”๋ก ์œผ๋กœ ๊ตฌ๋ถ„๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” Wang et al., 2023 (opens in a new tab)์—์„œ ๋‹ค์–‘ํ•œ ์ „๋žต์„ ๋น„๊ตํ•œ ๊ทธ๋ฆผ์ž…๋‹ˆ๋‹ค:

"LLM Agent Planning"

ํ”ผ๋“œ๋ฐฑ์žˆ๋Š” ๊ณ„ํš

์œ„์—์„œ ์–ธ๊ธ‰ํ•œ ๊ณ„ํš ๋ชจ๋“ˆ๋“ค์€ ํ”ผ๋“œ๋ฐฑ์ด ์—†์–ด ๋ณต์žกํ•œ ์ž‘์—…์— ๋Œ€ํ•œ ์žฅ๊ธฐ์ ์ธ ๊ณ„ํš์„ ์„ธ์šฐ๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช์Šต๋‹ˆ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ชจ๋ธ์ด ๊ณผ๊ฑฐ ํ–‰๋™๊ณผ ๊ด€์ฐฐ์„ ๋ฐ”ํƒ•์œผ๋กœ ์‹คํ–‰ ๊ณ„ํš์„ ๋ฐ˜๋ณต์ ์œผ๋กœ ํ‰๊ฐ€ํ•˜๊ณ  ์กฐ์ •ํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์˜ ๋ชฉํ‘œ๋Š” ๊ณผ๊ฑฐ์˜ ์‹ค์ˆ˜๋ฅผ ์ˆ˜์ •ํ•˜๊ณ  ๊ฐœ์„ ํ•˜์—ฌ ์ตœ์ข… ๊ฒฐ๊ณผ์˜ ์งˆ์„ ๋†’์ด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ํŠนํžˆ ๋ณต์žกํ•œ ์‹ค์ œ ํ™˜๊ฒฝ ๋ฐ ์ž‘์—…์—์„œ ์‹œํ–‰์ฐฉ์˜ค๊ฐ€ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•  ๋•Œ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์œ„ํ•œ ๋‘ ๊ฐ€์ง€ ์ธ๊ธฐ ์žˆ๋Š” ๋ฐฉ๋ฒ•์—๋Š” ReAct (opens in a new tab)์™€ Reflexion (opens in a new tab)์ด ์žˆ์Šต๋‹ˆ๋‹ค.

ReAct๋Š” ์ถ”๋ก ๊ณผ ํ–‰๋™์„ ๊ฒฐํ•ฉํ•˜์—ฌ LLM์ด ์—ฌ๋Ÿฌ ๋‹จ๊ณ„(๋ฐ˜๋ณต์ ์œผ๋กœ NํšŒ ์‹คํ–‰)๋ฅผ ๋ฒˆ๊ฐˆ์•„ ๊ฐ€๋ฉด์„œ ๋ณต์žกํ•œ ์ž‘์—…์„ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‹จ๊ณ„๋“ค์€ ์ƒ๊ฐ, ํ–‰๋™, ๊ด€์ฐฐ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ReAct๋Š” ํ™˜๊ฒฝ์œผ๋กœ๋ถ€ํ„ฐ ๊ด€์ฐฐ ํ˜•ํƒœ์˜ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์Šต๋‹ˆ๋‹ค. ๋‹ค๋ฅธ ์œ ํ˜•์œผ๋กœ๋Š” ์ธ๊ฐ„๊ณผ ๋ชจ๋ธ ํ”ผ๋“œ๋ฐฑ์ด ํฌํ•จ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜ ๊ทธ๋ฆผ์€ ReAct์˜ ์˜ˆ์‹œ์™€ ์งˆ๋ฌธ์— ๋‹ตํ•˜๋Š” ๋ฐ ๊ด€๋ จ๋œ ๋‹ค์–‘ํ•œ ๋‹จ๊ณ„๋“ค์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค:

"ReAct Agent"

ReAct์— ๋Œ€ํ•ด์„œ ๋” ์ž์„ธํžˆ ์•Œ๊ณ  ์‹ถ๋‹ค๋ฉด ์•„๋ž˜ ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•˜์„ธ์š”:

๋ฉ”๋ชจ๋ฆฌ

๋ฉ”๋ชจ๋ฆฌ ๋ชจ๋“ˆ์€ ์—์ด์ „ํŠธ์™€ ์‚ฌ์šฉ์ž ๊ฐ„์˜ ๋ชจ๋“  ์ƒํ˜ธ์ž‘์šฉ, ํ™˜๊ฒฝ์—์„œ์˜ ๊ณผ๊ฑฐ ์ƒ๊ฐ, ํ–‰๋™ ๋ฐ ๊ด€์ฐฐ์„ ํฌํ•จํ•˜๋Š” ์—์ด์ „ํŠธ์˜ ๋‚ด๋ถ€ ๋กœ๊ทธ๋ฅผ ์ €์žฅํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ค๋‹ˆ๋‹ค. LLM ์—์ด์ „ํŠธ ๊ด€๋ จ ๋ฌธํ—Œ์—์„œ ์–ธ๊ธ‰๋˜๋Š” ์ฃผ์š” ๋ฉ”๋ชจ๋ฆฌ ์œ ํ˜•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • ๋‹จ๊ธฐ ๊ธฐ์–ต(Short-term memory) - ์—์ด์ „ํŠธ์˜ ํ˜„์žฌ ์ƒํ™ฉ์— ๋Œ€ํ•œ ์ปจํ…์ŠคํŠธ ์ •๋ณด๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋Œ€์ฒด๋กœ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ์˜ ์ œํ•œ์œผ๋กœ ์ธํ•ด ์งง๊ณ  ์œ ํ•œํ•œ ๋ฌธ๋งฅ ๋‚ด ํ•™์Šต์œผ๋กœ ๊ตฌํ˜„๋ฉ๋‹ˆ๋‹ค.
  • ์žฅ๊ธฐ ๊ธฐ์–ต(Long-term memory) - ์—์ด์ „ํŠธ์˜ ๊ณผ๊ฑฐ ํ–‰๋™๊ณผ ์ƒ๊ฐ์„ ์žฅ๊ธฐ๊ฐ„ ๋ณด์กดํ•˜๊ณ  ํšŒ์ƒํ•ด์•ผ ํ•˜๋Š” ๋‚ด์šฉ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์—์ด์ „ํŠธ๊ฐ€ ํ•„์š”์— ๋”ฐ๋ผ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๋น ๋ฅด๊ณ  ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ์ ‘๊ทผํ•˜๋Š” ์™ธ๋ถ€ ๋ฒกํ„ฐ ์ €์žฅ์†Œ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค.

ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ฉ”๋ชจ๋ฆฌ๋Š” ๋‹จ๊ธฐ ๊ธฐ์–ต๊ณผ ์žฅ๊ธฐ ๊ธฐ์–ต์„ ํ†ตํ•ฉํ•˜์—ฌ ์—์ด์ „ํŠธ์˜ ์žฅ๊ธฐ์  ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ ๊ฒฝํ—˜ ์ถ•์  ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•ฉ๋‹ˆ๋‹ค.

์—์ด์ „ํŠธ๋ฅผ ๊ตฌ์ถ•ํ•  ๋•Œ ๊ณ ๋ คํ•  ์ˆ˜ ์žˆ๋Š” ๋‹ค์–‘ํ•œ ๋ฉ”๋ชจ๋ฆฌ ํ˜•์‹๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ์ž์—ฐ ์–ธ์–ด, ์ž„๋ฒ ๋”ฉ, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค, ๊ตฌ์กฐํ™”๋œ ๋ฆฌ์ŠคํŠธ ๋“ฑ์ด ํฌํ•จ๋˜๋ฉฐ, ์ด๋“ค์€ ์ž์—ฐ ์–ธ์–ด๋กœ ํ‘œํ˜„๋œ ํ‚ค์™€ ์ž„๋ฒ ๋”ฉ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„๋œ ๊ฐ’์œผ๋กœ ๊ตฌ์„ฑ๋œ ํ‚ค-๊ฐ’ ๊ตฌ์กฐ๋ฅผ ํ™œ์šฉํ•˜๋Š” Minecraft์˜ Ghost (GITM (opens in a new tab))์™€ ๊ฐ™์ด ๊ฒฐํ•ฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ณ„ํš๊ณผ ๋ฉ”๋ชจ๋ฆฌ ๋ชจ๋“ˆ์€ ์—์ด์ „ํŠธ๊ฐ€ ๋™์  ํ™˜๊ฒฝ์—์„œ ํšจ๊ณผ์ ์œผ๋กœ ์ž‘๋™ํ•˜๊ณ  ๊ณผ๊ฑฐ ํ–‰๋™์„ ์ž˜ ํšŒ์ƒํ•˜๋ฉฐ ๋ฏธ๋ž˜ ํ–‰๋™์„ ๊ณ„ํšํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.

๋„๊ตฌ

๋„๊ตฌ๋Š” LLM ์—์ด์ „ํŠธ๊ฐ€ ์™ธ๋ถ€ ํ™˜๊ฒฝ๊ณผ ์ƒํ˜ธ ์ž‘์šฉํ•˜๋Š” ๋ฐ ๋„์›€์„ ์ฃผ๋Š” ๋„๊ตฌ๋‚˜ ๋„๊ตฌ ์ง‘ํ•ฉ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ์œ„ํ‚คํ”ผ๋””์•„ ๊ฒ€์ƒ‰ API, ์ฝ”๋“œ ์ธํ„ฐํ”„๋ฆฌํ„ฐ, ์ˆ˜ํ•™ ์—”์ง„ ๋“ฑ์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค, ์ง€์‹ ๋ฒ ์ด์Šค, ์™ธ๋ถ€ ๋ชจ๋ธ๋„ ๋„๊ตฌ์— ํฌํ•จ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์—์ด์ „ํŠธ๊ฐ€ ์™ธ๋ถ€ ๋„๊ตฌ์™€ ์ƒํ˜ธ์ž‘์šฉํ•  ๋•Œ๋Š” ์‚ฌ์šฉ์ž ์š”์ฒญ์„ ์ถฉ์กฑ์‹œํ‚ค๊ณ  ๋ถ€๋ถ„ ์ž‘์—…์„ ์™„๋ฃŒํ•˜๊ธฐ ์œ„ํ•ด ํ•„์š”ํ•œ ๊ด€์ฐฐ์ด๋‚˜ ์ •๋ณด๋ฅผ ์–ป๋Š” ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ํ†ตํ•ด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ฑด๊ฐ• ๊ด€๋ จ ์งˆ๋ฌธ์—์„œ ์ฝ”๋“œ ์ธํ„ฐํ”„๋ฆฌํ„ฐ๋Š” ์‚ฌ์šฉ์ž๊ฐ€ ์š”์ฒญํ•œ ํ•„์š”ํ•œ ์ฐจํŠธ ์ •๋ณด๋ฅผ ์ƒ์„ฑํ•˜๋Š” ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๋Š” ๋„๊ตฌ๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.

LLM์€ ๋‹ค์–‘ํ•œ ๋ฐฉ์‹์œผ๋กœ ๋„๊ตฌ๋ฅผ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค:

  • MRKL (opens in a new tab)์€ LLM๊ณผ ์ „๋ฌธ๊ฐ€ ๋ชจ๋“ˆ์„ ๊ฒฐํ•ฉํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ์ด๋Š” LLM ๋˜๋Š” ๊ธฐํ˜ธ์‹(๊ณ„์‚ฐ๊ธฐ ๋˜๋Š” ๋‚ ์”จ API ๋“ฑ)์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • Toolformer (opens in a new tab)๋Š” ์™ธ๋ถ€ ๋„๊ตฌ API ์‚ฌ์šฉ์„ ์œ„ํ•ด LLM์„ ๋ฏธ์„ธ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค.
  • Function Calling (opens in a new tab)์€ ๋„๊ตฌ API ์ง‘ํ•ฉ์„ ์ •์˜ํ•˜๊ณ  ์ด๋ฅผ ๋ชจ๋ธ์— ์š”์ฒญ์˜ ์ผ๋ถ€๋กœ ์ œ๊ณตํ•จ์œผ๋กœ์จ LLM์— ๋„๊ตฌ ์‚ฌ์šฉ ๊ธฐ๋Šฅ์„ ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  • HuggingGPT (opens in a new tab)๋Š” ๋‹ค์–‘ํ•œ ๊ธฐ์กด AI ๋ชจ๋ธ์„ ์—ฐ๊ฒฐํ•˜์—ฌ AI ์ž‘์—…์„ ํ•ด๊ฒฐํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋กœ, LLM์„ ์ž‘์—… ๊ณ„ํš์ž๋กœ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.

"HuggingGPT"

LLM ์—์ด์ „ํŠธ ์‘์šฉ ์‚ฌ๋ก€

"ChemCrow" ChemCrow ์—์ด์ „ํŠธ๋Š” ์œ ๊ธฐ ํ•ฉ์„ฑ, ์•ฝ๋ฌผ ๋ฐœ๊ฒฌ ๋ฐ ์žฌ๋ฃŒ ์„ค๊ณ„๋ฅผ ํฌํ•จํ•œ ์ž‘์—…์„ ์™„๋ฃŒํ•˜๊ธฐ ์œ„ํ•ด ์„ค๊ณ„๋˜์—ˆ์Œ. ๊ทธ๋ฆผ ์ถœ์ฒ˜: Bran et al., 2023

์ด ๋‹จ๋ฝ์—์„œ๋Š” ๋ณต์žกํ•œ ์ถ”๋ก  ๋ฐ ์ƒ์‹ ์ดํ•ด ๋Šฅ๋ ฅ ๋•๋ถ„์— LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๊ฐ€ ํšจ๊ณผ์ ์œผ๋กœ ์‚ฌ์šฉ๋œ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์™€ ์‚ฌ๋ก€ ์—ฐ๊ตฌ๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

์ฃผ๋ชฉํ•  ๋งŒํ•œ LLM ์—์ด์ „ํŠธ ์‚ฌ๋ก€

  • Ma et al. (2023) (opens in a new tab)์—์„œ ์ •์‹  ๊ฑด๊ฐ• ์ง€์›์„ ์œ„ํ•œ ๋Œ€ํ™”ํ˜• ์—์ด์ „ํŠธ์˜ ํšจ๊ณผ๋ฅผ ๋ถ„์„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ์—์ด์ „ํŠธ๋Š” ์‚ฌ์šฉ์ž๊ฐ€ ๋ถˆ์•ˆ์„ ๋‹ค๋ฃจ๋Š” ๋ฐ ๋„์›€์„ ์ค„ ์ˆ˜ ์žˆ์ง€๋งŒ, ๋•Œ๋•Œ๋กœ ํ•ด๋กœ์šด ๋‚ด์šฉ์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค.
  • Horton (2023) (opens in a new tab)์—์„œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์ธ๊ฐ„์˜ ๊ฒฝ์ œ ํ–‰๋™์„ ํƒ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ์— ์†Œ์œ ๊ถŒ, ์„ ํ˜ธ๋„, ์„ฑ๊ฒฉ์„ ๋ถ€์—ฌํ•˜๋Š” ์—ฐ๊ตฌ๋ฅผ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.
  • Generative Agents (opens in a new tab)์™€ AgentSims (opens in a new tab)๋Š” ๊ฐ€์ƒ ๋งˆ์„์—์„œ ์ธ๊ฐ„์˜ ์ผ์ƒ ์ƒํ™œ์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ์—์ด์ „ํŠธ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ํ”„๋กœ์ ํŠธ์ž…๋‹ˆ๋‹ค.
  • Blind Judgement (opens in a new tab)๋Š” ์—ฌ๋Ÿฌ ์–ธ์–ด ๋ชจ๋ธ์„ ํ™œ์šฉํ•ด ๋‹ค์–‘ํ•œ ํŒ์‚ฌ๋“ค์˜ ์˜์‚ฌ๊ฒฐ์ • ๊ณผ์ •์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๋ฉฐ, ์‹ค์ œ ๋Œ€๋ฒ•์›์˜ ํŒ๊ฒฐ์„ ๋ฌด์ž‘์œ„ ์˜ˆ์ธก๋ณด๋‹ค ๋” ์ •ํ™•ํ•˜๊ฒŒ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.
  • Ziems et al. (2023) (opens in a new tab)์€ ์š”์•ฝ ์ƒ์„ฑ, ์Šคํฌ๋ฆฝํŒ…, ํ‚ค์›Œ๋“œ ์ถ”์ถœ๊ณผ ๊ฐ™์€ ์ž‘์—…์—์„œ ์—ฐ๊ตฌ์ž๋ฅผ ๋ณด์กฐํ•˜๋Š” ์—์ด์ „ํŠธ๋ฅผ ๊ฐœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.
  • ChemCrow (opens in a new tab)๋Š” ํ™”ํ•™ ๊ด€๋ จ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ํ™œ์šฉํ•˜์—ฌ ํ•ด์ถฉ ๋ฐฉ์ œ์ œ, ์„ธ ๊ฐ€์ง€ ์œ ๊ธฐ์ด‰๋งค ๋ฐ ์ƒˆ๋กœ์šด ๋ฐœ์ƒ‰์ฒด์˜ ๋ฐœ๊ฒฌ์„ ๋…๋ฆฝ์ ์œผ๋กœ ๊ณ„ํšํ•˜๊ณ  ์‹คํ–‰ํ•˜๋Š” LLM ํ™”ํ•™ ์—์ด์ „ํŠธ์ž…๋‹ˆ๋‹ค.
  • [Boiko et al. (2023)]์€ ๊ณผํ•™ ์‹คํ—˜์˜ ์„ค๊ณ„, ๊ณ„ํš ๋ฐ ์‹คํ–‰์„ ์ž๋™ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ LLM์„ ๊ฒฐํ•ฉํ•œ ์—ฐ๊ตฌ๋ฅผ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.
  • Math Agents๋Š” ์ˆ˜ํ•™ ๋ฌธ์ œ๋ฅผ ํƒ์ƒ‰, ๋ฐœ๊ฒฌ, ํ•ด๊ฒฐ ๋ฐ ์ฆ๋ช…ํ•˜๋Š” ๋ฐ ์—ฐ๊ตฌ์ž๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. EduChat (opens in a new tab)๊ณผ CodeHelp (opens in a new tab)๋Š” ๊ต์œก ๋ชฉ์ ์œผ๋กœ ์„ค๊ณ„๋œ ์ฃผ๋ชฉํ•  ๋งŒํ•œ LLM ์—์ด์ „ํŠธ์ž…๋‹ˆ๋‹ค.
  • Mehta et al. (2023) (opens in a new tab)์€ ์ธ๊ฐ„ ๊ฑด์ถ•๊ฐ€๋“ค์ด AI ์—์ด์ „ํŠธ์™€ ์ƒํ˜ธ ์ž‘์šฉํ•˜์—ฌ 3D ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ๊ตฌ์กฐ๋ฌผ์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๋Š” ์ƒํ˜ธ ์ž‘์šฉํ˜• ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค.
  • ChatDev (opens in a new tab), ToolLLM (opens in a new tab), MetaGPT (opens in a new tab)๋Š” ์ฝ”๋”ฉ, ๋””๋ฒ„๊น…, ํ…Œ์ŠคํŒ…์„ ์ž๋™ํ™”ํ•˜๊ณ  ๊ธฐํƒ€ ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด๋ง ์ž‘์—…์„ ์ง€์›ํ•˜๋Š” ๋ฐ AI ์—์ด์ „ํŠธ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ๋Š” ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค.
  • D-Bot (opens in a new tab)์€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์œ ์ง€ ๊ด€๋ฆฌ ๊ฒฝํ—˜์„ ์ง€์†์ ์œผ๋กœ ํ•™์Šตํ•˜๋Š” LLM ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ด€๋ฆฌ์ž๋กœ, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ๋Œ€ํ•œ ์ง„๋‹จ ๋ฐ ์ตœ์ ํ™” ์กฐ์–ธ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  • IELLM (opens in a new tab)์€ ์„์œ  ๋ฐ ๊ฐ€์Šค ์‚ฐ์—…์˜ ๋„์ „ ๊ณผ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด LLM์„ ์ ์šฉํ•œ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.
  • Dasgupta et al. 2023 (opens in a new tab)์€ ์‹ค์ฒดํ™”๋œ ์ถ”๋ก  ๋ฐ ์ž‘์—… ๊ณ„ํš์„ ์œ„ํ•œ ํ†ตํ•ฉ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ–ˆ์Šต๋‹ˆ๋‹ค.
  • OS-Copilot (opens in a new tab)์€ ์šด์˜ ์‹œ์Šคํ…œ(OS)์˜ ์—ฌ๋Ÿฌ ์š”์†Œ๋“ค๊ณผ ์›น, ์ฝ”๋“œ ํ„ฐ๋ฏธ๋„, ํŒŒ์ผ, ๋ฉ€ํ‹ฐ๋ฏธ๋””์–ด ๋ฐ ๋‹ค์–‘ํ•œ ํƒ€์‚ฌ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜๊ณผ์˜ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฒ”์šฉ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค.

LLM ์—์ด์ „ํŠธ ๋„๊ตฌ

"AutoGen" AutoGen ๋Šฅ๋ ฅ; ๊ทธ๋ฆผ ์ถœ์ฒ˜: https://microsoft.github.io/autogen (opens in a new tab)

LLM ์—์ด์ „ํŠธ๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” ์ฃผ์š” ๋„๊ตฌ ๋ฐ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • LangChain (opens in a new tab): ์–ธ์–ด ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๋ฐ ์—์ด์ „ํŠธ ๊ฐœ๋ฐœ์„ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค.
  • AutoGPT (opens in a new tab): AI ์—์ด์ „ํŠธ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•œ ๋‹ค์–‘ํ•œ ๋„๊ตฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  • Langroid (opens in a new tab): ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ”„๋กœ๊ทธ๋ž˜๋ฐ์„ ํ†ตํ•ด LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ตฌ์ถ•์„ ๊ฐ„์†Œํ™”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋ฉ”์‹œ์ง€๋ฅผ ํ†ตํ•œ ์—์ด์ „ํŠธ ๊ฐ„ ํ˜‘์—…์„ ์ค‘์š”ํ•˜๊ฒŒ ๋‹ค๋ฃน๋‹ˆ๋‹ค.
  • AutoGen (opens in a new tab): ์—ฌ๋Ÿฌ ์—์ด์ „ํŠธ๊ฐ€ ์„œ๋กœ ๋Œ€ํ™”ํ•˜๋ฉฐ ์ž‘์—…์„ ํ•ด๊ฒฐํ•˜๋Š” LLM ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ฐœ๋ฐœ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค.
  • OpenAgents (opens in a new tab): ์–ธ์–ด ์—์ด์ „ํŠธ๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ํ˜ธ์ŠคํŒ…ํ•˜๋Š” ์˜คํ”ˆ ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.
  • LlamaIndex (opens in a new tab): ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์— ์‚ฌ์šฉ์ž ์ •์˜ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค.
  • GPT Engineer (opens in a new tab): ๊ฐœ๋ฐœ ์ž‘์—…์„ ์™„๋ฃŒํ•˜๊ธฐ ์œ„ํ•œ ์ฝ”๋“œ ์ƒ์„ฑ์„ ์ž๋™ํ™”ํ•˜๋Š” ๋„๊ตฌ์ž…๋‹ˆ๋‹ค.
  • DemoGPT (opens in a new tab): ๋Œ€ํ™”ํ˜• Streamlit ์•ฑ์„ ์ƒ์„ฑํ•˜๋Š” ์ž์œจ AI ์—์ด์ „ํŠธ์ž…๋‹ˆ๋‹ค.
  • GPT Researcher (opens in a new tab): ๋‹ค์–‘ํ•œ ์ž‘์—…์— ๋Œ€ํ•œ ์ข…ํ•ฉ์ ์ธ ์˜จ๋ผ์ธ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•ด ์„ค๊ณ„๋œ ์ž์œจ ์—์ด์ „ํŠธ์ž…๋‹ˆ๋‹ค.
  • AgentVerse (opens in a new tab): ๋‹ค์–‘ํ•œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ ์—ฌ๋Ÿฌ LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ์˜ ๋ฐฐ์น˜๋ฅผ ์šฉ์ดํ•˜๊ฒŒ ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • Agents (opens in a new tab): ์ž์œจ ์–ธ์–ด ์—์ด์ „ํŠธ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•œ ์˜คํ”ˆ ์†Œ์Šค ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ/ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค. ์žฅ๋‹จ๊ธฐ ๊ธฐ์–ต, ๋„๊ตฌ ์‚ฌ์šฉ, ์›น ํƒ์ƒ‰, ๋‹ค์ค‘ ์—์ด์ „ํŠธ ํ†ต์‹  ๋“ฑ์„ ์ง€์›ํ•˜๋ฉฐ ์ธ๊ฐ„๊ณผ ์—์ด์ „ํŠธ ๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ ๋ฐ ์ƒ์ง•์  ์ œ์–ด์™€ ๊ฐ™์€ ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ๋„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.
  • BMTools (opens in a new tab): ์–ธ์–ด ๋ชจ๋ธ์„ ํ™•์žฅํ•˜๊ธฐ ์œ„ํ•ด ๋„๊ตฌ ์‚ฌ์šฉ์„ ์ง€์›ํ•˜๊ณ , ์ปค๋ฎค๋‹ˆํ‹ฐ๊ฐ€ ๋„๊ตฌ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ณ  ๊ณต์œ ํ•  ์ˆ˜ ์žˆ๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.
  • crewAI (opens in a new tab): ์—”์ง€๋‹ˆ์–ด๋ฅผ ์œ„ํ•ด ๋‹ค์‹œ ๊ตฌ์ƒ๋œ AI ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ๊ฐ•๋ ฅํ•œ ๊ธฐ๋Šฅ์„ ๊ฐ„๋‹จํ•˜๊ฒŒ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  • Phidata (opens in a new tab): ํ•จ์ˆ˜ ํ˜ธ์ถœ์„ ์‚ฌ์šฉํ•ด AI ์–ด์‹œ์Šคํ„ดํŠธ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•œ ํˆดํ‚ท์ž…๋‹ˆ๋‹ค.

LLM ์—์ด์ „ํŠธ ํ‰๊ฐ€

"" AgentBench ๋ฒค์น˜๋งˆํฌ๋Š” ์‹ค์ œ ์„ธ๊ณ„์˜ ๋„์ „๊ณผ 8๊ฐ€์ง€ ๋‹ค๋ฅธ ํ™˜๊ฒฝ์—์„œ LLM-as-Agent๋ฅผ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆผ ์ถœ์ฒ˜: Liu et al. 2023

LLM ์ž์ฒด๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, LLM ์—์ด์ „ํŠธ๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ๋„ ์–ด๋ ค์šด ์ž‘์—…์ž…๋‹ˆ๋‹ค. Wang et al. 2023 (opens in a new tab)์— ๋”ฐ๋ฅด๋ฉด, ์ผ๋ฐ˜์ ์ธ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • Human Annotation: ์ธ๊ฐ„ ํ‰๊ฐ€์ž๊ฐ€ ์ •์ง์„ฑ, ์œ ์šฉ์„ฑ, ์ฐธ์—ฌ๋„, ํŽธ๊ฒฌ ์—†์Œ ๋“ฑ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—์„œ ์ค‘์š”ํ•œ ๋‹ค์–‘ํ•œ ์ธก๋ฉด์—์„œ LLM ๊ฒฐ๊ณผ๋ฅผ ์ง์ ‘ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  • Turing Test: ์ธ๊ฐ„ ํ‰๊ฐ€์ž๋Š” ์‹ค์ œ ์ธ๊ฐ„๊ณผ ์—์ด์ „ํŠธ์˜ ๊ฒฐ๊ณผ๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ตฌ๋ณ„ํ•  ์ˆ˜ ์—†๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ค๋ฉด ์—์ด์ „ํŠธ๊ฐ€ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • Metrics: ์—์ด์ „ํŠธ์˜ ํ’ˆ์งˆ์„ ๋ฐ˜์˜ํ•˜๊ธฐ ์œ„ํ•ด ์„ธ์‹ฌํ•˜๊ฒŒ ์„ค๊ณ„๋œ ์ง€ํ‘œ๋“ค์ž…๋‹ˆ๋‹ค. ์ฃผ์š” ๋ฉ”ํŠธ๋ฆญ์œผ๋กœ๋Š” ์ž‘์—… ์„ฑ๊ณต๋ฅ , ์ธ๊ฐ„ ์œ ์‚ฌ์„ฑ, ํšจ์œจ์„ฑ ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
  • Protocols: ๋ฉ”ํŠธ๋ฆญ์ด ์–ด๋–ป๊ฒŒ ์‚ฌ์šฉ๋˜๋Š”์ง€๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ์ผ๋ฐ˜์ ์ธ ํ‰๊ฐ€ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์‹ค์ œ ์„ธ๊ณ„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜, ์‚ฌํšŒ์  ํ‰๊ฐ€, ๋‹ค์ค‘ ์ž‘์—… ํ‰๊ฐ€, ์†Œํ”„ํŠธ์›จ์–ด ํ…Œ์ŠคํŒ… ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
  • Benchmarks: LLM ์—์ด์ „ํŠธ๋ฅผ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์„ค๊ณ„๋œ ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์˜ˆ์‹œ๋กœ๋Š” ALFWorld (opens in a new tab), IGLU (opens in a new tab), Tachikuma (opens in a new tab), AgentBench (opens in a new tab), SocKET (opens in a new tab), AgentSims (opens in a new tab), ToolBench (opens in a new tab), WebShop (opens in a new tab), Mobile-Env (opens in a new tab), WebArena (opens in a new tab), GentBench (opens in a new tab), RocoBench (opens in a new tab), EmotionBench (opens in a new tab), PEB (opens in a new tab), ClemBench (opens in a new tab), E2E (opens in a new tab) ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

๋„์ „๊ณผ์ œ

LLM ์—์ด์ „ํŠธ๋Š” ์•„์ง ์ดˆ๊ธฐ ๋‹จ๊ณ„์ด๋ฉฐ, ๊ตฌ์ถ• ๊ณผ์ •์—๋Š” ๋งŽ์€ ๋„์ „๊ณผ ํ•œ๊ณ„๊ฐ€ ๋‚จ์•„ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ์—ญํ•  ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ: LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋Š” ๋„๋ฉ”์ธ์—์„œ ์ž‘์—…์„ ํšจ๊ณผ์ ์œผ๋กœ ์™„๋ฃŒํ•˜๊ธฐ ์œ„ํ•ด ์—ญํ• ์„ ์ ์‘ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. LLM์ด ์ž˜ ํ‘œํ˜„ํ•˜์ง€ ๋ชปํ•˜๋Š” ์—ญํ• ์— ๋Œ€ํ•ด, ๋“œ๋ฌธ ์—ญํ• ์ด๋‚˜ ํŠน์ดํ•œ ์บ๋ฆญํ„ฐ๋ฅผ ๋Œ€๋ณ€ํ•˜๋Š” ๋ฐ์ดํ„ฐ๋กœ LLM์„ ๋ฏธ์„ธ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์žฅ๊ธฐ ๊ณ„ํš ๋ฐ ์ œํ•œ๋œ ์ปจํ…์ŠคํŠธ ๊ธธ์ด: ์žฅ๊ธฐ ๊ณ„ํš ์ˆ˜๋ฆฝ์€ ์—์ด์ „ํŠธ๊ฐ€ ํšŒ๋ณต ๋ถˆ๊ฐ€๋Šฅํ•œ ์˜ค๋ฅ˜๋กœ ์ด์–ด์งˆ ์ˆ˜๋„ ์žˆ๋Š” ๋ณต์žกํ•œ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. LLM์˜ ์ง€์› ๊ฐ€๋Šฅํ•œ ์ปจํ…์ŠคํŠธ ๊ธธ์ด์—๋„ ํ•œ๊ณ„๊ฐ€ ์žˆ์–ด, ์—์ด์ „ํŠธ์˜ ๋‹จ๊ธฐ ๊ธฐ์–ต ํ™œ์šฉ์— ์ œํ•œ์„ ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ผ๋ฐ˜ํ™”๋œ ์ธ๊ฐ„ ์ •๋ ฌ: ๋‹ค์–‘ํ•œ ์ธ๋ฅ˜์˜ ๊ฐ€์น˜์™€ ์—์ด์ „ํŠธ๋ฅผ ์ผ์น˜์‹œํ‚ค๋Š” ๊ฒƒ์€ ์ž์ฃผ ์š”๊ตฌ๋˜๋Š” ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. ๊ณ ๊ธ‰ ํ”„๋กฌํ”„ํŒ… ์ „๋žต์„ ์„ค๊ณ„ํ•˜์—ฌ LLM์„ ์žฌ์กฐ์ •ํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅํ•œ ํ•ด๊ฒฐ์ฑ… ์ค‘ ํ•˜๋‚˜์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ํ”„๋กฌํ”„ํŠธ ๊ฒฌ๊ณ ์„ฑ ๋ฐ ์‹ ๋ขฐ์„ฑ: LLM ์—์ด์ „ํŠธ๋Š” ๋ฉ”๋ชจ๋ฆฌ์™€ ๊ณ„ํš ๋“ฑ ๋‹ค์–‘ํ•œ ๋ชจ๋“ˆ์„ ๊ตฌ๋™ํ•˜๋Š” ์—ฌ๋Ÿฌ ํ”„๋กฌํ”„ํŠธ๋ฅผ ํฌํ•จํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ”„๋กฌํ”„ํŠธ์— ์ž‘์€ ๋ณ€ํ™”๋งŒ ์žˆ์–ด๋„ LLM์—์„œ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•˜๊ธฐ ์‰ฝ์Šต๋‹ˆ๋‹ค. LLM ์—์ด์ „ํŠธ๋Š” ์ „์ฒด ํ”„๋กฌํ”„ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํฌํ•จํ•˜๋ฏ€๋กœ ๊ฒฌ๊ณ ์„ฑ ๋ฌธ์ œ์— ๋” ์ทจ์•ฝํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ž ์žฌ์  ํ•ด๊ฒฐ์ฑ…์œผ๋กœ๋Š” ํ”„๋กฌํ”„ํŠธ ์š”์†Œ๋ฅผ ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ํ†ตํ•ด ์ œ์ž‘ํ•˜๊ฑฐ๋‚˜, ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž๋™์œผ๋กœ ์ตœ์ ํ™”/์กฐ์ •ํ•˜๊ฑฐ๋‚˜, GPT๋ฅผ ์ด์šฉํ•œ ์ž๋™ ํ”„๋กฌํ”„ํŠธ ์ƒ์„ฑ ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. LLM๊ณผ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, LLM ์—์ด์ „ํŠธ์—์„œ๋„ ํ™˜๊ฐ์ด ํ”ํ•œ ๋ฌธ์ œ์ด๋ฉฐ, ์ด ์—์ด์ „ํŠธ๋“ค์€ ์™ธ๋ถ€ ๊ตฌ์„ฑ ์š”์†Œ์™€์˜ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ์œ„ํ•ด ์ž์—ฐ ์–ธ์–ด์— ์˜์กดํ•˜๋Š”๋ฐ, ์ด๋กœ ์ธํ•ด ์ถฉ๋Œํ•˜๋Š” ์ •๋ณด๊ฐ€ ๋“ค์–ด์™€ ํ™˜๊ฐ๊ณผ ์‚ฌ์‹ค์„ฑ ๋ฌธ์ œ๋ฅผ ์ผ์œผํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ง€์‹ ๊ฒฝ๊ณ„: ์ง€์‹ ๋ถˆ์ผ์น˜๋กœ ์ธํ•ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ํ™˜๊ฐ์ด๋‚˜ ์‚ฌ์‹ค์„ฑ ๋ฌธ์ œ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, LLM์˜ ์ง€์‹ ๋ฒ”์œ„๋ฅผ ์ œ์–ดํ•˜๋Š” ๊ฒƒ๋„ ์–ด๋ ค์›Œ, ์ด๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ํšจ๊ณผ์— ํฐ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, LLM์˜ ๋‚ด๋ถ€ ์ง€์‹์€ ํŽธํ–ฅ์„ ๋„์ž…ํ•˜๊ฑฐ๋‚˜ ์‚ฌ์šฉ์ž๊ฐ€ ๋ชจ๋ฅด๋Š” ์ง€์‹์„ ํ™œ์šฉํ•˜์—ฌ ํŠน์ • ํ™˜๊ฒฝ์—์„œ ์ž‘๋™ํ•  ๋•Œ ์—์ด์ „ํŠธ์˜ ํ–‰๋™์— ์˜ํ–ฅ์„ ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ํšจ์œจ์„ฑ: LLM ์—์ด์ „ํŠธ๋Š” LLM์ด ์ฒ˜๋ฆฌํ•ด์•ผ ํ•˜๋Š” ์ƒ๋‹นํ•œ ์–‘์˜ ์š”์ฒญ์„ ํฌํ•จํ•˜๋Š”๋ฐ, ์ด๋Š” LLM ์ถ”๋ก  ์†๋„์— ํฌ๊ฒŒ ์˜์กดํ•  ์ˆ˜ ์žˆ์–ด ์—์ด์ „ํŠธ ์ž‘์—…์˜ ํšจ์œจ์„ฑ์— ์˜ํ–ฅ์„ ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ ์—์ด์ „ํŠธ๋ฅผ ๋ฐฐ์น˜ํ•  ๋•Œ ๋น„์šฉ๋„ ๊ณ ๋ คํ•ด์•ผ ํ•  ์‚ฌํ•ญ์ž…๋‹ˆ๋‹ค.

์ฐธ๊ณ  ์ž๋ฃŒ