πŸš€ Master Prompt Engineering and building AI Agents in our NEW courses! Use PROMPTING20 for 20% off ➜ Enroll now
Automatic Reasoning and Tool-use

Automatic Reasoning and Tool-use (ART)

μƒκ°μ˜ μ‚¬μŠ¬(chain-of-thought; CoT) ν”„λ‘¬ν”„νŒ…κ³Ό 도ꡬλ₯Ό ꡐ차적으둜 κ²°ν•©ν•˜λŠ” 것은 λŒ€κ·œλͺ¨μ–Έμ–΄λͺ¨λΈλ‘œ λ§Žμ€ μž‘μ—…μ„ μ²˜λ¦¬ν•˜λŠ” κ°•λ ₯ν•˜κ³  κ²¬κ³ ν•œ μ ‘κ·Ό 방식인 κ²ƒμœΌλ‘œ λ°ν˜€μ‘ŒμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ 접근법듀은 일반적으둜 μž‘μ—… νŠΉμ • μ‹œμ—°μ„ μˆ˜μž‘μ—…μœΌλ‘œ μ œμž‘ν•˜κ³ , 주의 깊게 κ΅μ°¨ν•˜μ—¬ λͺ¨λΈμ„ μƒμ„±ν•˜κ³  도ꡬλ₯Ό μ‚¬μš©ν•΄μ•Ό ν•©λ‹ˆλ‹€. Paranjape et al., (2023) (opens in a new tab)은 ν”„λ‘œκ·Έλž¨μœΌλ‘œ 쀑간 μΆ”λ‘  단계λ₯Ό μžλ™ μƒμ„±ν•˜κΈ° μœ„ν•΄ frozen λŒ€κ·œλͺ¨μ–Έμ–΄λͺ¨λΈμ„ μ‚¬μš©ν•˜λŠ” μƒˆλ‘œμš΄ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€.

ARTλŠ” λ‹€μŒκ³Ό 같이 μž‘λ™ν•©λ‹ˆλ‹€:

  • μƒˆλ‘œμš΄ μž‘μ—…μ΄ μ£Όμ–΄μ§€λ©΄ μž‘μ—… λΌμ΄λΈŒλŸ¬λ¦¬μ—μ„œ λ‹€λ‹¨κ³„μ˜ μΆ”λ‘  및 도ꡬ μ‚¬μš© μ‹œμ—°μ„ μ„ νƒν•©λ‹ˆλ‹€.
  • ν…ŒμŠ€νŠΈ μ‹œμ—λŠ” μ™ΈλΆ€ 도ꡬ가 호좜될 λ•Œλ§ˆλ‹€ 생성을 μΌμ‹œ μ€‘λ‹¨ν•˜κ³ , 생성을 μž¬κ°œν•˜κΈ° 전에 κ·Έ 좜λ ₯듀을 ν†΅ν•©ν•©λ‹ˆλ‹€.

ARTλŠ” λͺ¨λΈμ΄ μ‹œμ—°λ“€λ‘œλΆ€ν„° μΌλ°˜ν™”ν•˜μ—¬ μƒˆλ‘œμš΄ μž‘μ—…μ„ λΆ„ν•΄ν•˜κ³  μ μ ˆν•œ μž₯μ†Œμ—μ„œ 도ꡬλ₯Ό μ‚¬μš©ν•˜λ„λ‘ μž₯λ €ν•˜λŠ”λ°, μ΄λŠ” μ œλ‘œμƒ·(zero-shot) λ°©μ‹μœΌλ‘œ μ΄λ£¨μ–΄μ§‘λ‹ˆλ‹€. λ˜ν•œ ARTλŠ” μ‚¬λžŒλ“€λ‘œ ν•˜μ—¬κΈˆ μΆ”λ‘  λ‹¨κ³„μ—μ„œ 였λ₯˜λ₯Ό μˆ˜μ •ν•˜κ±°λ‚˜ λ‹¨μˆœνžˆ μž‘μ—… 및 도ꡬ 라이브러리λ₯Ό μ—…λ°μ΄νŠΈν•˜μ—¬ μƒˆλ‘œμš΄ 도ꡬλ₯Ό μΆ”κ°€ν•  수 있게 ν•¨μœΌλ‘œμ¨ ν™•μž₯ κ°€λŠ₯ν•©λ‹ˆλ‹€. 과정은 λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

ART

이미지 좜처: Paranjape et al., (2023) (opens in a new tab)

ARTλŠ” BigBench와 MMLU λ²€μΉ˜λ§ˆν¬μ—μ„œ 보이지 μ•ŠλŠ” μž‘μ—…μ— λŒ€ν•΄ 퓨샷(few-shot) ν”„λ‘¬ν”„νŒ…κ³Ό μžλ™ CoTλ₯Ό 크게 ν–₯μƒμ‹œν‚€λ©°, μ‚¬λžŒμ˜ ν”Όλ“œλ°±μ„ λ°˜μ˜ν•  경우 μˆ˜μž‘μ—…μœΌλ‘œ λ§Œλ“  CoT ν”„λ‘¬ν”„νŠΈμ˜ μ„±λŠ₯을 λŠ₯κ°€ν•©λ‹ˆλ‹€.

μ•„λž˜λŠ” BigBench와 MMLU μž‘μ—…μ—μ„œ ART의 μ„±λŠ₯을 보여 μ£ΌλŠ” ν‘œμž…λ‹ˆλ‹€:

ART2

이미지 좜처: Paranjape et al., (2023) (opens in a new tab)