πŸš€ Master Prompt Engineering and building AI Agents in our NEW courses! Use PROMPTING20 for 20% off ➜ Enroll now
Tree of Thoughts

Tree of Thoughts (ToT)

νƒκ΅¬λ‚˜ μ „λž΅μ μΈ 예츑이 ν•„μš”ν•œ λ³΅μž‘ν•œ μž‘μ—…λ“€μ„ ν•΄κ²°ν•˜κΈ° μœ„ν•΄μ„œλŠ” 기쑴의 λ‹¨μˆœν•œ ν”„λ‘¬ν”„νŒ… κΈ°λ²•μœΌλ‘œλŠ” λΆ€μ‘±ν•©λ‹ˆλ‹€. Yao et el. (2023) (opens in a new tab)와 Long (2023) (opens in a new tab)λŠ” 졜근 Tree of Thoughts(ToT)의 κ°œλ…μ„ μ œμ•ˆν–ˆλŠ”λ°, 이 ν”„λ ˆμž„μ›Œν¬λŠ” 'μƒκ°μ˜ μ‚¬μŠ¬(chain-of-thought)' ν”„λ‘¬ν”„νŒ… 기법을 μΌλ°˜ν™”ν•˜λ©°, μ–Έμ–΄λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬ 일반적인 문제 해결을 μœ„ν•œ 쀑간 단계 역할을 ν•˜λŠ” 생각에 λŒ€ν•œ 탐색을 μ΄‰μ§„ν•©λ‹ˆλ‹€.

ToTλŠ” 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ 쀑간 λ‹¨κ³„λ‘œμ„œ μΌκ΄€λœ μ–Έμ–΄ μ‹œν€€μŠ€λ₯Ό λ‚˜νƒ€λ‚΄λŠ” Tree of Thoughtsλ₯Ό μœ μ§€ν•©λ‹ˆλ‹€. 이 접근법을 톡해 μ–Έμ–΄λͺ¨λΈμ€ μ‹ μ€‘ν•œ μΆ”λ‘  과정을 거쳐 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ 쀑간 생각듀이 문제λ₯Ό ν•΄κ²°ν•΄λ‚˜κ°€λŠ” 과정을 자체적으둜 평가할 수 있게 λ©λ‹ˆλ‹€. 그리고 이 μ–Έμ–΄λͺ¨λΈμ΄ 생각을 μƒμ„±ν•˜κ³  ν‰κ°€ν•˜λŠ” λŠ₯λ ₯은 탐색 μ•Œκ³ λ¦¬μ¦˜(예: λ„ˆλΉ„ μš°μ„  탐색과 깊이 μš°μ„  탐색(DFS))κ³Ό κ²°ν•©λ˜μ–΄, μ„ μ œμ  탐색과 λ°±νŠΈλž˜ν‚Ήμ΄ κ°€λŠ₯ν•œ μƒκ°μ˜ 체계적인 탐색을 κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.

ToT ν”„λ ˆμž„μ›Œν¬λŠ” λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€.

TOT

이미지 좜처: Yao et el. (2023) (opens in a new tab)

ToTλ₯Ό μ‚¬μš©ν•  λ•Œ, λ‹€λ₯Έ μž‘μ—…λ“€μ€ ν›„λ³΄μ˜ μˆ˜μ™€ 생각/λ‹¨κ³„μ˜ 수λ₯Ό μ •μ˜ν•˜λŠ” 것을 μš”κ΅¬ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, λ…Όλ¬Έμ—μ„œ 보여진 바와 같이, 24의 κ²Œμž„μ€ 사고λ₯Ό 3λ‹¨κ³„λ‘œ λΆ„ν•΄ν•˜λŠ” μˆ˜ν•™μ  μΆ”λ‘  과제둜 μ‚¬μš©λ˜μ—ˆμŠ΅λ‹ˆλ‹€. 각 λ‹¨κ³„λŠ” 쀑간 방정식을 ν¬ν•¨ν•©λ‹ˆλ‹€. 각 λ‹¨κ³„μ—μ„œ, μ΅œμ„ μ˜ b=5 후보듀이 μœ μ§€λ©λ‹ˆλ‹€.

24의 κ²Œμž„ μž‘μ—…μ— λŒ€ν•œ ToT의 λ„ˆλΉ„ μš°μ„  탐색(BFS)λ₯Ό μˆ˜ν–‰ν•˜κΈ° μœ„ν•΄, μ–Έμ–΄λͺ¨λΈμ€ 각 사고 후보λ₯Ό 24에 λ„λ‹¬ν•˜λŠ” 것에 λŒ€ν•΄ "확싀함/μ•„λ§ˆλ„/λΆˆκ°€λŠ₯함"으둜 ν‰κ°€ν•˜λ„λ‘ μš”μ²­ν•©λ‹ˆλ‹€. μ €μžλ“€μ€ "λͺ©ν‘œλŠ” λͺ‡ 번의 μ„ μ œμ  μ‹œν—˜ λ‚΄μ—μ„œ νŒκ²°μ„ 내릴 수 μžˆλŠ” μ˜¬λ°”λ₯Έ 뢀뢄적 해결책을 μ΄‰μ§„ν•˜κ³ , 'λ„ˆλ¬΄ ν¬κ±°λ‚˜ μž‘μ€' 상식에 κΈ°λ°˜ν•œ λΆˆκ°€λŠ₯ν•œ λΆ€λΆ„ 해결책을 μ œκ±°ν•˜κ³ , λ‚˜λ¨Έμ§€ 'μ•„λ§ˆλ„'λ₯Ό μœ μ§€ν•˜λŠ” 것"μž…λ‹ˆλ‹€. 각 생각에 λŒ€ν•œ 값은 3번 μƒ˜ν”Œλ§λ©λ‹ˆλ‹€. μ•„λž˜μ— 이 과정이 그림으둜 λ‚˜νƒ€λ‚˜ μžˆμŠ΅λ‹ˆλ‹€:

TOT2

이미지 좜처: Yao et el. (2023) (opens in a new tab)

μ•„λž˜ κ·Έλ¦Όμ—μ„œ 보고된 κ²°κ³Όμ—μ„œ λ³Ό 수 μžˆλ“―, ToTλŠ” λ‹€λ₯Έ ν”„λ‘¬ν”„νŒ… 방법듀에 λΉ„ν•΄ μ›”λ“±νžˆ λ›°μ–΄λ‚©λ‹ˆλ‹€.

TOT3

이미지 좜처: Yao et el. (2023) (opens in a new tab)

이곳 (opens in a new tab)κ³Ό 이곳 (opens in a new tab)의 μ½”λ“œλ₯Ό μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

높은 μˆ˜μ€€μ—μ„œ 보면, Yao et el. (2023) (opens in a new tab)와 Long (2023) (opens in a new tab)의 μ£Όμš” μ•„μ΄λ””μ–΄λŠ” μœ μ‚¬ν•©λ‹ˆλ‹€. 두 연ꡬ λͺ¨λ‘ 닀쀑 λΌμš΄λ“œ λŒ€ν™”λ₯Ό ν†΅ν•œ 트리 검색을 톡해 λŒ€κ·œλͺ¨μ–Έμ–΄λͺ¨λΈμ˜ λ³΅μž‘ν•œ 문제 ν•΄κ²° λŠ₯λ ₯을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€. μ£Όμš” 차이점 쀑 ν•˜λ‚˜λŠ” Yao et el. (2023) (opens in a new tab)이 깊이 μš°μ„  탐색/λ„ˆλΉ„ μš°μ„  탐색/λΉ” 탐색을 ν™œμš©ν•˜λŠ” 반면, Long (2023) (opens in a new tab)μ—μ„œ μ œμ•ˆν•˜λŠ” 트리 검색 μ „λž΅(즉, μ–Έμ œ λ°±νŠΈλž˜ν‚Ήμ„ ν•˜κ³ , λͺ‡ λ‹¨κ³„λ‘œ λ°±νŠΈλž˜ν‚Ήμ„ ν•˜λŠ”μ§€ λ“±)은 κ°•ν™” ν•™μŠ΅μ„ 톡해 ν›ˆλ ¨λœ "ToT 컨트둀러"에 μ˜ν•΄ μ£Όλ„λ©λ‹ˆλ‹€. 깊이 μš°μ„  탐색/λ„ˆλΉ„ μš°μ„  탐색/λΉ” 탐색은 νŠΉμ • λ¬Έμ œμ— λŒ€ν•œ 적응 없이 일반적인 ν•΄κ²°μ±… 검색 μ „λž΅μž…λ‹ˆλ‹€. 반면, RL을 톡해 ν›ˆλ ¨λœ ToT μ»¨νŠΈλ‘€λŸ¬λŠ” μƒˆλ‘œμš΄ 데이터 μ„ΈνŠΈλ‚˜ 자체 ν”Œλ ˆμ΄λ₯Ό 톡해 ν•™μŠ΅ν•  수 μžˆμ„ 수 있으며(AlphaGo vs 무차별 검색), λ”°λΌμ„œ RL 기반의 ToT μ‹œμŠ€ν…œμ€ κ³ μ •λœ LLMμœΌλ‘œλ„ κ³„μ†ν•΄μ„œ λ°œμ „ν•˜κ³  μƒˆλ‘œμš΄ 지식을 배울 수 μžˆμŠ΅λ‹ˆλ‹€.

Hulbert (2023) (opens in a new tab)은 Tree-of-Thought ν”„λ‘¬ν”„νŒ…μ„ μ œμ•ˆν–ˆλŠ”λ°, μ΄λŠ” ToT ν”„λ ˆμž„μ›Œν¬μ˜ μ£Όμš” κ°œλ…μ„ λ‹¨μˆœν•œ ν”„λ‘¬ν”„νŒ… κΈ°λ²•μœΌλ‘œ μ μš©ν•˜μ—¬ LLM이 단일 ν”„λ‘¬ν”„νŠΈμ—μ„œ 쀑간 생각을 ν‰κ°€ν•˜κ²Œ ν•©λ‹ˆλ‹€. μƒ˜ν”Œ ToT ν”„λ‘¬ν”„νŠΈλŠ” λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€.

μ„Έ λͺ…μ˜ λ‹€λ₯Έ 전문가듀이 이 μ§ˆλ¬Έμ— λ‹΅ν•˜κ³  μžˆλ‹€κ³  상상해보도둝 ν•΄.
λͺ¨λ“  전문가듀은 μžμ‹ μ˜ μƒκ°μ˜ ν•œ 단계λ₯Ό 적어내고,
그것을 κ·Έλ£Ήκ³Ό κ³΅μœ ν• κ±°μ•Ό.
그런 λ‹€μŒ λͺ¨λ“  전문가듀은 λ‹€μŒ λ‹¨κ³„λ‘œ λ„˜μ–΄κ°€. λ“±λ“±.
λ§Œμ•½ μ–΄λ–€ μ „λ¬Έκ°€κ°€ μ–΄λ–€ μ‹œμ μ—μ„œλ“  μžμ‹ μ΄ ν‹€λ Έλ‹€λŠ” 것을 κΉ¨λ‹«κ²Œ 되면 그듀은 λ– λ‚˜.
κ·Έλ ‡λ‹€λ©΄ μ§ˆλ¬Έμ€...