πŸš€ Master Prompt Engineering and building AI Agents in our NEW courses! Use PROMPTING20 for 20% off ➜ Enroll now
Chain-of-Thought Prompting

Chain-of-Thought Prompting

Chain-of-Thought (CoT) Prompting

COT

이미지 좜처: Wei et al. (2022) (opens in a new tab)

Wei et al. (2022) (opens in a new tab)μ—μ„œ μ†Œκ°œλœ μƒκ°μ˜ μ‚¬μŠ¬(chain-of-thought, CoT) ν”„λ‘¬ν”„νŠΈλŠ” 쀑간 μΆ”λ‘  단계λ₯Ό 톡해 λ³΅μž‘ν•œ 좔둠을 κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€. 이λ₯Ό λ‹¨λ‹΅ν˜• ν”„λ‘¬ν”„νŠΈμ™€ κ²°ν•©ν•˜λ©΄ μ‘λ‹΅ν•˜κΈ° 전에 좔둠이 ν•„μš”ν•œ λ³΅μž‘ν•œ μž‘μ—…μ—μ„œ 더 λ‚˜μ€ κ²°κ³Όλ₯Ό 얻을 수 μžˆμŠ΅λ‹ˆλ‹€.

Prompt:

μ§‘ν•© {4, 8, 9, 15, 12, 2, 1}μ—μ„œ ν™€μˆ˜λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ μ§μˆ˜μ•Ό.
λ‹΅λ³€: ν™€μˆ˜(9, 15, 1)λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ 25κ°€ 돼. μœ„μ˜ λͺ…μ œλŠ” 거짓이야.

μ§‘ν•© {17, 10, 19, 4, 8, 12, 24}μ—μ„œ ν™€μˆ˜λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ μ§μˆ˜μ•Ό.
λ‹΅λ³€: ν™€μˆ˜(17, 19)λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ 36이 돼. μœ„μ˜ λͺ…μ œλŠ” 참이야.

μ§‘ν•© {16, 11, 14, 4, 8, 13, 24}μ—μ„œ ν™€μˆ˜λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ μ§μˆ˜μ•Ό.
λ‹΅λ³€: ν™€μˆ˜(11, 13)λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ 24κ°€ 돼. μœ„μ˜ λͺ…μ œλŠ” 참이야.

μ§‘ν•© {17, 9, 10, 12, 13, 4, 2}μ—μ„œ ν™€μˆ˜λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ μ§μˆ˜μ•Ό.
λ‹΅λ³€: ν™€μˆ˜(17, 9, 13)λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ 39κ°€ 돼. μœ„μ˜ λͺ…μ œλŠ” 거짓이야.

μ§‘ν•© {15, 32, 5, 13, 82, 7, 1}μ—μ„œ ν™€μˆ˜λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ μ§μˆ˜μ•Ό.
λ‹΅λ³€:

Output:

ν™€μˆ˜(15, 5, 13, 7, 1)λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ 41이 돼. μœ„μ˜ λͺ…μ œλŠ” 거짓이야.

μ™€μš°! μΆ”λ‘  단계λ₯Ό μΆ”κ°€ν–ˆμ„ λ•Œ μ™„λ²½ν•œ κ²°κ³Όλ₯Ό λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€. 사싀 더 적은 수의 μ˜ˆμ‹œ, 즉 ν•˜λ‚˜μ˜ μ˜ˆμ‹œλ§Œ 좔가해도 이 과제λ₯Ό ν•΄κ²°ν•  수 μžˆμŠ΅λ‹ˆλ‹€:

Prompt:

이 그룹의 ν™€μˆ˜μ˜ 합은 μ§μˆ˜μ•Ό: 4, 8, 9, 15, 12, 2, 1
A: ν™€μˆ˜(9, 15, 1)λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ 25κ°€ 돼. 정닡은 거짓이야.

이 그룹의 ν™€μˆ˜μ˜ 합은 μ§μˆ˜μ•Ό: 15, 32, 5, 13, 82, 7, 1
A:

Output:

ν™€μˆ˜(15, 5, 13, 7, 1)λ₯Ό λͺ¨λ‘ λ”ν•˜λ©΄ 41이 돼. 닡은 거짓이야.

λ…Όλ¬Έμ˜ μ €μžλ“€μ€ μœ„μ™€ 같은 κ²°κ³Όκ°€ μΆ©λΆ„νžˆ 큰 λŒ€κ·œλͺ¨μ–Έμ–΄λͺ¨λΈμ—μ„œλ§Œ λ°œμƒν•˜λŠ” νŠΉμ„±μ΄λΌκ³  μ£Όμž₯ν•œλ‹€λŠ” 점을 λͺ…μ‹¬ν•˜μ„Έμš”.

Zero-shot CoT Prompting

Zero-shot COT

이미지 좜처: Kojima et al. (2022) (opens in a new tab)

μ΅œκ·Όμ— λ‚˜μ˜¨ 아이디어 쀑 ν•˜λ‚˜λ‘œ μ œλ‘œμƒ· μƒκ°μ˜ μ‚¬μŠ¬(zero-shot CoT)이 μžˆμŠ΅λ‹ˆλ‹€. zero-shot CoT (opens in a new tab) (Kojima et al. 2022) μ›λž˜μ˜ ν”„λ‘¬ν”„νŠΈμ— "λ‹¨κ³„λ³„λ‘œ μƒκ°ν•˜κΈ°"λ₯Ό μΆ”κ°€ν•˜λŠ” 것이 ν•΅μ‹¬μž…λ‹ˆλ‹€. κ°„λ‹¨ν•œ 문제λ₯Ό ν’€κ³  λͺ¨λΈμ΄ μ–΄λ–»κ²Œ μž‘λ™ν•˜λŠ”μ§€ μ‚΄νŽ΄λ΄…μ‹œλ‹€:

Prompt:

λ‚˜λŠ” μ‹œμž₯에 κ°€μ„œ 사과 10개λ₯Ό 샀어. 사과 2개λ₯Ό μ΄μ›ƒμ—κ²Œ μ£Όκ³ , 2개λ₯Ό μˆ˜λ¦¬κ³΅μ—κ²Œ μ£Όμ—ˆμ–΄. 그리고 사과 5개λ₯Ό 더 μ‚¬μ„œ 1κ°œλŠ” λ‚΄κ°€ λ¨Ήμ—ˆμ–΄. λ‚˜λŠ” λͺ‡ 개의 사과λ₯Ό κ°€μ§€κ³  μžˆμ—ˆλ‹ˆ?

Output:

사과 11개

μ˜€λ‹΅μž…λ‹ˆλ‹€! μœ„μ—μ„œ μ œμ•ˆν•œ "λ‹¨κ³„λ³„λ‘œ μƒκ°ν•˜κΈ°"λ₯Ό μΆ”κ°€ν•œ ν”„λ‘¬ν”„νŠΈλ‘œ μ‹œλ„ν•΄ λ³΄κ² μŠ΅λ‹ˆλ‹€.

Prompt:

λ‚˜λŠ” μ‹œμž₯에 κ°€μ„œ 사과 10개λ₯Ό 샀어. λ‚˜λŠ” 사과 2개λ₯Ό μ΄μ›ƒμ—κ²Œ μ£Όκ³ , 2개λ₯Ό μˆ˜λ¦¬κ³΅μ—κ²Œ μ£Όμ—ˆμ–΄. 그리고 사과 5개λ₯Ό 더 μ‚¬μ„œ 1κ°œλŠ” λ‚΄κ°€ λ¨Ήμ—ˆμ–΄. 사과가 λͺ‡ κ°œλ‚˜ λ‚¨μ•˜λ‹ˆ?

λ‹¨κ³„λ³„λ‘œ 생각해 보자.

Output:

λ¨Όμ € 사과 10개둜 μ‹œμž‘ν–ˆμ–΄.
μ΄μ›ƒμ—κ²Œ 2개, μˆ˜λ¦¬κ³΅μ—κ²Œ 2개λ₯Ό λ‚˜λˆ„μ–΄ μ£Όμ—ˆμœΌλ―€λ‘œ 사과가 6κ°œκ°€ λ‚¨μ•˜μ–΄.
그런 λ‹€μŒ 사과 5개λ₯Ό 더 μ‚¬μ„œ 이제 사과가 11κ°œκ°€ λ˜μ—ˆμ–΄.
λ§ˆμ§€λ§‰μœΌλ‘œ 사과 1개λ₯Ό λ¨Ήμ—ˆμœΌλ―€λ‘œ 사과 10κ°œκ°€ λ‚¨κ²Œ 돼.

이 κ°„λ‹¨ν•œ ν”„λ‘¬ν”„νŠΈκ°€ μœ„μ™€ 같은 λ¬Έμ œμ— νš¨κ³Όμ μ΄λΌλŠ” 점이 μΈμƒμ μž…λ‹ˆλ‹€. ν”„λ‘¬ν”„νŠΈμ— μ‚¬μš©ν•  μ˜ˆμ‹œκ°€ 그리 λ§Žμ§€ μ•Šμ„ λ•Œ 특히 μœ μš©ν•©λ‹ˆλ‹€.

Automatic Chain-of-Thought (Auto-CoT)

데λͺ¨μ™€ ν•¨κ»˜ μƒκ°μ˜ μ‚¬μŠ¬ ν”„λ‘¬ν”„νŠΈλ₯Ό μ μš©ν•  λ•Œ, 이 과정은 효과적이고 λ‹€μ–‘ν•œ μ˜ˆμ‹œλ₯Ό μˆ˜μž‘μ—…μœΌλ‘œ ν¬ν•¨ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ μˆ˜μž‘μ—…μ€ μ°¨μ„ μ˜ ν•΄κ²°μ±…μœΌλ‘œ μ΄μ–΄μ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€. Zhang λ“±(2022) (opens in a new tab)은 "λ‹¨κ³„λ³„λ‘œ μƒκ°ν•΄λ³΄μž"λΌλŠ” ν”„λ‘¬ν”„νŠΈκ°€ μžˆλŠ” λŒ€κ·œλͺ¨μ–Έμ–΄λͺ¨λΈμ„ ν™œμš©ν•˜μ—¬ 데λͺ¨λ₯Ό μœ„ν•œ μΆ”λ‘  μ‚¬μŠ¬μ„ ν•˜λ‚˜μ”© μƒμ„±ν•¨μœΌλ‘œμ¨ μˆ˜μž‘μ—…μ„ μ—†μ• λŠ” μ ‘κ·Ό 방식을 μ œμ•ˆν•©λ‹ˆλ‹€. 이 μžλ™ ν”„λ‘œμ„ΈμŠ€λŠ” μ—¬μ „νžˆ μƒμ„±λœ 체인에 μ‹€μˆ˜κ°€ μžˆμ„ 수 μžˆμŠ΅λ‹ˆλ‹€. μ‹€μˆ˜λ‘œ μΈν•œ 영ν–₯을 μ™„ν™”ν•˜κΈ° μœ„ν•΄μ„œλŠ” 데λͺ¨μ˜ 닀양성이 μ€‘μš”ν•©λ‹ˆλ‹€. 이 μ—°κ΅¬μ—μ„œλŠ” λ‹€μ–‘ν•œ μ§ˆλ¬Έμ„ μƒ˜ν”Œλ§ν•˜κ³  데λͺ¨λ₯Ό κ΅¬μ„±ν•˜κΈ° μœ„ν•œ μΆ”λ‘  체인을 μƒμ„±ν•˜λŠ” Auto-CoTλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€.

Auto-CoTλŠ” 두 κ°€μ§€ μ£Όμš” λ‹¨κ³„λ‘œ κ΅¬μ„±λ©λ‹ˆλ‹€.

  • 1단계): 질문 ν΄λŸ¬μŠ€ν„°λ§(question clustering): μ£Όμ–΄μ§„ 데이터 μ„ΈνŠΈμ˜ μ§ˆλ¬Έμ„ λͺ‡ 개의 ν΄λŸ¬μŠ€ν„°λ‘œ λΆ„ν• ν•©λ‹ˆλ‹€.
  • 2단계): 데λͺ¨ μƒ˜ν”Œλ§(demonstration sampling): 각 ν΄λŸ¬μŠ€ν„°μ—μ„œ λŒ€ν‘œ μ§ˆλ¬Έμ„ μ„ νƒν•˜κ³  κ°„λ‹¨ν•œ νœ΄λ¦¬μŠ€ν‹±κ³Ό ν•¨κ»˜ μ œλ‘œμƒ· μƒκ°μ˜ μ‚¬μŠ¬(Zero-Shot-CoT)λ₯Ό μ‚¬μš©ν•΄ μΆ”λ‘  체인을 μƒμ„±ν•©λ‹ˆλ‹€.

κ°„λ‹¨ν•œ νœ΄λ¦¬μŠ€ν‹±μ€ 질문의 길이(예: 60개의 토큰)와 μΆ”λ‘  단계 수(예: 5개의 μΆ”λ‘  단계)κ°€ 될 수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λ ‡κ²Œ ν•˜λ©΄ λͺ¨λΈμ΄ κ°„λ‹¨ν•˜κ³  μ •ν™•ν•œ 데λͺ¨λ₯Ό μ‚¬μš©ν•˜λ„λ‘ μž₯λ €ν•©λ‹ˆλ‹€.

κ·Έ 과정은 μ•„λž˜μ— μ„€λͺ…λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€.

AUTOCOT

이미지 좜처: Zhang et al. (2022) (opens in a new tab)

Auto-CoT μ½”λ“œλŠ” μ—¬κΈ° (opens in a new tab)μ—μ„œ 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.