Chain-of-Thought Prompting
Chain-of-Thought (CoT) Prompting

μ΄λ―Έμ§ μΆμ²: Wei et al. (2022) (opens in a new tab)
Wei et al. (2022) (opens in a new tab)μμ μκ°λ μκ°μ μ¬μ¬(chain-of-thought, CoT) ν둬ννΈλ μ€κ° μΆλ‘ λ¨κ³λ₯Ό ν΅ν΄ 볡μ‘ν μΆλ‘ μ κ°λ₯νκ² ν©λλ€. μ΄λ₯Ό λ¨λ΅ν ν둬ννΈμ κ²°ν©νλ©΄ μλ΅νκΈ° μ μ μΆλ‘ μ΄ νμν 볡μ‘ν μμ μμ λ λμ κ²°κ³Όλ₯Ό μ»μ μ μμ΅λλ€.
Prompt:
μ§ν© {4, 8, 9, 15, 12, 2, 1}μμ νμλ₯Ό λͺ¨λ λνλ©΄ μ§μμΌ.
λ΅λ³: νμ(9, 15, 1)λ₯Ό λͺ¨λ λνλ©΄ 25κ° λΌ. μμ λͺ
μ λ κ±°μ§μ΄μΌ.
μ§ν© {17, 10, 19, 4, 8, 12, 24}μμ νμλ₯Ό λͺ¨λ λνλ©΄ μ§μμΌ.
λ΅λ³: νμ(17, 19)λ₯Ό λͺ¨λ λνλ©΄ 36μ΄ λΌ. μμ λͺ
μ λ μ°Έμ΄μΌ.
μ§ν© {16, 11, 14, 4, 8, 13, 24}μμ νμλ₯Ό λͺ¨λ λνλ©΄ μ§μμΌ.
λ΅λ³: νμ(11, 13)λ₯Ό λͺ¨λ λνλ©΄ 24κ° λΌ. μμ λͺ
μ λ μ°Έμ΄μΌ.
μ§ν© {17, 9, 10, 12, 13, 4, 2}μμ νμλ₯Ό λͺ¨λ λνλ©΄ μ§μμΌ.
λ΅λ³: νμ(17, 9, 13)λ₯Ό λͺ¨λ λνλ©΄ 39κ° λΌ. μμ λͺ
μ λ κ±°μ§μ΄μΌ.
μ§ν© {15, 32, 5, 13, 82, 7, 1}μμ νμλ₯Ό λͺ¨λ λνλ©΄ μ§μμΌ.
λ΅λ³:
Output:
νμ(15, 5, 13, 7, 1)λ₯Ό λͺ¨λ λνλ©΄ 41μ΄ λΌ. μμ λͺ
μ λ κ±°μ§μ΄μΌ.
μμ°! μΆλ‘ λ¨κ³λ₯Ό μΆκ°νμ λ μλ²½ν κ²°κ³Όλ₯Ό λ³Ό μ μμ΅λλ€. μ¬μ€ λ μ μ μμ μμ, μ¦ νλμ μμλ§ μΆκ°ν΄λ μ΄ κ³Όμ λ₯Ό ν΄κ²°ν μ μμ΅λλ€:
Prompt:
μ΄ κ·Έλ£Ήμ νμμ ν©μ μ§μμΌ: 4, 8, 9, 15, 12, 2, 1
A: νμ(9, 15, 1)λ₯Ό λͺ¨λ λνλ©΄ 25κ° λΌ. μ λ΅μ κ±°μ§μ΄μΌ.
μ΄ κ·Έλ£Ήμ νμμ ν©μ μ§μμΌ: 15, 32, 5, 13, 82, 7, 1
A:
Output:
νμ(15, 5, 13, 7, 1)λ₯Ό λͺ¨λ λνλ©΄ 41μ΄ λΌ. λ΅μ κ±°μ§μ΄μΌ.
λ Όλ¬Έμ μ μλ€μ μμ κ°μ κ²°κ³Όκ° μΆ©λΆν ν° λκ·λͺ¨μΈμ΄λͺ¨λΈμμλ§ λ°μνλ νΉμ±μ΄λΌκ³ μ£Όμ₯νλ€λ μ μ λͺ μ¬νμΈμ.
Zero-shot CoT Prompting

μ΄λ―Έμ§ μΆμ²: Kojima et al. (2022) (opens in a new tab)
μ΅κ·Όμ λμ¨ μμ΄λμ΄ μ€ νλλ‘ μ λ‘μ· μκ°μ μ¬μ¬(zero-shot CoT)μ΄ μμ΅λλ€. zero-shot CoT (opens in a new tab) (Kojima et al. 2022) μλμ ν둬ννΈμ "λ¨κ³λ³λ‘ μκ°νκΈ°"λ₯Ό μΆκ°νλ κ²μ΄ ν΅μ¬μ λλ€. κ°λ¨ν λ¬Έμ λ₯Ό νκ³ λͺ¨λΈμ΄ μ΄λ»κ² μλνλμ§ μ΄ν΄λ΄ μλ€:
Prompt:
λλ μμ₯μ κ°μ μ¬κ³Ό 10κ°λ₯Ό μμ΄. μ¬κ³Ό 2κ°λ₯Ό μ΄μμκ² μ£Όκ³ , 2κ°λ₯Ό μ리곡μκ² μ£Όμμ΄. κ·Έλ¦¬κ³ μ¬κ³Ό 5κ°λ₯Ό λ μ¬μ 1κ°λ λ΄κ° λ¨Ήμμ΄. λλ λͺ κ°μ μ¬κ³Όλ₯Ό κ°μ§κ³ μμλ?
Output:
μ¬κ³Ό 11κ°
μ€λ΅μ λλ€! μμμ μ μν "λ¨κ³λ³λ‘ μκ°νκΈ°"λ₯Ό μΆκ°ν ν둬ννΈλ‘ μλν΄ λ³΄κ² μ΅λλ€.
Prompt:
λλ μμ₯μ κ°μ μ¬κ³Ό 10κ°λ₯Ό μμ΄. λλ μ¬κ³Ό 2κ°λ₯Ό μ΄μμκ² μ£Όκ³ , 2κ°λ₯Ό μ리곡μκ² μ£Όμμ΄. κ·Έλ¦¬κ³ μ¬κ³Ό 5κ°λ₯Ό λ μ¬μ 1κ°λ λ΄κ° λ¨Ήμμ΄. μ¬κ³Όκ° λͺ κ°λ λ¨μλ?
λ¨κ³λ³λ‘ μκ°ν΄ 보μ.
Output:
λ¨Όμ μ¬κ³Ό 10κ°λ‘ μμνμ΄.
μ΄μμκ² 2κ°, μ리곡μκ² 2κ°λ₯Ό λλμ΄ μ£ΌμμΌλ―λ‘ μ¬κ³Όκ° 6κ°κ° λ¨μμ΄.
κ·Έλ° λ€μ μ¬κ³Ό 5κ°λ₯Ό λ μ¬μ μ΄μ μ¬κ³Όκ° 11κ°κ° λμμ΄.
λ§μ§λ§μΌλ‘ μ¬κ³Ό 1κ°λ₯Ό λ¨ΉμμΌλ―λ‘ μ¬κ³Ό 10κ°κ° λ¨κ² λΌ.
μ΄ κ°λ¨ν ν둬ννΈκ° μμ κ°μ λ¬Έμ μ ν¨κ³Όμ μ΄λΌλ μ μ΄ μΈμμ μ λλ€. ν둬ννΈμ μ¬μ©ν μμκ° κ·Έλ¦¬ λ§μ§ μμ λ νΉν μ μ©ν©λλ€.
Automatic Chain-of-Thought (Auto-CoT)
λ°λͺ¨μ ν¨κ» μκ°μ μ¬μ¬ ν둬ννΈλ₯Ό μ μ©ν λ, μ΄ κ³Όμ μ ν¨κ³Όμ μ΄κ³ λ€μν μμλ₯Ό μμμ μΌλ‘ ν¬ν¨ν©λλ€. μ΄λ¬ν μμμ μ μ°¨μ μ ν΄κ²°μ± μΌλ‘ μ΄μ΄μ§ μ μμ΅λλ€. Zhang λ±(2022) (opens in a new tab)μ "λ¨κ³λ³λ‘ μκ°ν΄λ³΄μ"λΌλ ν둬ννΈκ° μλ λκ·λͺ¨μΈμ΄λͺ¨λΈμ νμ©νμ¬ λ°λͺ¨λ₯Ό μν μΆλ‘ μ¬μ¬μ νλμ© μμ±ν¨μΌλ‘μ¨ μμμ μ μμ λ μ κ·Ό λ°©μμ μ μν©λλ€. μ΄ μλ νλ‘μΈμ€λ μ¬μ ν μμ±λ 체μΈμ μ€μκ° μμ μ μμ΅λλ€. μ€μλ‘ μΈν μν₯μ μννκΈ° μν΄μλ λ°λͺ¨μ λ€μμ±μ΄ μ€μν©λλ€. μ΄ μ°κ΅¬μμλ λ€μν μ§λ¬Έμ μνλ§νκ³ λ°λͺ¨λ₯Ό ꡬμ±νκΈ° μν μΆλ‘ 체μΈμ μμ±νλ Auto-CoTλ₯Ό μ μν©λλ€.
Auto-CoTλ λ κ°μ§ μ£Όμ λ¨κ³λ‘ ꡬμ±λ©λλ€.
- 1λ¨κ³): μ§λ¬Έ ν΄λ¬μ€ν°λ§(question clustering): μ£Όμ΄μ§ λ°μ΄ν° μΈνΈμ μ§λ¬Έμ λͺ κ°μ ν΄λ¬μ€ν°λ‘ λΆν ν©λλ€.
- 2λ¨κ³): λ°λͺ¨ μνλ§(demonstration sampling): κ° ν΄λ¬μ€ν°μμ λν μ§λ¬Έμ μ ννκ³ κ°λ¨ν ν΄λ¦¬μ€ν±κ³Ό ν¨κ» μ λ‘μ· μκ°μ μ¬μ¬(Zero-Shot-CoT)λ₯Ό μ¬μ©ν΄ μΆλ‘ 체μΈμ μμ±ν©λλ€.
κ°λ¨ν ν΄λ¦¬μ€ν±μ μ§λ¬Έμ κΈΈμ΄(μ: 60κ°μ ν ν°)μ μΆλ‘ λ¨κ³ μ(μ: 5κ°μ μΆλ‘ λ¨κ³)κ° λ μ μμ΅λλ€. μ΄λ κ² νλ©΄ λͺ¨λΈμ΄ κ°λ¨νκ³ μ νν λ°λͺ¨λ₯Ό μ¬μ©νλλ‘ μ₯λ €ν©λλ€.
κ·Έ κ³Όμ μ μλμ μ€λͺ λμ΄ μμ΅λλ€.

μ΄λ―Έμ§ μΆμ²: Zhang et al. (2022) (opens in a new tab)
Auto-CoT μ½λλ μ¬κΈ° (opens in a new tab)μμ νμΈν μ μμ΅λλ€.