Automatic Prompt Engineer (APE)

μ΄λ―Έμ§ μΆμ²: Zhou et al., (2022) (opens in a new tab)
Zhou et al., (2022) (opens in a new tab)μ λͺ λ Ήμ μλ μμ± λ° μ νμ μν νλ μμν¬μΈ μλ ν둬ννΈ μμ§λμ΄(APE)λ₯Ό μ μν©λλ€. λͺ λ Ή μμ± λ¬Έμ λ LLMμ μ¬μ©νμ¬ μ루μ ν보λ₯Ό μμ±νκ³ κ²μνλ λΈλ λ°μ€ μ΅μ ν λ¬Έμ λ‘ ν΄κ²°λ μμ°μ΄ ν©μ±μΌλ‘ νλ μνλ©λλ€.
첫 λ²μ§Έ λ¨κ³λ μμ μ λν λͺ λ Ήμ΄ ν보λ₯Ό μμ±νκΈ° μν΄ μΆλ ₯ λ°λͺ¨κ° μ 곡λλ ν° μΈμ΄ λͺ¨λΈ(μΈν°νμ΄μ€ λͺ¨λΈ)μ ν¬ν¨ν©λλ€. μ΄λ¬ν ν보 μ루μ μ΄ κ²μ μ μ°¨λ₯Ό μλ΄ν©λλ€. λμ λͺ¨λΈμ μ¬μ©νμ¬ λͺ λ Ήμ μ€νν λ€μ κ³μ°λ νκ° μ μλ₯Ό κΈ°μ€μΌλ‘ κ°μ₯ μ ν©ν λͺ λ Ήμ μ νν©λλ€.
APEλ μ¬λμ΄ μ€κ³ν "λ¨κ³λ³λ‘ μκ°νμ" ν둬ννΈλ³΄λ€ λ μ°μν zero-shot CoT ν둬ννΈλ₯Ό μ°Ύμλμ΅λλ€. (Kojima et al., 2022 (opens in a new tab)).
"μ°λ¦¬κ° μ¬λ°λ₯Έ λ΅μ κ°μ§κ³ μλμ§ νμΈνκΈ° μν΄ λ¨κ³μ μΌλ‘ μ΄ λ¬Έμ λ₯Ό ν΄κ²°ν©μλ€."λΌλ ν둬ννΈλ μΌλ ¨μ μΆλ‘ μ μ΄λμ΄ λ΄κ³ MultiArith λ° GSM8K λ²€μΉλ§ν¬μμ μ±λ₯μ ν₯μμν΅λλ€:

μ΄λ―Έμ§ μΆμ²: Zhou et al., (2022) (opens in a new tab)
μ΄ λ Όλ¬Έμμλ ν둬ννΈλ₯Ό μλμΌλ‘ μ΅μ ννλ μμ΄λμ΄μΈ ν둬ννΈ μμ§λμ΄λ§κ³Ό κ΄λ ¨λ μ€μν μ£Όμ λ₯Ό λ€λ£Ήλλ€. μ°λ¦¬λ μ΄ μ£Όμ μ λν΄ λ μμΈν μ€λͺ νμ§λ μμ§λ§, κ΄μ¬μ΄ μλ κ²½μ° λͺ κ°μ§ μ£Όμ λ¬Έμλ₯Ό μ°Έμ‘°νμΈμ:
- AutoPrompt (opens in a new tab) - κ²½μ¬ μ λ κ²μ(gradient-guided search)μ κΈ°λ°νμ¬ μλμΌλ‘ μμ±νλ ν둬ννΈμ λ€μν λ°©λ²μ μ μ.
- Prefix Tuning (opens in a new tab) - NLG μμ μ λν΄ νμ΅ κ°λ₯ν μ°μ μ λμ¬λ₯Ό μΆκ°νλ λ―ΈμΈ μ‘°μ μ λν κ°λ²Όμ΄ λμ.
- Prompt Tuning (opens in a new tab) - μμ νλ₯Ό ν΅ν΄ μννΈ ν둬ννΈλ₯Ό νμ΅νλ 맀컀λμ¦μ μ μ.