🚀 Master building AI workflows and agents with Claude Code! Use AGENTX20 for 20% off Enroll now →
Directional Stimulus Prompting

Directional Stimulus Prompting

Li et al., (2023) (opens in a new tab) schlagen eine neue Prompting-Technik vor, um den LLM bei der Erzeugung der gewĂĽnschten Zusammenfassung besser zu leiten.

Ein abstimmbarer Policy-LM wird trainiert, um den Stimulus/Hinweis zu generieren. Man sieht einen vermehrten Einsatz von RL, um LLMs zu optimieren.

Die untenstehende Abbildung zeigt, wie sich Directional Stimulus Prompting im Vergleich zum standard Prompting verhält. Der Policy-LM kann klein sein und optimiert werden, um die Hinweise zu generieren, die einen Black-Box gefrorenen LLM leiten.

DSP

Bildquelle: Li et al., (2023) (opens in a new tab)

Ein vollständiges Beispiel folgt in Kürze!