Autoconsistencia
Quizás una de las técnicas más avanzadas para la ingenierÃa de consignas es la autoconsistencia. Propuesta por Wang et al. (2022) (opens in a new tab), la autoconsistencia tiene como objetivo "reemplazar la decodificación codiciosa ingenua utilizada en la generación de cadenas de pensamiento". La idea es muestrear múltiples caminos de razonamiento diversos a través de pocos ejemplos de la generación de cadenas de pensamiento, y usar las generaciones para seleccionar la respuesta más consistente. Esto ayuda a mejorar el rendimiento de la generación de cadenas de pensamiento en tareas que implican razonamiento aritmético y sentido común.
Probemos el siguiente ejemplo para el razonamiento aritmético:
Prompt:
Cuando tenÃa 6 años, mi hermana tenÃa la mitad de mi edad. Ahora tengo 70 años,
¿cuántos años tiene mi hermana?
Salida:
35
¡La respuesta es incorrecta! ¿Cómo podemos mejorar esto con autoconsistencia? Vamos a probarlo. Usaremos los pocos ejemplos del artÃculo de Wang et al. 2022 (Tabla 17):
Prompt:
P: Hay 15 árboles en el bosque. Los trabajadores plantarán árboles en el bosque hoy.
Después de que terminen, habrá 21 árboles. ¿Cuántos árboles plantaron los trabajadores
del bosque hoy?
R: Comenzamos con 15 árboles. Luego tenemos 21 árboles. La diferencia debe ser el
número de árboles que plantaron. Por lo tanto, deben haber plantado 21 - 15 = 6 árboles.
La respuesta es 6.
P: Si hay 3 autos en el estacionamiento y llegan 2 autos más, ¿cuántos autos hay
en el estacionamiento?
R: Ya hay 3 autos en el estacionamiento. Llegan 2 más. Ahora hay 3 + 2 = 5 autos.
La respuesta es 5.
P: Leah tenÃa 32 chocolates y su hermana tenÃa 42. Si se comieron 35, ¿cuántas piezas
les quedan en total?
R: Leah tenÃa 32 chocolates y la hermana de Leah tenÃa 42. Eso significa que originalmente
habÃa 32 + 42 = 74 chocolates. Se han comido 35. Asà que en total todavÃa tienen 74 - 35 = 39
chocolates. La respuesta es 39.
P: Jason tenÃa 20 piruletas. Le dio algunas piruletas a Denny. Ahora Jason tiene 12
piruletas. ¿Cuántas piruletas le dio Jason a Denny?
R: Jason tenÃa 20 piruletas. Como ahora solo tiene 12, debe haberle dado el resto a
Denny. El número de piruletas que le dio a Denny debe haber sido 20 - 12 = 8 piruletas.
La respuesta es 8.
P: Shawn tiene cinco juguetes. Para Navidad, recibió dos juguetes de su mamá y dos
de su papá. ¿Cuántos juguetes tiene ahora?
R: Él tiene 5 juguetes. Recibió 2 de su mamá, asà que después de eso tiene 5 + 2 = 7
juguetes. Luego recibió 2 más de su papá, por lo que en total tiene 7 + 2 = 9 juguetes.
La respuesta es 9.
P: HabÃa nueve ordenadores en la sala del servidor. Se instalaron cinco ordenadores
más cada dÃa, de lunes a jueves. ¿Cuántos ordenadores hay ahora en la sala del servidor?
R: Hay 4 dÃas de lunes a jueves. Se agregaron 5 ordenadores cada dÃa. Eso significa que
en total se agregaron 4 * 5 = 20 ordenadores. HabÃa 9 ordenadores al principio, por lo
que ahora hay 9 + 20 = 29 ordenadores. La respuesta es 29.
P: Michael tenÃa 58 bolas de golf. El martes, perdió 23 bolas de golf. El miércoles,
perdió 2 más. ¿Cuántas bolas de golf tenÃa al final del miércoles?
R: Michael inicialmente tenÃa 58 bolas. Perdió 23 el martes, asà que después de eso tiene
58 - 23 = 35 bolas. El miércoles perdió 2 más, por lo que ahora tiene 35 - 2 = 33 bolas.
La respuesta es 33.
P: Olivia tiene $23. Compró cinco bagels por $3 cada uno. ¿Cuánto dinero le queda?
R: Compró 5 bagels por $3 cada uno. Esto significa que gastó 5 * 3 = $15. Por lo tanto,
le quedan $23 - $15 = $8.
P: Cuando tenÃa 6 años, mi hermana tenÃa la mitad de mi edad. Ahora tengo 70 años,
¿cuántos años tiene mi hermana?
R:
Salida 1:
Cuando tenÃa 6 años, mi hermana tenÃa la mitad de mi edad, por lo que tenÃa 3 años.
Ahora tengo 70 años, por lo que ella tiene 70 - 3 = 67 años. La respuesta es 67.
Salida 2:
Cuando el narrador tenÃa 6 años, su hermana tenÃa la mitad de su edad, que son 3 años.
Ahora que el narrador tiene 70 años, su hermana tendrÃa 70 - 3 = 67 años. La respuesta es 67.
Salida 3:
Cuando tenÃa 6 años, mi hermana tenÃa la mitad de mi edad, por lo que tenÃa 3 años.
Ahora tengo 70 años, por lo que ella tiene 70/2 = 35 años. La respuesta es 35.
Realizar el cálculo para obtener la respuesta final implica algunos pasos (consulte el documento para obtener detalles), pero por simplicidad, podemos ver que ya está emergiendo una respuesta mayoritaria que esencialmente se convierte en la respuesta final.