Estabilidad versus manipulabilidad: evaluación de la robustez en la interacción posterior a la decisión en jueces de LLM

05-06-2026 04:00 UTC

arXiv:2606.05384v1 Tipo de anuncio: nuevo Resumen: La evaluación de LLM como juez se usa ampliamente en procesos de evaluación comparativa, donde los resultados del modelo se comparan y clasifican mediante evaluadores automatizados. Estos procesos normalmente suponen que los juicios son propiedades estables de entradas fijas. Mostramos que este supuesto no se cumple bajo interacción. Estudiamos post-decisión ma

Por qué importa para Chile y Latam

Lectura CMadrid: la robótica está acelerando adopción en industria y logística; en Chile/Latam esto abre oportunidades de productividad y reconversión de talento.

Leer fuente original Volver al inicio

Como Afiliados de Amazon, podemos recibir comisiones por compras calificadas sin costo extra para ti.