ArXiv cs.AI
Visión editorial CMadrid
Cobertura genérica de expertos para podar modelos de lenguaje dispersos de mezcla de expertos
arXiv:2607.01710v1 Tipo de anuncio: nuevo Resumen: Los modelos de lenguaje de mezcla de expertos (MoE) escasamente activados contienen una redundancia estructurada sustancial entre los expertos enrutados, pero podarlos sin datos de calibración posteriores sigue siendo un desafío. Los métodos de poda de expertos existentes generalmente se basan en una única puntuación de importancia agregada, lo que puede sesgar la retención.
Por qué importa para Chile y Latam
Lectura CMadrid: esta señal es relevante para equipos en Chile porque puede impactar cumplimiento, respuesta a incidentes y continuidad operativa.
Leer fuente original Volver al inicio
Como Afiliados de Amazon, podemos recibir comisiones por compras calificadas sin costo extra para ti.