Cobertura genérica de expertos para podar modelos de lenguaje dispersos de mezcla de expertos

03-07-2026 04:00 UTC

arXiv:2607.01710v1 Tipo de anuncio: nuevo Resumen: Los modelos de lenguaje de mezcla de expertos (MoE) escasamente activados contienen una redundancia estructurada sustancial entre los expertos enrutados, pero podarlos sin datos de calibración posteriores sigue siendo un desafío. Los métodos de poda de expertos existentes generalmente se basan en una única puntuación de importancia agregada, lo que puede sesgar la retención.

Por qué importa para Chile y Latam

Lectura CMadrid: esta señal es relevante para equipos en Chile porque puede impactar cumplimiento, respuesta a incidentes y continuidad operativa.

Leer fuente original Volver al inicio

Como Afiliados de Amazon, podemos recibir comisiones por compras calificadas sin costo extra para ti.