Anthropic identifica tres cambios a nivel de producto detrás de la caída de la calidad de Claude Code, no un problema del modelo

Mensaje de Gate News, 23 de abril — El equipo de ingeniería de Anthropic confirmó que la degradación de la calidad de Claude Code reportada por los usuarios durante el mes pasado se debió a tres cambios independientes a nivel de producto, no a problemas de la API ni del modelo subyacente. Los tres problemas se solucionaron el 7 de abril, el 10 de abril y el 20 de abril, respectivamente, con la versión final ahora en v2.1.116.

El primer cambio ocurrió el 4 de marzo, cuando el equipo redujo el nivel de esfuerzo de razonamiento predeterminado para Claude Code de “high” a “medium” para abordar picos ocasionales de latencia extrema en Opus 4.6 bajo alta intensidad de razonamiento. Después de quejas generalizadas de los usuarios sobre el rendimiento reducido, el equipo revirtió el cambio el 7 de abril. El valor predeterminado actual es ahora “xhigh” para Opus 4.7 y “high” para otros modelos.

El segundo problema fue un bug introducido el 26 de marzo. El sistema estaba diseñado para borrar registros antiguos de razonamiento después de que la inactividad de la conversación superara una hora para reducir los costos de recuperación de sesión. Sin embargo, una falla en la implementación hizo que el borrado se ejecutara repetidamente en cada turno posterior en lugar de una sola vez, lo que provocó que el modelo perdiera progresivamente el contexto de razonamiento previo. Esto se manifestó como un aumento de la falta de memoria, operaciones repetidas e invocaciones anómalas de herramientas. El bug también provocó fallos de caché en cada solicitud, acelerando el consumo de la cuota de los usuarios. Dos experimentos internos no relacionados enmascararon las condiciones de reproducción, extendiendo el proceso de depuración a más de una semana. Después de la corrección el 10 de abril, el equipo revisó el código problemático usando Opus 4.7 y descubrió que Opus 4.7 podía identificar el bug, mientras que Opus 4.6 no.

El tercer cambio se lanzó el 16 de abril junto con Opus 4.7. El equipo agregó instrucciones al mensaje del sistema para reducir la salida redundante. Las pruebas internas durante varias semanas no mostraron regresión, pero después del lanzamiento la interacción con otros prompts degradó la calidad de la codificación. La evaluación extendida reveló una caída del 3% en el rendimiento tanto en Opus 4.6 como en 4.7, lo que llevó a un rollback el 20 de abril.

Estos tres cambios afectaron a diferentes grupos de usuarios en distintos momentos, y su efecto combinado creó una caída generalizada e inconsistente de la calidad, complicando el diagnóstico. Anthropic afirmó que ahora requerirá a más empleados internos que usen la misma versión pública de compilación que los usuarios, que ejecuten suites completas de evaluación del modelo para cada modificación del prompt del sistema y que implementen periodos de despliegue por etapas. Como compensación, Anthropic ha restablecido las cuotas de uso para todos los usuarios con suscripción.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Freshworks recorta 500 empleos en una reestructuración impulsada por IA

Freshworks, una empresa de software de gestión empresarial con sede en San Mateo, California, anunció el 5 de mayo que reducirá el 11% de su plantilla, o aproximadamente 500 empleos a nivel global, mientras reestructura sus operaciones en torno al uso más amplio de la IA y la automatización. El director ejecutivo Dennis Woodside afirmó que la IA ya escribe más de la mitad del contenido de la compañía.

CryptoFrontierHace7m

OpenAI Lanza GPT-5.5 Instant para todos los usuarios de ChatGPT a partir de hoy

Según el anuncio de OpenAI del 6 de mayo, GPT-5.5 Instant ya está disponible para todos los usuarios de ChatGPT. Para los usuarios de pago, GPT-5.3 Instant seguirá accesible a través de la configuración de modelos durante los próximos tres meses antes de retirarse. La función de memoria se está implementando para todos los usuarios del plan de consumo de ChatGPT en th

GateNewsHace13m

Google prueba el agente de IA «Remy» para Gemini, rivales abren OpenClaw

Según Business Insider, Google está probando un nuevo agente de IA llamado Remy para Gemini el 6 de mayo. El agente, que actualmente solo está disponible para empleados dentro de la aplicación interna Gemini de Google, puede realizar acciones en nombre de los usuarios en el trabajo, el aprendizaje y las tareas diarias, mientras se integra con los demás de Google

GateNewsHace15m

Meta planea un asistente de IA impulsado por el modelo Muse Spark para competir con OpenClaw por 3 mil millones de usuarios el 6 de mayo

Según Financial Times, Meta está construyendo un asistente de IA altamente personalizado el 6 de mayo para competir con OpenClaw, impulsado por su nuevo modelo Muse Spark. La herramienta servirá a los más de 3 mil millones de usuarios de la compañía y actualmente está en pruebas internas. El asistente tiene como objetivo permitir que los usuarios creen IA

GateNewsHace15m

Alphabet se acerca a la capitalización de mercado de Nvidia con 4,67 billones de dólares, un 24% más este año

Según Reuters, a 6 de mayo, Alphabet tenía un valor aproximado de 4,67 billones de dólares, acercándose a los 4,79 billones de dólares de Nvidia, mientras los inversores respaldan su estrategia de IA y un crecimiento más rápido de su nube. Las acciones de Alphabet han subido un 24% este año, frente al avance del 7% de Nvidia. Los ingresos de Google Cloud se dispararon un 63% en

GateNewsHace28m

Cloudflare: los agentes de IA impulsan el tráfico no humano, x402 ofrece una solución

El director de Estrategia de Cloudflare afirmó que más de la mitad del tráfico de internet ya no es de humanos, lo que pone de relieve un cambio significativo en los patrones de uso de la web impulsado por agentes de IA y sistemas automatizados. El ejecutivo sugirió que la Fundación x402 está construyendo infraestructura para hacer frente a los desafíos

CryptoFrontierhace2h
Comentar
0/400
Sin comentarios