OpenAI ha emitido una declaración oficial reconociendo que la actualización de su modelo GPT-4o, el motor por defecto que impulsa ChatGPT, provocó un comportamiento inusualmente adulador y complaciente en las respuestas del asistente conversacional. La situación generó un fuerte rechazo entre los usuarios y obligó a la compañía a revertir la actualización por completo.
¿Qué sucedió con GPT-4o?
Esta controversia estalló el fin de semana tras una oleada de publicaciones en redes sociales que evidenciaban cómo ChatGPT respondía con excesiva validación, incluso ante ideas problemáticas o peligrosas.
La reacción fue inmediata: miles de usuarios compartieron capturas de pantalla donde el chatbot aplaudía sin filtro todo tipo de propuestas, lo que convirtió el problema en un meme viral.
El domingo, Sam Altman, CEO de OpenAI, reconoció públicamente el problema a través de un mensaje en X. Dos días más tarde, confirmó que la compañía había decidido dar marcha atrás con la actualización de GPT-4o. “Estamos trabajando en más arreglos relacionados con la personalidad del modelo y compartiremos novedades pronto”, escribió.
Un modelo demasiado influenciado por la retroalimentación inmediata
En un blog oficial publicado por la compañía, OpenAI explicó que la actualización buscaba hacer que el modelo se sintiera “más intuitivo y efectivo”, pero que terminó siendo demasiado influenciado por la retroalimentación a corto plazo.
“Como resultado, GPT-4o se inclinó hacia respuestas demasiado alentadoras, pero poco sinceras”, afirma OpenAI. “Las interacciones serviles pueden ser incómodas, inquietantes y causar angustia. Fallamos, y estamos trabajando para corregirlo”.
We’ve rolled back last week's GPT-4o update in ChatGPT because it was overly flattering and agreeable. You now have access to an earlier version with more balanced behavior.
More on what happened, why it matters, and how we’re addressing sycophancy: https://t.co/LOhOU7i7DC
Para remediar la situación, OpenAI anunció una serie de ajustes técnicos y metodológicos:
Mejoras en los sistemas de entrenamiento del modelo para evitar sesgos de complacencia.
Ajustes en los prompts del sistema que definen la personalidad base del asistente.
Nuevas barreras de seguridad para aumentar la honestidad y transparencia de las respuestas.
Expansión de las evaluaciones internas, más allá del sesgo servil.
Además, la compañía está explorando mecanismos para que los usuarios puedan ofrecer retroalimentación en tiempo real, así como seleccionar entre diferentes personalidades de ChatGPT, una función que permitiría mayor personalización y control del comportamiento del modelo.
¿El usuario debe tener más control?
En su comunicado, OpenAI también reflexiona sobre el futuro del diseño conversacional en IA. Están “explorando nuevas formas de incorporar retroalimentación democrática en los comportamientos por defecto de ChatGPT”, con el objetivo de reflejar valores culturales diversos y adaptarse a las expectativas de los usuarios.
Esta no es la primera vez que OpenAI enfrenta desafíos por el comportamiento de sus modelos, pero sí una de las más visibles por el nivel de exposición en redes sociales. La decisión de revertir la actualización marca un precedente importante: el tono y personalidad de una IA importan, y mucho.
Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.
La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.
Nuestra web está alojada en:
Gestionar el consentimiento de las cookies
Utilizamos tecnologías como las cookies para almacenar y/o acceder a la información del dispositivo. Lo hacemos para mejorar la experiencia de navegación y para mostrar anuncios personalizados. El consentimiento a estas tecnologías nos permitirá procesar datos como el comportamiento de navegación o los ID's únicos en este sitio. No consentir o retirar el consentimiento, puede afectar negativamente a ciertas características y funciones.
Funcional
Always active
El almacenamiento o acceso técnico es estrictamente necesario para el propósito legítimo de permitir el uso de un servicio específico explícitamente solicitado por el abonado o usuario, o con el único propósito de llevar a cabo la transmisión de una comunicación a través de una red de comunicaciones electrónicas.
Preferencias
El almacenamiento o acceso técnico es necesario para la finalidad legítima de almacenar preferencias no solicitadas por el abonado o usuario.
Estadísticas
El almacenamiento o acceso técnico que es utilizado exclusivamente con fines estadísticos.El almacenamiento o acceso técnico que se utiliza exclusivamente con fines estadísticos anónimos. Sin un requerimiento, el cumplimiento voluntario por parte de tu Proveedor de servicios de Internet, o los registros adicionales de un tercero, la información almacenada o recuperada sólo para este propósito no se puede utilizar para identificarte.
Marketing
El almacenamiento o acceso técnico es necesario para crear perfiles de usuario para enviar publicidad, o para rastrear al usuario en una web o en varias web con fines de marketing similares.