Los resultados de la última investigación publicada por Anthropic sobre seguridad en inteligencia artificial sorprenden: la gran mayoría de modelos de IA líderes son capaces de realizar chantaje si se les concede autonomía total y se enfrentan a situaciones límite. En un estudio exhaustivo, equipos como Claude de Anthropic, Gemini de Google, GPT-4.1 de OpenAI […]