¿Buscas bajar el precio de tus llamadas a la API cuando cargas documentos largos? DeepSeek acaba de presentar un modelo que quiere cambiar ese cálculo. Te contamos qué hay detrás de su propuesta, cómo funciona la nueva atención dispersa y por qué podrías recortar costes de inferencia sin tocar la calidad del resultado. La idea […]