La inferencia eficiente de la IA se ha convertido en el mayor reto para la adopción masiva de sistemas de IA a gran escala. Si hace solo un par de años lo más complicado era entrenar modelos cada vez más grandes, hoy el verdadero cuello de botella es el coste y la velocidad al ponerlos […]