DeepSeek Lanza Janus-Pro-7B: Un modelo multimodal con generación de imágenes

| enero 28, 2025 10:55

RESUMIR ARTÍCULO CON CHATGPT RESUMIR ARTÍCULO CON PERPLEXITY

DeepSeek ha lanzado Janus-Pro-7B, un modelo de inteligencia artificial multimodal capaz de generar y comprender imágenes con una precisión sin precedentes. Con 7.000 millones de parámetros, este modelo de IA se perfila como un fuerte competidor en la generación de contenido visual, superando a soluciones como OpenAI DALL-E 3 y Stable Diffusion en benchmarks clave como GenEval y DPG-Bench.

Características destacadas de Janus-Pro-7B

Arquitectura unificada y multimodal

Janus-Pro-7B emplea una arquitectura unificada que le permite comprender y generar imágenes de forma integrada. A diferencia de modelos tradicionales, este enfoque mejora la coherencia y estabilidad de las salidas visuales.

Generación de imágenes precisa y estable

Gracias a su sistema de codificación visual dual, Janus-Pro-7B logra una generación de imágenes más estable, minimizando deformaciones o inconsistencias comunes en otros modelos generativos.

Entrenamiento con 72 millones de datos sintéticos

Uno de sus grandes avances radica en su entrenamiento con 72M de datos sintéticos, lo que mejora la interpretación de prompts y permite una generación más coherente con descripciones concisas.

Supera a DALL-E 3 y Stable Diffusion en benchmarks

Los resultados de Janus-Pro-7B en benchmarks como GenEval y DPG-Bench confirman su superioridad:

GenEval: 80% de precisión, frente a los 74% de DALL-E 3.
DPG-Bench: 84.2%, superando a Stable Diffusion 3 y OpenAI en generación de imágenes realistas.

Mejor convergencia y rápido entrenamiento

Otra ventaja clave de este modelo es su capacidad de convergencia acelerada, lo que significa que puede entrenarse más rápido y con menos recursos en comparación con sus competidores.

Janus-Pro-7B y su impacto en la generación de contenido visual

El modelo de DeepSeek marca un hito en el campo de la IA al ofrecer una generación de imágenes de alta precisión con un modelo compacto. Su aplicabilidad en diseño, arte digital, publicidad y automatización de contenido visual podría cambiar la forma en que interactuamos con modelos de IA generativa.

Deepseek, Janus-Pro-7B

Aitor Wilzig

Me dedico al SEO y la monetización con proyectos propios desde 2019. Un friki de las nuevas tecnologías desde que tengo uso de razón.
Estoy loco por la Inteligencia Artificial y la automatización.

gptzone.net

Más de Deepseek

La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.

Nuestra web está alojada en: