OpenAIMattelJonathan RinderknechtNeural VizNintendoAgentes IABuilder.aiSora 2ChatGPTGoogle Modo IAGoogleClaudeAnthropicIA / Inteligencia ArtificialLanding AI

Nació Como Experimento en una Startup y Hoy su IA Analiza Documentos que Confunden hasta a los Directivos

 | octubre 9, 2025 05:39

La firma de Andrew Ng, Landing AI, presenta ADE DPT-2, un sistema de extracción y comprensión diseñado para documentos reales de empresa, con sellos, firmas y tablas torcidas. Los LLM ayudan en tareas generales, pero tienden a fallar cuando el archivo llega escaneado en ángulo, con casillas marcadas a mano y varias versiones del mismo dato. Aquí es donde entra el razonamiento agente.

La propuesta no busca “hacer más grande” un modelo universal, sino dividir el documento en subpartes, razonar sobre cada bloque y reconstruir el contexto. Ese flujo agentístico se parece a cómo revisarías un expediente: localizas la tabla, interpretas las celdas fusionadas, verificas un sello y rastreas el número hasta su origen. Y ahí estaba el detalle pendiente: el seguimiento de cada valor, trazable y justificable.

¿Por qué importa esto hoy? Porque los datos críticos suelen esconderse en diseños poco estándar y eso provoca errores y demoras, desde retrasos en préstamos hasta riesgos en diagnósticos. Según Dan Maloney, CEO de Landing AI, la inteligencia documental ya no es un “parche”, es una capacidad central gracias al salto en razonamiento agente. Y si llevas cumplimiento normativo, lo vas a notar en auditorías reales.

En capacidades, ADE DPT-2 interpreta tablas sin cuadrículas, reconstruye celdas fusionadas y rastrea números hasta su fuente. Reconoce logotipos, sellos pequeños, firmas manuscritas, casillas, códigos de barras, códigos QR y credenciales.

También descarta ruido, algo clave cuando una página mezcla rótulos publicitarios y datos de valor. Con todo, la pieza determinante es la detección precisa de diseño, que ayuda a identificar sellos dentro de tablas ligadas a cumplimiento.

Qué aporta la inteligencia documental de ADE DPT-2 en finanzas, salud y seguros

Hay cifras que ponen el listón: la infraestructura de ADE escala en horizontal con GPU y soporta picos de millones de páginas al día sin degradar el rendimiento. Los primeros usuarios reportan ahorros de tiempo de hasta un 90 % al buscar información dentro de documentos. La compañía insiste en que no sustituye a todo, convive con LLM generales y con RAG, y ahí suma.

Si trabajas en banca, vas a poder acelerar aprobaciones de préstamos porque extrae y valida contratos de forma automática y trazable. En salud, captura con precisión formularios de pacientes e informes de laboratorio, algo sensible cuando el origen es un escaneo irregular. En seguros, procesa reclamaciones manuscritas o selladas manteniendo el contexto, sin “inventar” campos.

Para un CEO, el movimiento es claro: ciclos más rápidos, menos riesgos regulatorios y más rigor en el cumplimiento. ADE se coloca como una capa de inteligencia dentro de plataformas HealthTech y FinTech, así que mejora la incorporación de clientes, la precisión de informes y la garantía de cumplimiento en los sistemas que ya usas.

Cómo funciona ADE DPT-2 para extraer datos de documentos no estructurados

El sistema aplica flujos agentísticos que primero entienden el diseño y luego razonan sobre cada bloque. Esto permite, por ejemplo, detectar un sello dentro de una tabla de impuestos y vincularlo al campo correcto. Si lo comparamos con la app móvil de un escáner, aquí vas a poder reconstruir celdas fusionadas y seguir cada número hasta la página exacta donde aparece.

Integración no falta. ADE se conecta con ServiceNow, Snowflake y SAP, de modo que gestionas los datos extraídos en tus sistemas de registro sin mover a mano. La API Parse convierte documentos en markdown estructurado y fragmentos semánticos, y la API Extract extrae campos según esquemas definidos preservando la fidelidad visual. En la práctica, el equipo puede:

  • Usar Parse para convertir el PDF en texto estructurado y consultas rápidas.
  • Usar Extract para devolver solo los campos que exige tu auditoría.
  • Enviar el resultado a tu ERP o CRM ya validado.

El diseño exigió elecciones duras: canales de reconocimiento de esquemas para aguantar millones de variantes de documentos, y un uso de GPU que escale horizontalmente en picos diarios. Para cargas variables, el modelo de negocio usa créditos, lo que te ayuda a ajustar el coste cuando suben las operaciones o la entrada de clientes en campaña.

Mientras OpenAI, Microsoft y Google empujan modelos universales en el entorno corporativo, Landing AI apuesta por la especialización y por soluciones explicables. La compañía sitúa esta etapa como la de la inteligencia agente, en la que los modelos no solo procesan, también entienden los datos. Eso será clave para decisiones informadas, escalabilidad y confianza.

Andrew Ng recuerda que la inteligencia documental procesa información no estructurada mucho mejor que hace dos años, lo que sube el valor de extraer datos de documentos frente a dejar esa tarea a mano. Insiste en que este bloque trabajará junto a LLM de propósito general y a RAG, no en su contra, para cubrir búsqueda, contexto y verificación.

Copyright © gptzone.net

La Newsletter Diaria Sobre Inteligencia Artificial. Además: Portal de Noticias, Tutoriales, Tips y Trucos de ChatGpt, Openai e Inteligencia Artificial.

Nuestra web está alojada en:

hosting raiola

Suscríbete a nuestra Newsletter Diaria sobre IA

 

Suscríbete a GptZone y recibe cada día TOTALMENTE GRATIS:

 

  • 📰 Noticias Exclusivas de Inteligencia Artificial.
  • 🤖 Prompts Creativos y prácticos.
  • 🎥 Videos Inspiradores sobre IA.
  • 🛠️ Apps Recomendadas para revolucionar tu día a día.

Te has suscrito Satisfactoriamente!

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram