Amazon ha dado un paso crucial en la carrera de los agentes de IA autónomos con el lanzamiento de Nova Act, un sistema capaz de tomar control de navegadores web para realizar tareas complejas sin intervención humana. Este desarrollo, surgido del nuevo laboratorio de IA de Amazon en San Francisco (dirigido por exinvestigadores de OpenAI), representa un avance estratégico para competir con OpenAI Operator y Anthropic Computer Use (CUA) en el emergente mercado de agentes digitales.

¿Qué Hace Nova Act?

  • Automatización Web Avanzada:
    • Reserva restaurantes (ej: selección de horarios en OpenTable)
    • Realiza pedidos en plataformas como Sweetgreen
    • Completa formularios y calendarios interactivos
  • Kit de Desarrollo (SDK):
    • Herramientas para crear flujos de trabajo agenticos
    • Integración con APIs de navegación (click, scroll, input)
    • Mecanismos de “human-in-the-loop” para supervisión

Diferenciadores Clave

Rendimiento Superior:

  • 94% de precisión en ScreenSpot Web Text (vs 88% de OpenAI y 90% de Anthropic)
  • Optimizado para interacciones GUI (no solo texto)

Enfoque en Fiabilidad:

  • Tareas acotadas y bien definidas (evitando la autonomía total problemática de otros agentes)
  • Transparencia en puntos de decisión que requieren intervención humana

Ecosistema Alexa+:

  • Próxima integración con la versión generativa del asistente de Amazon
  • Potencial acceso a 500+ millones de dispositivos Echo

    Detrás de Escena: El Laboratorio Secretivo

    Dirigido por David Luan (ex-Adept) y Pieter Abbeel (ex-Covariant), el equipo combina experiencia en:

    • Modelos de acción multimodal (Adept)
    • Robótica autónoma (Covariant)
    • IA generativa (OpenAI)

    Su visión: “IA que ejecute cualquier tarea humana en computadoras” mediante pasos incrementales, empezando por acciones web estructuradas.

    Limitaciones y Desafíos

    • Alcance inicial reducido: Solo tareas simples (no comparado con WebVoyager)
    • Problemas conocidos de agentes:
      • Latencia en ejecución
      • Errores en contextos no entrenados
      • Dificultad para manejar captchas
    • Competencia feroz: Microsoft (Copilot Agents), Google (Gemini Live)

    Por qué Importa

    Modelo de Negocio:

    • Posible monetización vía transacciones automatizadas (ej: comisión por reservas)
    • Valorización de datos de interacción web

    Alexa 2.0:

    • Transformación de asistente vocal a agente digital ejecutivo
    • Posicionamiento frente a ChatGPT Voice

      Perspectiva: Si Amazon resuelve los problemas de fiabilidad que afectan a OpenAI/Anthropic, podría dominar la próxima ola de IA agentica gracias a su infraestructura cloud (AWS) y dispositivos omnipresentes (Echo). El SDK disponible en nova.amazon.com marca solo el inicio de esta batalla por la automatización web inteligente.

      ¿Será Nova Act el “Netscape Navigator” de los agentes autónomos? Los primeros prototipos en las próximas semanas darán la respuesta.

      By Ainus

      Deja una respuesta

      Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *