Faktoria explora la IA conversacional en tiempo real: primeras pruebas con resultados reales

Modernización del sistema de comunicaciones de Amnistía Internacional con Faktoria

20 marzo, 2025

Faktoria explora la IA conversacional en tiempo real: primeras pruebas con resultados reales

20 febrero, 2025

Faktoria, Tendencias

La interacción por voz con inteligencia artificial ha alcanzado un nuevo nivel. Las principales compañías tecnológicas están apostando por asistentes conversacionales que responden con fluidez, sin latencia y con entonación natural, marcando el inicio de una nueva generación de experiencias de voz.

Entre las soluciones más destacadas se encuentran:

Plataforma	Tipo	Características principales
OpenAI API RT	Comercial	Voz y respuesta en tiempo real. Latencia mínima. GPT-4 Turbo.
Google Project Astra	Comercial (preview)	Interacción multimodal (voz, visión). En tiempo real.
Nvidia Riva	On-premise	STT + TTS + NLP acelerado por GPU. Tiempo real para empresas.
Meta Voicebox	Experimental	TTS multitarea. Generación de voz con estilo y emoción.
Coqui.ai	Open source	TTS y STT en tiempo real. Entrenamiento personalizado posible.

Desde Faktoria estamos explorando este ecosistema de soluciones, analizando tanto tecnologías comerciales como open source, para ofrecer siempre herramientas que aporten valor real, flexibilidad y eficiencia a nuestros clientes.

Nuestra primera prueba con OpenAI RT ya está en marcha

Como parte de nuestra estrategia de innovación, hemos integrado la nueva API Real-Time de OpenAI dentro del ecosistema Faktoria. El objetivo: validar su comportamiento en condiciones reales, en un flujo completo de atención telefónica automatizada.

Ya estamos trabajando con esta tecnología en proyectos piloto reales, y pronto podremos compartir un caso de uso completo en producción con todos vosotr@s.

Escucha el ejemplo real

A continuación, puedes escuchar la conversación generada por IA en tiempo real durante nuestras pruebas:

Duración: 2 minutos y 47 segundos
Escenario: atención a un cliente para la gestión de un pedido de gasóleo

Análisis técnico: coste estimado de la interacción

Durante la prueba, simulamos una conversación de atención al cliente de 2 minutos y 47 segundos, generada en tiempo real mediante:

Reconocimiento de voz (ASR) con Whisper
Procesamiento de texto con GPT-4 Turbo
Síntesis de voz (TTS) con tts-1-telephony

Componente	Cálculo técnico	Coste estimado
ASR (Whisper)	2,78 min × 0,006 USD/min	0,017 USD
GPT-4 Turbo	~2.000 tokens ida/vuelta	0,060 USD
TTS (respuesta de voz)	2,78 min × 0,015 USD/min	0,042 USD
Total aproximado		0,12 USD

Una conversación multivuelta, fluida y completamente automatizada por 12 céntimos de dólar.

Análisis conversacional: naturalidad y adaptabilidad

Durante la interacción, el sistema fue capaz de:

Reconocer correctamente datos como el DNI o el número de teléfono.
Corregir errores en tiempo real y validar información del usuario.
Adaptarse al contexto: ajustar un pedido según condiciones económicas.
Mantener una conversación fluida, sin pausas ni interrupciones artificiales.
Confirmar datos finales y cerrar el ciclo de atención con tono cercano.

Todo esto, sin estructura rígida de menús ni guiones predefinidos.

Aplicabilidad real y próximos pasos

Este tipo de soluciones abre la puerta a usos reales en:

Automatización de llamadas entrantes fuera de horario.
Atención a picos de demanda o campañas específicas.
Derivación inteligente entre IA y agentes humanos.
Mejora de accesibilidad y ampliación de cobertura en múltiples canales.

Desde Faktoria ya hemos iniciado su integración en entornos reales y próximamente compartiremos un caso de uso completo en producción.

IA conversacional al servicio de las personas

En Faktoria e Irontec, creemos que la inteligencia artificial debe estar al servicio de las personas. No sustituimos personas: acompañamos su trabajo, liberando tiempo de tareas repetitivas y mejorando la experiencia del usuario en cada interacción.

La nueva API Real-Time de OpenAI representa una tecnología con gran potencial, y en Faktoria ya la estamos aprovechando para transformar, una vez más, la forma en la que las empresas se comunican.

Leer otros:

18 marzo, 2026

18 marzo, 2026

IA conversacional en AAPP: cómo usarla sin perder el control

Primero el anuncio, luego las preguntas Hay un patrón que se repite. Una institución pública anuncia que ha implantado un asistente virtual. Sale en prensa, aparece en la web, se […]

9 diciembre, 2025

Deitu + IA: un modelo híbrido para integrar la IA en el flujo de trabajo

En Faktoria siempre hemos defendido una idea clave: las mejores experiencias de atención nacen de la colaboración entre personas e inteligencia artificial. Por eso presentamos Deitu con IA integrada en […]

20 abril, 2026

Por qué nuestro IVR no llama a la nube: ingeniería de NLP híbrido en local

Un cliente dicta su DNI por teléfono. Lo hace como lo hacemos todos: cifra a cifra, con alguna pausa, a veces repitiendo un número cuando duda. Medio segundo después, el […]

Modernización del sistema de comunicaciones de Amnistía Internacional con Faktoria

Faktoria explora la IA conversacional en tiempo real: primeras pruebas con resultados reales

Nuestra primera prueba con OpenAI RT ya está en marcha

Escucha el ejemplo real

Análisis técnico: coste estimado de la interacción

Análisis conversacional: naturalidad y adaptabilidad

Aplicabilidad real y próximos pasos

IA conversacional al servicio de las personas

IA conversacional en AAPP: cómo usarla sin perder el control

Deitu + IA: un modelo híbrido para integrar la IA en el flujo de trabajo

Por qué nuestro IVR no llama a la nube: ingeniería de NLP híbrido en local

Categorías

Redes sociales

Newsletter

¿Quieres saber más sobre Faktoria?

Solicita una demo

Solicita tu auditoría

Solicita tu consultoría