Che cosa significa latenza #
La latenza indica il tempo che passa tra la fine dell’intervento del Player e l’inizio della risposta dell’avatar.
In una simulazione vocale real-time, la latenza non dipende da un solo elemento. Prima che l’avatar inizi a parlare, il sistema deve:
- rilevare che il Player ha finito di parlare;
- inviare il contenuto al modello AI;
- generare la risposta dell’avatar;
- produrre l’audio della voce;
- sincronizzare la risposta con l’esperienza Web o VR;
- mostrare o animare l’avatar in modo coerente.
Per questo motivo, la risposta dell’avatar non è istantanea come in una conversazione umana dal vivo, ma viene generata in tempo reale attraverso una pipeline AI.
Tempo di risposta atteso #
Nello stato attuale della piattaforma, il tempo medio percepito per la prima parola dell’avatar dopo la fine del parlato del Player è indicativamente:
- Web: circa 2,8 secondi
- VR: circa 2 secondi
Questi valori rappresentano una baseline operativa realistica dell’esperienza attuale.
La latenza può variare in base a diversi fattori, tra cui:
- qualità della connessione Internet;
- dispositivo utilizzato;
- browser;
- canale Web o VR;
- lingua della simulazione;
- voce selezionata;
- carico del sistema;
- numero di sessioni attive nello stesso momento;
- eventuali componenti aggiuntive come avatar, sincronizzazione visiva o lipsync.
Perché esiste una breve attesa prima della risposta #
La breve attesa prima della risposta dell’avatar serve a permettere al sistema di generare una risposta coerente, contestuale e vocalizzata.
Non si tratta di un semplice audio pre-registrato.
L’avatar ascolta il Player, interpreta il contenuto della conversazione e produce una risposta coerente con:
- scenario della simulazione;
- Avatar Persona;
- lingua configurata;
- modalità di accesso;
- obiettivo formativo;
- stato della conversazione;
- eventuali segnali emotivi o comportamentali.
Questa elaborazione richiede alcuni secondi.
Latenza e qualità della simulazione #
Una latenza leggermente più alta può essere accettabile quando consente all’avatar di mantenere maggiore coerenza, qualità e sicurezza nella risposta.
L’obiettivo della piattaforma non è produrre risposte istantanee a qualunque costo, ma offrire un’interazione:
- realistica;
- stabile;
- formativa;
- coerente con il ruolo dell’avatar;
- sicura per il Player;
- utile per l’analisi successiva.
La latenza va quindi letta come parte dell’esperienza real-time AI, non come un errore tecnico.
Che cosa sono le sessioni simultanee #
Le sessioni simultanee indicano quante simulazioni possono essere svolte nello stesso momento.
Questo concetto è diverso dal numero totale di utenti o dal numero totale di simulazioni create.
Ad esempio, un tenant può avere:
- molti Player registrati;
- molte simulazioni disponibili;
- un certo numero di runtime attive;
- ma solo un numero definito di sessioni utilizzabili contemporaneamente.
Le sessioni simultanee rappresentano quindi la capacità operativa del sistema in tempo reale.
Esempio pratico #
Se un tenant ha 10 connessioni simultanee disponibili, significa che fino a 10 Player possono essere contemporaneamente dentro una simulazione attiva.
Se un undicesimo Player prova ad accedere mentre tutte le sessioni sono occupate, il sistema può impedirne temporaneamente l’accesso o gestirlo secondo le regole previste dalla piattaforma.
Differenza tra utenti, runtime e sessioni simultanee #
È importante distinguere tre concetti.
Utenti #
Sono le persone registrate nella piattaforma.
Esempio:
- Tenant Admin;
- Manager;
- Player.
Runtime attive #
Sono gli accessi operativi alle simulazioni, cioè le simulazioni rese disponibili ai Player con specifiche impostazioni di lingua, canale, voce, avatar, tentativi e disponibilità.
Sessioni simultanee #
Sono le simulazioni che possono essere svolte nello stesso momento.
Un tenant può quindi avere molti utenti e molte runtime attive, ma un numero più limitato di sessioni simultanee disponibili.
Cosa aspettarsi durante l’utilizzo #
Durante l’esperienza, il Player può percepire una breve pausa tra la fine del proprio intervento e l’inizio della risposta dell’avatar.
Questa pausa è normale e fa parte del funzionamento della simulazione vocale AI.
In condizioni operative standard, la piattaforma punta a mantenere un tempo di risposta fluido e compatibile con una conversazione simulata real-time.
Eventuali variazioni possono dipendere dal contesto tecnico e dalla configurazione della sessione.
Risultato finale #
La latenza e le sessioni simultanee sono due elementi fondamentali dell’esperienza real-time.
La latenza descrive il tempo necessario perché l’avatar generi e inizi la risposta.
Le sessioni simultanee descrivono quante simulazioni possono essere utilizzate nello stesso momento.
Comprendere questi concetti aiuta Tenant Admin, Provider e Player ad avere aspettative corrette sull’esperienza e a interpretare correttamente il comportamento della piattaforma durante le simulazioni.