A diferencia de los chatbots basados en texto que analizan fragmentos de texto, los bots de voz deben tener en cuenta las diferencias sutiles o importantes en la forma en que cada persona que llama responde a las indicaciones. Los escenarios como los dialectos, la velocidad, la claridad del habla y el ruido de fondo tienen un gran impacto en la precisión de la transcripción, que juega un papel importante en la comprensión del usuario.
