L'audio conversationnel n'est pas simplement plus de données vocales. Il a une structure complètement différente : • Prise de parole alternée • Intervenants qui se chevauchent • Gaps de silence • Interruptions • Rythme variable De nombreux pipelines d'évaluation ASR ont été conçus pour un audio propre à un seul intervenant.