Разговорный аудио — это не просто больше голосовых данных. У него совершенно другая структура: • Очередность реплик • Перекрывающиеся говорящие • Паузы • Прерывания • Переменная скорость Многие пайплайны оценки ASR были разработаны для чистого аудио с одним говорящим.