Я не зовсім розумію, чому розпізнавання мовлення (STT) від Byte може бути найдешевшим, але текст-в-мовлення (TTS) — найдорожчий серед великих виробників. Чи це тому, що початкова вартість збору та синтезу діалектів досить висока? Ціни на рисунку розраховані на основі сьогоднішнього запиту і не гарантують своєчасності та правильності. Ціна Alibaba призначена лише для довідки і не підходить для загальних розробників.