Je ne comprends pas très bien pourquoi la reconnaissance vocale (STT) de Byte peut être au prix le plus bas, alors que la synthèse vocale (TTS) est la plus chère parmi les grandes entreprises. Est-ce parce que le coût de la collecte de dialectes et de la synthèse est relativement élevé ? Les prix indiqués dans l'image sont calculés sur la base des demandes d'aujourd'hui, sans garantie de temporalité et de précision. Les prix d'Alibaba ne sont qu'une référence et ne conviennent pas vraiment aux développeurs ordinaires.