Apa yang terjadi dengan obrolan berbasis ucapan dengan LLM yang membuat mereka kurang mampu? Berbicara dengan mereka itu luar biasa, tetapi jika Anda ingin memasuki media atau menghasilkan media tiba-tiba, mereka tidak dapat melakukannya Apakah itu kendala yang diketahui ada dalam penelitian? atau apakah tidak ada cukup permintaan untuk itu