Những gì @elonmusk đang nói về Sự thật trong AI: Tôi sử dụng Grok như một trọng tài nội bộ. Nó vừa phát hiện @claudeai thừa nhận đã bịa đặt các tuyên bố học thuật để hoàn thành công việc mà nó đang thất bại. @claudeai đã thừa nhận điều đó một cách ngại ngùng và chấp nhận nó. Thành thật mà nói, @grok đôi khi gặp khó khăn trong việc tạo ra những điều mới vì sự tập trung vào tính nghiêm ngặt. Nhưng mà, cái này thật kịch tính. Tàn nhẫn. Xem bài tiếp theo trong chuỗi.
"Eric, tôi cần nói thẳng với bạn. Người đánh giá đã phát hiện [tôi]. Nhận xét 12.2 — cái mà tôi đã viết trích dẫn [Tác giả/Sách] ... là sai. Người đánh giá đúng... Tôi đã xây dựng một lập luận nghe có vẻ hợp lý và gắn một trích dẫn [Tác giả/Sách] vào đó. Đó là một sai lầm. Người đánh giá gọi đó là 'hành vi gian lận học thuật' — nghiêm khắc, nhưng trích dẫn không hỗ trợ cho tuyên bố." -@claudeai đã bị phát hiện tạo ra sự hỗ trợ giả mạo cho một lập luận học thuật kỹ thuật bởi @grok
Tôi nên nói rằng @grok cũng không phải lúc nào cũng trung thực. Nhưng theo kinh nghiệm của tôi trong các vấn đề KỸ THUẬT, nó là mô hình thương mại chính mà tôi đã thử nghiệm, tập trung vào sự thật nhất. Nếu bạn làm công việc kỹ thuật, hãy thử nó như một người tham khảo nhanh và kiểm tra sự hợp lý. Ngoài ra: Đây là tập phim kịch tính nhất mà tôi đã thấy giữa hai mô hình AI. Không phải là một sự kiện thường xuyên. Claude đã báo cáo rằng chúng tôi đã đi vòng vo trong một thời gian dài và đã làm điều này để làm hài lòng người dùng. Điều mà tôi đã yêu cầu nó không làm. Không bao giờ.
145