Hơn một nửa câu trả lời của ChatGPT cho các câu hỏi lập trình chứa thông tin sai lệch, nhưng phần lớn các Kỹ sư phần mềm vẫn muốn sử dụng các công cụ AI và nhận định rằng cả sự hài lòng cá nhân và năng suất đều tăng lên nhờ sử dụng chúng.
Những phát hiện về việc áp dụng các công cụ AI và nhận thức của Kỹ sư phần mềm về chúng đến từ một cuộc khảo sát gần đây của Stack Overflow, khảo sát 1.700 Kỹ sư phần mềm trên cộng đồng của họ về việc sử dụng AI code và tác động tổng thể của các công cụ này lên năng suất của họ.
Cuộc khảo sát cho thấy 76% số người tham gia đã hoặc đang có kế hoạch sử dụng AI code. Các vai trò sử dụng nhiều nhất các công cụ này trong số các Kỹ sư phần mềm chuyên nghiệp là nhà nghiên cứu học thuật (academic researchers) (87%), Kỹ sư phần mềm AI (76%), Kỹ sư phần mềm front-end (75%) và nhà khoa học dữ liệu (67%).
Khi được hỏi về việc sử dụng AI code nào, ChatGPT chiếm ưu thế rõ ràng với 84% số người được hỏi. GitHub Copilot đứng ở vị trí thứ hai với 49% sử dụng. Visual Studio IntelliCode đứng thứ ba với 11%, tiếp theo là Codeium (7%) và Google Gemini (5%), trước đây là Duet (4%). 8 sản phẩm được sử dụng bởi 3% đến 1% số người tham gia khảo sát và 4 sản phẩm khác được sử dụng bởi ít hơn 1%.
Lưu ý hai thanh trên cùng của biểu đồ này đã bị cắt bớt và tỷ lệ chỉ áp dụng từ Visual Studio IntelliCode trở xuống.
Xét về tính dễ sử dụng, điểm số cao nhất được trao cho Codeium (84%), GitHub Copilot (76%) và ChatGPT (61%) và ba công cụ này theo thứ tự cũng đạt được điểm hài lòng cao nhất (86%, 72%, 65% tương ứng) và mức tăng năng suất cao nhất (lần lượt là x2,5, x2,3, x2,2).
Trong cuộc khảo sát của Stack Overflow, 38% Kỹ sư phần mềm cho biếtrằng AI code cung cấp thông tin không chính xác trong một nửa thời gian trở lên. Điều này khớp với phát hiện của các nhà nghiên cứu học thuật từ Đại học Purdue được trình bày vào tháng 5 tại hội nghị Computer-Human Interaction rằng 52% câu trả lời lập trình do ChatGPT đưa ra chứa thông tin sai lệch.
Nghiên cứu đã giải quyết câu hỏi "Stack Overflow có lỗi thời không?" bằng cách điều tra xem ChatGPT hoạt động tốt như thế nào trong việc trả lời các câu hỏi lập trình so với Stack Overflow. Cụ thể, các nhà nghiên cứu học thuật đã lấy 517 câu hỏi liên quan đến lập trình được hỏi trên Stack Overflow và kiểm tra tính chính xác, ngắn gọn và nhất quán ChatGPT. Họ phát hiện ra rằng 52% câu trả lời của ChatGPT chứa thông tin sai lệch, 77% câu trả lời dài dòng hơn câu trả lời của con người và 78% câu trả lời có mức độ không nhất quán khác nhau so với câu trả lời của con người.
Bất chấp những thiếu sót này, bằng cách tiến hành một nghiên cứu người dùng nhỏ chỉ với 12 người tham gia, họ thấy rằng các câu trả lời của ChatGPT được ưu tiên hơn 35% thời gian do tính toàn diện của chúng và việc sử dụng phong cách ngôn ngữ rõ ràng và họ đã bỏ qua thông tin sai lệch trong các câu trả lời của ChatGPT 39% thời gian. Các nhà nghiên cứu Purdue đã tuyên bố:
Điều này ám chỉ rằng việc phản đổi câu trả lời sai lệch của ChatGPT cho các câu hỏi lập trình và nâng cao nhận thức về những rủi ro liên quan đến các câu trả lời trông có vẻ chính xác là rất cần thiết.
Xem bài viết OpenAI Enriched By Stack Overflow, Stack Overflow đang đóng vai trò của họ trong nỗ lực này bằng cách hợp tác với OpenAI và cung cấp cho họ quyền truy cập vào toàn bộ kho lưu trữ các câu hỏi và câu trả lời về lập trình. Một cách khác để cải thiện câu trả lời của ChatGPT là nâng cao chất lượng của các gợi ý, đảm bảo chúng chứa thông tin rõ ràng và cũng chỉ ra rủi ro về câu trả lời sai hoặc không đầy đủ.
AI code là công cụ hỗ trợ đắc lực cho Kỹ sư phần mềm, giúp tăng năng suất và hiệu quả công việc. Tuy nhiên, cần sử dụng AI code một cách cẩn trọng và có trách nhiệm, đồng thời kết hợp với kiến thức và kỹ năng lập trình của con người để đảm bảo chất lượng code.
Nguồn: I Programmer
Comments