Cognition, một phòng thí nghiệm AI ứng dụng có trụ sở tại Hoa Kỳ, đã công bố những gì họ tuyên bố là phần mềm kỹ sư AI đầu tiên trên thế giới. Theo các nhà sáng lập, đại lý AI có tên Devin đã thành công trong việc vượt qua các cuộc phỏng vấn kỹ thuật thực tế do các công ty AI hàng đầu thực hiện.
Devin cũng được cho là đã hoàn thành các công việc thực tế được đăng trên Upwork, một nền tảng freelancer có trụ sở tại Mỹ.
“Devin là một đồng đội không mệt mỏi, có kỹ năng, sẵn sàng xây dựng cùng bạn hoặc hoàn thành các nhiệm vụ độc lập để bạn xem xét. Với Devin, các kỹ sư có thể tập trung vào những vấn đề thú vị hơn, và các nhóm kỹ thuật có thể hướng tới những mục tiêu tham vọng hơn,” theo bài đăng chính thức trên blog của công ty.
Đại lý AI này được trang bị các khả năng tiên tiến trong phát triển phần mềm, bao gồm lập trình, gỡ lỗi, giải quyết vấn đề và nhiều hơn nữa. Devin sử dụng các thuật toán học máy để liên tục học hỏi và nâng cao hiệu suất của mình, thích nghi với các thử thách mới khi chúng phát sinh. Nói một cách đơn giản, Devin có thể xây dựng và triển khai các ứng dụng từ đầu đến cuối, và nó cũng có thể đào tạo và tinh chỉnh các mô hình AI của chính mình.
Devin có khả năng lập kế hoạch và thực hiện các nhiệm vụ kỹ thuật phức tạp thường liên quan đến hàng nghìn quyết định. Khả năng này được hỗ trợ bởi những tiến bộ của Cognition trong lý luận và lập kế hoạch dài hạn. Theo công ty, Devin có thể truy xuất ngữ cảnh phù hợp ở từng giai đoạn, tự học hỏi theo thời gian và sửa lỗi khi cần thiết.
Trên benchmark SWE-Bench (một chuẩn đánh giá các mô hình ngôn ngữ lớn về các vấn đề phần mềm thực tế tìm thấy trên GitHub), Devin đã giải quyết chính xác 13.86 phần trăm các vấn đề mà không cần trợ giúp so với 1.96 phần trăm không trợ giúp và 4.80 phần trăm có trợ giúp của mô hình trạng thái nghệ thuật trước đó.
Mặc dù công ty đã chi tiết hóa khả năng của Devin, một số chuyên gia bày tỏ lo ngại rằng kỹ sư phần mềm AI có thể gặp khó khăn với các yêu cầu hoặc kịch bản phức tạp phụ thuộc vào trực giác và sáng tạo của con người. Thêm vào đó, các công cụ AI như Devin cũng gây ra những lo ngại về khả năng thay thế công việc.
Tuy nhiên, một số người tin rằng Devin có thể trở thành một đối tác quý giá cho nhiều kỹ sư phần mềm, mở ra những cơ hội hợp tác mới giữa sáng tạo của con người và AI.
Theo dõi chúng tôi trên Twitter để cập nhật các bài đăng và tin tức mới nhất
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
GIỚI THIỆU | Kỹ sư phần mềm AI đầu tiên trên thế giới, Devin, đã hoàn thành các công việc thực tế trên Upwork
Cognition, một phòng thí nghiệm AI ứng dụng có trụ sở tại Hoa Kỳ, đã công bố những gì họ tuyên bố là phần mềm kỹ sư AI đầu tiên trên thế giới. Theo các nhà sáng lập, đại lý AI có tên Devin đã thành công trong việc vượt qua các cuộc phỏng vấn kỹ thuật thực tế do các công ty AI hàng đầu thực hiện.
Devin cũng được cho là đã hoàn thành các công việc thực tế được đăng trên Upwork, một nền tảng freelancer có trụ sở tại Mỹ.
“Devin là một đồng đội không mệt mỏi, có kỹ năng, sẵn sàng xây dựng cùng bạn hoặc hoàn thành các nhiệm vụ độc lập để bạn xem xét. Với Devin, các kỹ sư có thể tập trung vào những vấn đề thú vị hơn, và các nhóm kỹ thuật có thể hướng tới những mục tiêu tham vọng hơn,” theo bài đăng chính thức trên blog của công ty.
Đại lý AI này được trang bị các khả năng tiên tiến trong phát triển phần mềm, bao gồm lập trình, gỡ lỗi, giải quyết vấn đề và nhiều hơn nữa. Devin sử dụng các thuật toán học máy để liên tục học hỏi và nâng cao hiệu suất của mình, thích nghi với các thử thách mới khi chúng phát sinh. Nói một cách đơn giản, Devin có thể xây dựng và triển khai các ứng dụng từ đầu đến cuối, và nó cũng có thể đào tạo và tinh chỉnh các mô hình AI của chính mình.
Devin có khả năng lập kế hoạch và thực hiện các nhiệm vụ kỹ thuật phức tạp thường liên quan đến hàng nghìn quyết định. Khả năng này được hỗ trợ bởi những tiến bộ của Cognition trong lý luận và lập kế hoạch dài hạn. Theo công ty, Devin có thể truy xuất ngữ cảnh phù hợp ở từng giai đoạn, tự học hỏi theo thời gian và sửa lỗi khi cần thiết.
Trên benchmark SWE-Bench (một chuẩn đánh giá các mô hình ngôn ngữ lớn về các vấn đề phần mềm thực tế tìm thấy trên GitHub), Devin đã giải quyết chính xác 13.86 phần trăm các vấn đề mà không cần trợ giúp so với 1.96 phần trăm không trợ giúp và 4.80 phần trăm có trợ giúp của mô hình trạng thái nghệ thuật trước đó.
Mặc dù công ty đã chi tiết hóa khả năng của Devin, một số chuyên gia bày tỏ lo ngại rằng kỹ sư phần mềm AI có thể gặp khó khăn với các yêu cầu hoặc kịch bản phức tạp phụ thuộc vào trực giác và sáng tạo của con người. Thêm vào đó, các công cụ AI như Devin cũng gây ra những lo ngại về khả năng thay thế công việc.
Tuy nhiên, một số người tin rằng Devin có thể trở thành một đối tác quý giá cho nhiều kỹ sư phần mềm, mở ra những cơ hội hợp tác mới giữa sáng tạo của con người và AI.
Theo dõi chúng tôi trên Twitter để cập nhật các bài đăng và tin tức mới nhất