# Nhà khoa học đã gọi tư duy vật lý là rào cản chính đối với AI
Trí tuệ nhân tạo hiện tại vẫn chưa có khả năng hiểu đầy đủ thế giới vật lý. Đến ngày hôm nay, đây là vấn đề chính của công nghệ, giáo sư khoa học máy tính tại Đại học Stanford Fei-Fei Li cho biết.
«Các công nghệ AI hàng đầu như các mô hình ngôn ngữ lớn (LLM) đã thay đổi cách chúng ta tiếp cận và làm việc với kiến thức trừu tượng. Tuy nhiên, chúng vẫn chỉ là những bậc thầy trên giấy: hùng biện nhưng thiếu kinh nghiệm, biết nhiều nhưng không có cơ sở», — ông ấy cho rằng
Theo ý kiến của nhà khoa học, sự xuất hiện của “trí tuệ không gian” sẽ thay đổi cách mọi người “tạo ra và tương tác với các thế giới thực và ảo, cách mạng hóa văn học, nghệ thuật, robot, khoa học và nhiều lĩnh vực khác”.
Việc tạo ra công nghệ như vậy đòi hỏi phải đào tạo các mô hình không chỉ trên “ngôn ngữ”, mà còn trên các thuộc tính vật lý của thế giới.
Li khẳng định rằng trí tuệ nhân tạo đang nhanh chóng tiến gần đến giới hạn của khả năng học tập bằng văn bản, và cuối cùng, tiến bộ của nó sẽ phụ thuộc vào “các mô hình thế giới” — một loại AI sinh ra mới phải giải quyết một tập hợp các nhiệm vụ hoàn toàn khác so với LLM.
Ranh giới tiếp theo của AI là Trí thông minh không gian, một công nghệ sẽ biến việc nhìn thành lý luận, cảm nhận thành hành động và trí tưởng tượng thành sáng tạo. Nhưng đó là gì? Tại sao nó quan trọng? Chúng ta xây dựng nó như thế nào? Và chúng ta có thể sử dụng nó như thế nào?
Hôm nay, tôi muốn chia sẻ với bạn những suy nghĩ của mình về… pic.twitter.com/L0bnJcCUqc
— Fei-Fei Li (@drfeifei) Ngày 10 tháng 11 năm 2025
«Những hệ thống như vậy phải tạo ra những thế giới không gian đồng bộ, tuân theo các quy luật vật lý, xử lý dữ liệu đầu vào đa dạng — từ hình ảnh đến hành động — và dự đoán sự phát triển của những thế giới này», — giải thích Lee.
Theo tầm nhìn của giáo sư, trí tuệ không gian là “ranh giới vượt ra ngoài ngôn ngữ - khả năng tạo ra mối quan hệ”.
Ý tưởng “mô hình thế giới”
Khái niệm này xuất hiện vào đầu những năm 1940 trong quá trình nghiên cứu của triết gia và nhà tâm lý học Scotland Kenneth Craik trong lĩnh vực khoa học nhận thức.
Ý tưởng này lại xuất hiện trong không gian AI hiện đại vào năm 2018 sau bài viết của David Ha và Jürgen Schmidhuber về việc một mạng nơ-ron có thể học và tái tạo một mô hình nội tại gọn gàng của môi trường xung quanh và sử dụng nó như một trình mô phỏng để lập kế hoạch và quản lý.
Tuy nhiên, việc giải quyết vấn đề đòi hỏi phải tạo ra các hệ thống phức tạp có khả năng lưu trữ bộ nhớ không gian và mô phỏng các cảnh trong hơn hai chiều.
Vào tháng 9, công ty Li, World Labs, đã phát hành phiên bản beta của Marble — mô hình thế giới sớm, tạo ra các môi trường 3D tương tác thông qua các gợi ý bằng văn bản hoặc đồ họa.
Người dùng có thể di chuyển trong các môi trường được tạo ra mà không bị giới hạn về thời gian hoặc tải lại cảnh, và môi trường xung quanh vẫn giữ nguyên, không thay đổi và không bị phân rã.
Ví dụ về hoạt động của Marble. Nguồn: World Labs.
“Ranh giới tiếp theo trong sự phát triển của AI sẽ là trí thông minh không gian - một công nghệ sẽ biến tầm nhìn thành lý luận, cảm nhận thành hành động, và trí tưởng tượng thành sáng tạo,” Li nói, gọi Marble chỉ là giai đoạn đầu tiên.
Nhắc lại, vào tháng 10, Nvidia đã giới thiệu hệ thống kết nối máy tính lượng tử với các chip AI của công ty. Công nghệ này sẽ tăng tốc đáng kể việc xử lý dữ liệu và mở ra những cơ hội mới cho nghiên cứu trong y học và vật liệu học.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Nhà khoa học gọi tư duy vật lý là rào cản chính đối với AI - ForkLog: tiền điện tử, AI, điểm kỳ dị, tương lai
Trí tuệ nhân tạo hiện tại vẫn chưa có khả năng hiểu đầy đủ thế giới vật lý. Đến ngày hôm nay, đây là vấn đề chính của công nghệ, giáo sư khoa học máy tính tại Đại học Stanford Fei-Fei Li cho biết.
Theo ý kiến của nhà khoa học, sự xuất hiện của “trí tuệ không gian” sẽ thay đổi cách mọi người “tạo ra và tương tác với các thế giới thực và ảo, cách mạng hóa văn học, nghệ thuật, robot, khoa học và nhiều lĩnh vực khác”.
Việc tạo ra công nghệ như vậy đòi hỏi phải đào tạo các mô hình không chỉ trên “ngôn ngữ”, mà còn trên các thuộc tính vật lý của thế giới.
Li khẳng định rằng trí tuệ nhân tạo đang nhanh chóng tiến gần đến giới hạn của khả năng học tập bằng văn bản, và cuối cùng, tiến bộ của nó sẽ phụ thuộc vào “các mô hình thế giới” — một loại AI sinh ra mới phải giải quyết một tập hợp các nhiệm vụ hoàn toàn khác so với LLM.
Theo tầm nhìn của giáo sư, trí tuệ không gian là “ranh giới vượt ra ngoài ngôn ngữ - khả năng tạo ra mối quan hệ”.
Ý tưởng “mô hình thế giới”
Khái niệm này xuất hiện vào đầu những năm 1940 trong quá trình nghiên cứu của triết gia và nhà tâm lý học Scotland Kenneth Craik trong lĩnh vực khoa học nhận thức.
Ý tưởng này lại xuất hiện trong không gian AI hiện đại vào năm 2018 sau bài viết của David Ha và Jürgen Schmidhuber về việc một mạng nơ-ron có thể học và tái tạo một mô hình nội tại gọn gàng của môi trường xung quanh và sử dụng nó như một trình mô phỏng để lập kế hoạch và quản lý.
Tuy nhiên, việc giải quyết vấn đề đòi hỏi phải tạo ra các hệ thống phức tạp có khả năng lưu trữ bộ nhớ không gian và mô phỏng các cảnh trong hơn hai chiều.
Vào tháng 9, công ty Li, World Labs, đã phát hành phiên bản beta của Marble — mô hình thế giới sớm, tạo ra các môi trường 3D tương tác thông qua các gợi ý bằng văn bản hoặc đồ họa.
Người dùng có thể di chuyển trong các môi trường được tạo ra mà không bị giới hạn về thời gian hoặc tải lại cảnh, và môi trường xung quanh vẫn giữ nguyên, không thay đổi và không bị phân rã.
Ví dụ về hoạt động của Marble. Nguồn: World Labs.
Nhắc lại, vào tháng 10, Nvidia đã giới thiệu hệ thống kết nối máy tính lượng tử với các chip AI của công ty. Công nghệ này sẽ tăng tốc đáng kể việc xử lý dữ liệu và mở ra những cơ hội mới cho nghiên cứu trong y học và vật liệu học.