# Вчений назвав фізичне мислення головною перешкодою для ШІ
Штучний інтелект поки не здатний в повній мірі розуміти фізичний світ. На сьогодні це головна проблема технології, заявив професор комп'ютерних наук Стенфордського університету Фей-Фей Лі.
«Ведучі ІІ-технології, такі як великі мовні моделі (LLM), змінили спосіб отримання нами доступу до абстрактних знань і роботи з ними. Тим не менш, вони залишаються майстрами лише на словах: красномовними, але не досвідченими, знаючи, проте безпідставними», — вважає він
На думку вченого, поява «просторового інтелекту» змінить те, як люди «створюють і взаємодіють з реальними і віртуальними світами, здійснивши революцію в літературі, мистецтві, робототехніці, науці і не тільки».
Створення такої технології вимагає навчання моделей не лише на «мові», але й на фізичних властивостях світу
Лі стверджує, що штучний інтелект швидко наближається до меж можливостей текстового навчання, і врешті-решт його прогрес залежатиме від «моделей світу» — нового типу генеративного ШІ, який має вирішувати принципово інший набір завдань, ніж LLM.
Наступний рубіж ШІ - просторовий інтелект, технологія, яка перетворить бачення на розуміння, сприйняття на дію, а уяву на творчість. Але що це таке? Чому це важливо? Як ми можемо це побудувати? І як ми можемо це використовувати?
Сьогодні я хочу поділитися з вами своїми думками про… pic.twitter.com/L0bnJcCUqc
— Fei-Fei Li (@drfeifei) 10 листопада 2025
«Такі системи повинні генерувати просторово узгоджені світи, що підлягають фізичним законам, обробляти мультимодальні вхідні дані — від зображень до дій — і прогнозувати розвиток цих світів», — пояснив Лі
Згідно з баченням професора, просторовий інтелект є «межою за межами мови — здатністю створювати взаємозв'язок».
Ідея «моделей світу»
Концепція з'явилася на початку 1940-х під час досліджень шотландського філософа і психолога Кеннета Крейка в галузі когнітивної науки
Ідея знову виникла в сучасному ІІ-просторі в 2018 році після статті Девіда Ха та Юргена Шмідхубера про те, що нейромережа може навчитися і відтворити компактну внутрішню модель навколишнього середовища і використовувати її як симулятор для планування та управління.
Однак рішення задачі вимагає створення складних систем, здатних зберігати просторову пам'ять та моделювати сцени більш ніж у двох вимірах.
У вересні компанія Лі, World Labs, випустила бета-версію Marble — ранньої «моделі світу», яка створювала інтерактивні тривимірні середовища за допомогою текстових або графічних підказок.
Користувачі могли переміщуватися по згенерованим середовищам без обмежень за часом або завантаженням сцен, а навколишнє середовище залишалося єдиним, не змінювалося і не розпадалося.
Приклад роботи Marble. Джерело: World Labs.
«Наступним рубежем розвитку ШІ стане просторовий інтелект — технологія, яка перетворить бачення на міркування, сприйняття на дію, а уяву на творчість», — сказав Лі, назвавши Marble лише першим етапом.
Нагадаємо, у жовтні Nvidia представила систему для підключення квантових комп'ютерів до ІІ-чіпів компанії. Технологія значно прискорить обробку даних і відкриє нові можливості для досліджень у медицині та матеріалознавстві.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Вчений назвав фізичне мислення головним перешкодою для ШІ - ForkLog: криптовалюти, ШІ, сингулярність, майбутнє
Штучний інтелект поки не здатний в повній мірі розуміти фізичний світ. На сьогодні це головна проблема технології, заявив професор комп'ютерних наук Стенфордського університету Фей-Фей Лі.
На думку вченого, поява «просторового інтелекту» змінить те, як люди «створюють і взаємодіють з реальними і віртуальними світами, здійснивши революцію в літературі, мистецтві, робототехніці, науці і не тільки».
Створення такої технології вимагає навчання моделей не лише на «мові», але й на фізичних властивостях світу
Лі стверджує, що штучний інтелект швидко наближається до меж можливостей текстового навчання, і врешті-решт його прогрес залежатиме від «моделей світу» — нового типу генеративного ШІ, який має вирішувати принципово інший набір завдань, ніж LLM.
Згідно з баченням професора, просторовий інтелект є «межою за межами мови — здатністю створювати взаємозв'язок».
Ідея «моделей світу»
Концепція з'явилася на початку 1940-х під час досліджень шотландського філософа і психолога Кеннета Крейка в галузі когнітивної науки
Ідея знову виникла в сучасному ІІ-просторі в 2018 році після статті Девіда Ха та Юргена Шмідхубера про те, що нейромережа може навчитися і відтворити компактну внутрішню модель навколишнього середовища і використовувати її як симулятор для планування та управління.
Однак рішення задачі вимагає створення складних систем, здатних зберігати просторову пам'ять та моделювати сцени більш ніж у двох вимірах.
У вересні компанія Лі, World Labs, випустила бета-версію Marble — ранньої «моделі світу», яка створювала інтерактивні тривимірні середовища за допомогою текстових або графічних підказок.
Користувачі могли переміщуватися по згенерованим середовищам без обмежень за часом або завантаженням сцен, а навколишнє середовище залишалося єдиним, не змінювалося і не розпадалося.
Приклад роботи Marble. Джерело: World Labs.
Нагадаємо, у жовтні Nvidia представила систему для підключення квантових комп'ютерів до ІІ-чіпів компанії. Технологія значно прискорить обробку даних і відкриє нові можливості для досліджень у медицині та матеріалознавстві.