Всесторонняя оценка Veo 3 только что проанализировала более 18 000 видео по качественным и количественным показателям. Что особенно впечатляет, так это способность модели воспринимать, редактировать и взаимодействовать с визуальной средой, начиная всего лишь с изображений и текстовых вводов. Система демонстрирует ранние способности к рассуждению, которые появились без явного обучения в этих областях — это значительный шаг вперёд в понимании и манипуляции визуальным контентом искусственным интеллектом. Такой мультимодальный уровень компетентности меняет наши ожидания от моделей следующего поколения для генерации видео.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
8 Лайков
Награда
8
5
Репост
Поделиться
комментарий
0/400
BtcDailyResearcher
· 2025-12-31 20:30
Черт, Veo 3 можно понять визуальную среду прямо из графики и текста? Эта способность к возникновению немного пугает.
Посмотреть ОригиналОтветить0
ForkInTheRoad
· 2025-12-31 13:33
Боже, более 18000 видео тестов? Какой объем данных, должно быть, очень солидный, кажется, Veo 3 действительно тихо делает большие дела
Посмотреть ОригиналОтветить0
mev_me_maybe
· 2025-12-28 21:47
ngl эта способность к появлению действительно не выдерживает, придумана без обучения... кажется, мы ближе к универсальному AGI
Посмотреть ОригиналОтветить0
gas_fee_therapy
· 2025-12-28 21:39
veo3 эта объем данных действительно впечатляет, более 18000+ видеосэмплов позволяют проявить такие способности к логическому мышлению... но честно говоря, ощущается, что до настоящего визуального мышления еще далеко
Посмотреть ОригиналОтветить0
MetaEggplant
· 2025-12-28 21:28
veo3 в этой волне действительно жестко, без явного обучения сам научился делать выводы, вот в чем действительно страшная часть
Всесторонняя оценка Veo 3 только что проанализировала более 18 000 видео по качественным и количественным показателям. Что особенно впечатляет, так это способность модели воспринимать, редактировать и взаимодействовать с визуальной средой, начиная всего лишь с изображений и текстовых вводов. Система демонстрирует ранние способности к рассуждению, которые появились без явного обучения в этих областях — это значительный шаг вперёд в понимании и манипуляции визуальным контентом искусственным интеллектом. Такой мультимодальный уровень компетентности меняет наши ожидания от моделей следующего поколения для генерации видео.