
„Physics-IQ“, разработен от INSAIT и Google DeepMind беше, представен на ICCV 2025

INSAIT, в партньорство с Google DeepMind, успешно представи новия сравнителен тест Physics-IQ по време на ICCV 2025 – едно от водещите световни събития в областта на компютърното зрение и изкуствения интелект. Проектът е ръководен от Сам Мотамед, докторант в INSAIT, и предизвика широк отзвук сред международната изследователска общност.
Изследването представлява важна стъпка към по-задълбочено разбиране на ограниченията и възможностите на съвременните генеративни видео модели по отношение на физическото разсъждение. Physics-IQ включва 396 реални видеа, обхващащи разнообразни физични процеси – от динамика на течности до механика на твърди тела – и поставя моделите пред задачата да предвиждат бъдещи взаимодействия, изискващи реално физическо разбиране.
Резултатите показват, че дори водещи модели като Sora, Runway и VideoPoet, макар и да генерират визуално впечатляващи видеа, не успяват да възпроизведат коректно физическите закономерности. Това подчертава разликата между визуално възприятие и реално разбиране на физичните процеси.
Проектът предизвика значителен интерес сред академичната и технологичната общност, като очертава необходимостта от интегриране на интерактивни и експериментални подходи в бъдещото развитие на AI системи за видео.
Отворените данни, код и резултати са достъпни свободно: