英国爱丁堡大学(University of Edinburgh)在新闻稿中指出,该校的研究团队表示,最先进的AI模型无法可靠地解释时钟指针的位置或正确回答有关日历上日期的问题。
该团队说,有别于简单地识别形状,看懂时钟和日历需要结合空间意识(spatial awareness)、背景和基础数学——这对AI来说仍具有挑战性。
该团队测试了处理文字和图像的AI系统——称为多模态大型语言模型(Multimodal Large Language Model)——是否可以经由查看时钟或日历的图片来回答与时间相关的问题。
他们测试了各种时钟设计,包括带有罗马数字的时钟、带有和不带有秒针的时钟以及具有不同颜色的表盘的时钟。
结果发现,AI系统准确判断时钟指针位置的次数不到四分之一。当时钟上有罗马数字或格式化的指针时,错误更容易发生。