地址:重庆市北碚区歇马镇双凤桥94号
电话:023-68246888
传真:023-68246888
邮箱:admin@youweb.com
您的当前位置: 开云(中国)Kaiyun·官方网站 - 登录入口 > 新闻资讯 > 公司动态
更新时间:2025-02-26 22:31:12
五金就在今天,腾讯AI助手“腾讯元宝”再次上新——所接入的DeepSeek能够理解图片信息了。在此之前,DeepSeek主要支持扫描图片中的文字。
首先来试试基本的看图说话,测试一下大模型的多模态理解能力。记者在网上随便找了一张多只小猫的图片,问AI哪一只最可爱,它迅速给出了回答:
可以看到,AI自主选择了一只它认为最治愈的小猫,并详细地描绘了这只猫咪的位置、颜色、眼神和动态。还解读了为什么说这只猫咪治愈,并且用比喻句形容:它就像一缕阳光,瞬间驱散你心中的阴霾。
如果再增加一点难度,让它进一步推理和思考,它的表现怎么样?记者找了一张电影《哪吒2》里申公豹的剧照,让AI用卑微的语气写他会对我说什么。
它的回答是“您瞧,我不过是个被命运戏弄的小角色,连玉虚宫的门槛都跨不过去,只能在角落里默默…… ”
为了继续探索它的识图和计算能力,我们又上了一点难度:给它一张只有13把椅子的图,让它规划30个人吃饭怎么安排座位。虽然它没有数出来图中的椅子数量,还是从多个角度给出了自己的答案:
在这些方案中,不仅考虑到了工学参数,还考虑到了美学延续方案和应急预案,可以说是很周到了。
不过在实测过程中也发现一些小问题,比如无法完全做到让DeepSeek“识人”,需要借助图片上的文字提示。比如记者给了它一张《西游记》的剧照,让它分析图中哪个人物最厉害,它的回答如下:
最后它还给自己找补:“画面中央的唐僧是精神领袖,但手持金箍棒、随时迎战的孙悟空才是实力巅峰。”
既然AI能识图了,那么它能否根据某一张剧照,判断当时的剧情故事呢?记者发了一张《甄嬛传》滴血验亲名场面的图片,这一次,AI展现了自己强大的推理能力和联想能力。
虽然它把台词中的“熹贵妃”识别成了“票贵妃”,但是没有妨碍答案的正确,并且精准定位到了《甄嬛传》第63集。
最后,它还对这段剧情进行了总结和点评:“具体情节为祺嫔联合皇后党羽诬陷甄嬛私通,引发朝堂与后宫的双重震荡,是剧中逻辑缜密、冲突激烈的经典段落。”DeepSeek能读懂图片了!没认出《西游记》但精准识别《甄嬛传》滴血验亲名场面
友情链接: