周一的时候我们不是分享了一个纯本地的 AI 模型文字搜图 App 寻隐嘛,作用于相册,文字搜图的效果确实很强。
但可惜的是,作者在免费开源前,只开发了 iOS 版,且基于实现原理,限制了手机芯片和 iOS 版本,让很多小伙伴错过了这款工具。
这里有一个好消息,在上周寻隐免费开源后,又有一家大公司推出了类似于寻隐,即自然语言搜图的功能,而且不限安卓、苹果设备,全都能用。
但问题嘛,出的,还安排给了百度网盘,只能用于搜索百度网盘内的资源。
虽然对国内大厂出品有先天的怀疑哈,但是骡子是马,咱们测一测再说。
高级图片搜索
百度网盘这两天正式推出的高级图片搜索功能,入口并不难找,去度盘 App 上搜一手「高级图片搜索功能」就能找到。
然后会跳转到确认体验的界面,点击「立即体验」即可,但有App 的版本要求(11.31 及以上)。
点击体验后,底部按钮上的文字就会变成「已启用,数据升级中」。
数据升级?说的高大上,其实就是寻隐中的建立图片索引。
之前也和大家简单介绍过背后的原理,寻隐用的是作者自训练的 CLIP 模型,而百度网盘用的是自家百度文心的 VIMER-ViLP 模型,不过这个建立索引的过程,由寻隐的本地实现,跑到了云端完成。
当时我们也测过,寻隐 5422 张图片,大概用时 1 分钟左右的时长,极限速度在平均 10000 张/分钟左右。
那现在跑到了云端,是不是我们在体验上,索引的建立速度能更快呢?
emmm,一言难尽,前后试了两个号,百余张图从上午 11:30 等到了到 13:29;千余张图从 13:30 等到了 16:10。
功能背后实现的方式不同、模型不同,时间上有差异很正常,但能等这么长时间,我是真没想到。
而且索引建立的时间慢也就算了,我本来是想用周一那篇寻隐测试所用到的图片,去测试一下百度网盘。
结果这个高级图片搜索功能,看起来并不支持图库的热更新,啥意思?就是我今天上传网盘的图片,皆没有建立索引,无法被成功搜索。。。
这一度让我差点放弃了测试,无他,我压根就没有网盘同步相册的习惯,没有实拍照片,自然谈不上最真实的测试。
好在问了一圈,有朋友曾经不小心同步过一次,这才有了下面的测试成果。
效果展示
在开启「高级图搜」,并收到索引建立成功的系统通知后,操作上 0 门槛,搜就完事了。
可以搜具体的物品或场景,比如「公交」,就能找到网盘里的「公交车」本身以及「在公交车上拍的照片」:
可以搜天气,搜环境,让 AI 返回给你适配的照片:
也可以搜动作,搜行为,找到相关的照片:
不知道大家注意到没有,和寻隐里,把所有照片根据提示词的关联程度尽数排列不同,度盘这里的操作是只展示了最大关联的图。
这就导致了一些问题,比如提示词不到位的时候,你可能一张图也搜不出来——
橘猫,出不来一张图:
橘色的猫,能找到 90 张图:
至于什么词能搜到,什么词搜不到,就得看模型对图片的「理解力」了,一两张图的不到位,尚在理解范围内。
而且大家发现没有,在度盘上搜出来的图,很多是标注了「地点」和「分类」标签的,这里就是大厂出品的优势了——
传统相册依据图片信息的分类,可以和度盘的高级图搜功能同时起作用。
比如我搜「地铁」,一共有 8 张,分别有北京和郑州两个地点。
但我只要搜「北京地铁」,度盘这里就会剔除掉拍摄地点不在北京的照片,所以从 8 张变成了 7 张。
同样的,不光是地点,拍照、上传的时间也在度盘高级图搜筛选的范围里,比如搜「食物」,有 88 张。
而搜「2020 年的食物」,就精选到了 28 张。
这些标签如同给 AI 绘画加了 ControlNet,可控且搜索精度更高,实话实说,这点确实比寻隐更强。
对了,看来身份证正反面这里,百度的模型也没搞定。。。
结语
这如果是在体验过寻隐之前,我一定会觉得牛 Plus,但有了「竞品」对照后,难免会鸡蛋里挑骨头——
1、建立索引的时间是真的慢,关键是不支持快速增量更新。
2、云端工具出了个云端功能,合情合理,但涉及到照片隐私,不可避免的会对安全存疑,至少我还是抗拒把照片上传到大厂云端。
以上就是本篇文章【百度网盘这个新功能你敢用吗?】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/news/461.html 资讯 企业新闻 行情 企业黄页 同类资讯 首页 网站地图 返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多