能够识别图片中的物体的智能工具
人工智能研究最有趣的领域之一就是计算机视觉(computer vision),从无人驾驶汽车内部构件到机器猜年龄,计算机视觉系统软件拥有着很大的开发潜能。
近期,计算机科学家史蒂芬·沃尔夫勒姆(Stephen Wolfram)发布了一种新工具,名叫“沃尔夫勒姆图片识别项目”( Wolfram Image Identification Project)。用户借助这项工具首先需要上传或者链接到一张图片,然后就可以看到计算机如何来识别图片中物体。
沃尔夫勒姆是这样描述他的工具的:跟很多计算机视觉项目不同,沃尔夫勒姆项目围绕一种“人工神经网络”而建立。人工神经网络实际上是一种软件框架,它的设计灵感来自能够进行图片识别的生物大脑。沃尔夫勒姆构造的“人工神经网络”是可以通过数千万标签图片“训练”出来的。
“我们不需要用老方法来描述一个物体,比如椅子。我们所做的一切就是提供很多类型的椅子。你也可以这么说,‘任何跟我们想将其定义为椅子的物体’。这样,我们就会把那些跟我们所定义的‘椅子’很接近图片贴上‘椅子’标签,其他则排除在外。”沃尔夫勒姆表示。
Business Insider网站通过测试发现,在多数情况下,这款图片识别器能够至少抓住图片中的“关键点”。比如,它能够将希拉里·克林顿和玛丽莎·梅耶尔准确地归类为“人”,不过它无法识别按名字来识别出他们。它能够将Paris cafe Le Comptoir归类为“一座建筑”。
不过,在某些情况下,沃尔夫勒姆识别工具会完全忽略掉图片中的人,将焦点集中于某些没有生命的物体上。比如,在拳王格罗夫金(Gennady Golovkin)一张拳击比赛图片中,这项算法锁定在了拳击手套上,并提供了有关这双拳击手套的其他信息,比如重量和材质。
在另一张肯德基宣传广告图片中,该算法忽视掉了里面的主人公,只是将焦点放在了主人公身旁的汽车,并将其识别为“交通”。
对于三星手机,这项工具将其识别为“远程控制”,跟上面提到的拳击手套一样,系统还提供一些文字介绍。
在这张特斯拉汽车图片中,系统注意到了汽车前面站立的人(特斯拉CEO马斯克),但是它将马斯克身后的汽车归类为“两门”小轿车,而不是四门汽车。
在另一张视频游戏Doom4截图中,系统将图片中的士兵竟然识别为一只“蜘蛛”,并在下面提供有关这类蜘蛛的名称和最大年龄信息。
智能界(www.znjchina.com)是中国首家专注于报道智能科技前沿的综合垂直门户,秉承“引领未来智能生活”的理念,持续关注智能家居、可穿戴设备、智能医疗、机器人、3D打印、智驾等诸多科技前沿领域,提供最前沿、最时尚、最实用、最专业的硬件产品介绍、硬件评测、服务定制、最新资讯、圈子交流等服务,致力于成为最具价值的智能科技信息互动平台。
智能界【微信公众号ID:znjchina】【新浪/腾讯微博:@智能界】
数量:6 | 申请人数:211 | 申领:100积分 |
最新评论