图片理解引擎算法实现简介
本文来自 网易云社区 前言 基于文字的图片检索目前已经很成熟,但在很多情况下并不能满足用户的需求。比如,用户向在大街上看到别人拎了一个很漂亮的包包,也产生购买冲动,所以拍下了这个包包的照片,根据这幅照片找到这个包包的销售价格和商家。再比如,用户偶然看到一些不错的图片,想找到相同或相似的图片。再比如,人脸识别,通过图片获取该图片的内容信息。这些情况下,传统的图片搜索引擎无能为力。 一种基于图片内容的图片理解技术就非常必要了,图片理解引擎基本代表了图片检索和识别的主流技术。图片理解的目标是让计算机对图片内容进行准确完善的表述,目前这个目标还比较遥远,但是在其他方面图片理解已经有了较广泛的应用。目前图片理解引擎的主要应用场景有: 1 人脸理解; 2 商品或物体搜索。目前相似图片搜索引擎有: TinEye , Google , Baidu (百度识图)等等。商品图片搜索引擎有 Like (被 Google 收购), Ebay , Amazon ,淘淘搜等等。人脸理解方面代表的公司有 Google , Facebook 等。可见,目前主流的互联网公司均在图片理解方面进行了大量的投入。这些下面主要介绍下我在针对这三个方面所做的工作进展情况,也欢迎感兴趣同学一起讨论。 涉及的技术简介 图片理解,通常要对图片进行特征提取,利用这些特征对图片内容进行描述