实现海量数据下的基于内容图片检索系统,一直是图像检索领域研究的热点问题。基于内容的图像检索系统是根据图像的内容,在已有图像集中找到最『相近』的图片,而这类系统的效果(精准度和速度)和两个因素直接相关:图片特征的表达能力,近似最近邻的查找。其基本背景和原理是基于深度学习的关于二值检索向量的实现快速图像检索的方法。本技术利用深度学习框架产出的特征来替代传统图像特征,希望能对图像有更精准的描绘程度,一般分为两个部分:首先采用二值检索向量分桶查找近似最近邻分类,然后利用图像特征表征桶内图像检索,在兼顾实时性的同时保证较高的识别率。海量数据下的基于内容的图像检索系统,在250w的图像容量中,对于给定图片,检索top 1000相似的时间耗时约为1s,在GPU上的耗时更是毫秒级,而准确率依然能够保持在>90%水平上。利用本技术可实现在本技术可以应用于图像搜索、网页搜索、涂书笔记、街景等互联网产品以及自动驾驶等创新性研究领域。