对类型1,通常是通过Alt等锚来索引,搜索的,您可以访问搜索引擎,比如百度、GOOGLE。在搜索框内输入搜索文字,点击右侧的“图片搜索”按纽,即可获得相关图片搜索结果。《浅谈图片搜索引擎的实现》中提出了跨越性的图片搜索的实现,具有很高的参考价值。
对类型2,涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科,其相关技术主要包括:图像数据模型、特征提取方法、索引结构、相似性度量、查询表达模式、检索方法等。相似图片的检测主要涉及特征表示和相似性度量这两类关键技术。图像特征的提取与表达是基于内容的图像处理技术的基础。从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如颜色、纹理、形状等)两类。由于我们需要处理相似图片的识别,这里主要介绍图像视觉特征的提取和表达。
视觉特征又可分为通用的视觉特征和领域相关(局部/专用)的视觉特征。前者用于描述所有图像共有的特征,与图像的具体类型或内容无关,主要包括颜色、纹理和形状;后者则建立在对所描述图像内容的某些先验知识(或假设)的基础上,与具体的应用紧密有关,例如人的面部特征或指纹特征等。由于领域相关的图像特征主要属于模式识别的研究范围,并涉及许多专业的领域知识,在此我们就不再详述,而只考虑通用的视觉特征。
对于某个特定的图像特征,通常又有多种不同的表达方法。由于人们主观认识上的千差万别,对于某个特征并不存在一个所谓的最佳的表达方式。事实上,图像特征的不同表达方式从各个不同的角度刻画了该特征的某些性质