1.一种随机森林哈希的医学CT图像存储与检索方法,其特征在于,包括以下步骤:
1)获取若干医学CT图像并作为训练集,计算所有医学CT图像的标签相似度和流形相似度,标签相似度直接根据图像的标签构建标签相似矩阵,流形相似度根据图像之间的欧氏距离定义相似度;
2)根据求得的标签相似矩阵,将所有图像分块,标签一致的图像分在一个块中;
3)对于每一个块中的图像,利用流形相似度作为边的权值构建图,使用图分割算法为块中的所有图像初始化一位哈希码;
4)将初始化的哈希码作为标签训练随机森林模型,模型的结果更新初始的哈希码;
5)重复3)和4)直到达到预设的哈希码位数;
6)保存所有随机森林模型,并将图像库中的图像映射为哈希码,得到与之对应的哈希码库;
7)当用户输入一张待检索的图像时,随机森林模型将该图像映射为哈希码,在哈希码库中检索与之最近的K个哈希码,将这K个哈希码利用树的决策路径所定义的最大相容规则解码重构为图像返回给用户。
2.根据权利要求1所述的随机森林哈希的医学CT图像存储与检索方法,其特征在于,所述步骤1)标签相似度的计算方法为:标签一致即为相似设为1,标签不一致即为不相似设为-1,无定义则设为0。模型的目标函数如下,i和j表示两张图像的索引,yij表示这两张图像的相似度,hr(x)表示哈希函数,Φ(·)表示哈希函数集,n表示图像的总数量,k表示哈希码位数,r表示哈希码的索引:
3.根据权利要求1所述的随机森林哈希的医学CT图像存储与检索方法,其特征在于,所述步骤1)计算图像之间的距离,公式为其中d2(xi,xj)表示图像xi和xj之间的欧式距离,α和β是常数,再根据图像间的距离计算图像之间的相似度作为图中边的权值:其中τ为常数。
4.根据权利要求1所述的随机森林哈希的医学CT图像存储与检索方法,其特征在于,所述步骤3)-步骤6)应用图分割算法为所有图像初始化一位哈希码,这些哈希码将作为数据标签来训练随机森林分类器,随机森林输出的分类结果再更新初始化的哈希码,如此迭代直到达到预设的哈希码位数,因此,每一个随机森林模型作为一个哈希函数,将原始图像映射为哈希码。
5.根据权利要求3所述的随机森林哈希的医学CT图像存储与检索方法,其特征在于,在所述步骤7)中,在哈希码库中检索与之最近的K个哈希码,具体包括:根据汉明相似度排序求得与待检索图像的哈希码距离最近的K个哈希码,汉明相似度计算公式如下:
6.根据权利要求3所述的随机森林哈希的医学CT图像存储与检索方法,其特征在于,所述步骤7)中将检索到的哈希码解码到图像空间,由于随机森林是若干决策树的集成,树中的每一个叶子结点对应来自根的一条路径,可以基于叶子节点确定这个路径;其次,每条路径对应一个符号规则,可以根据这些规则推导出最大相容规则,这个最大相容规则的每个组成部分覆盖范围都不能扩大,否则就会与其他条件冲突,因此,原始样本不得超出最大相容规则定义的输入区域;最后,根据最大相容规则即可将哈希码解码重构为图像。