百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

以图搜图之“感知哈希”算法实现 感知哈希算法 matlab

liebian365 2024-10-19 07:56 27 浏览 0 评论

00、背景

Google图片搜索是Google公司于2001年7月推出的图片搜索服务。

Google总裁Eric Schmidt表示,Google图片的建立,是因为他想要看"珍妮弗·洛佩兹的绿色范思哲礼服"

2001年,Google图片编入了2.5亿张图片。2005年,这一数字增长到了十亿。到了2010年,已可搜索100亿张图片。截至2010年7月,该服务每天被访问超过一亿次。

01、感知哈希(Perceptual hashing )

感知哈希是使用指纹算法生成各种形式的多媒体的片段、哈希或指纹。

感知哈希是一种位置敏感哈希,如果多媒体的特征相似,则它是类似的。

这与加密哈希相反,加密哈希依赖于输入值的微小变化造成输出值的巨大变化的雪崩效应。

感知散列函数广泛用于查找在线版权侵权案件以及数字取证,因为散列之间具有相关性,因此可以找到相似的数据(例如具有不同的水印)。

它是基于DCT(离散余弦变换)来得到图片的hash值,具体步骤如下:

1、缩小图片:32*32是一个较好的大小,这样方便DCT计算;

2、灰度化:转换为256阶灰度图;

3、计算DCT:DCT把图片分离成分率的集合,DCT(离散余弦变换);

4、缩小DCT:DCT计算后的矩阵是32 * 32,保留左上角的8 * 8,这些代表的图片的最低频率;

5、计算平均值:计算缩小DCT后的所有像素点的平均值;

6、比较平均值:大于平均值记录为1,反之记录为0,得到phash值。

02、发展历史

Marr 和 Hildreth 1980 年的工作是该领域的开创性论文。

Christoph Zauner 2010 年 7 月的论文对该主题进行了精彩的介绍。

2016 年 6 月,Azadeh Amir Asgari 发表了有关鲁棒图像哈希欺骗的研究成果。Asgari 指出,感知哈希函数像任何其他算法一样容易出错。

研究人员在 2017 年 12 月表示,谷歌图像搜索基于感知哈希。

PHA是一类比较哈希方法的统称。图片所包含的特征被用来生成一组指纹(不过它不是唯一的),而这些指纹是可以进行比较的。

这个算法非常巧妙,无论你改变图片的高宽、亮度甚至颜色,都不会改变哈希值。

03、实现示意

04、核心代码

使用差分哈希算法计算图像的64位哈希

  /// <summary>
  /// 使用差分哈希算法计算图像的64位哈希。
  /// </summary>
  /// <param name="image">读取到的图片流</param>
  /// <returns>256位hash值</returns>
  public ulong[] DifferenceHash256(Image<Rgba32> image)
  {
      var pixels = _transformer.TransformImage(image, 17, 16);

      // 遍历像素,如果左侧像素比右侧像素亮,则将哈希设置为1。
      var hash = new ulong[4];
      var hashPos = 0;
      var hashPart = 0;
      for (var i = 0; i < 16; i++)
      {
          var rowStart = i * 17;
          for (var j = 0; j < 16; j++)
          {
              if (pixels[rowStart + j] > pixels[rowStart + j + 1])
              {
                  hash[hashPart] |= 1UL << hashPos;
              }

              if (hashPos == 63)
              {
                  hashPos = 0;
                  hashPart++;
              }
              else
              {
                  hashPos++;
              }
          }
      }

      return hash;
  }

构建索引

      private async void btnIndex_Click(object sender, EventArgs e)
      {
          if (IndexRunning)
          {
              IndexRunning = false;
              btnIndex.Text = "更新索引";
              return;
          }

          if (string.IsNullOrEmpty(txtDirectory.Text))
          {
              MessageBox.Show("请先选择文件夹");
              return;
          }

          IndexRunning = true;
          btnIndex.Text = "停止索引";
          cbRemoveInvalidIndex.Hide();
          var imageHasher = new ImageHasher(new ImageSharpTransformer());
          int? filesCount = null;
          Task.Run(() => filesCount = Directory.EnumerateFiles(txtDirectory.Text, "*", SearchOption.AllDirectories).Except(_index.Keys).Count(s => Regex.IsMatch(s, "(jpg|png|bmp)#34;, RegexOptions.IgnoreCase))).ConfigureAwait(false);
          var local = new ThreadLocal<int>(true);
          await Task.Run(() =>
          {
              var sw = Stopwatch.StartNew();
              long size = 0;
              Directory.EnumerateFiles(txtDirectory.Text, "*", SearchOption.AllDirectories).Except(_index.Keys).Where(s => Regex.IsMatch(s, "(jpg|png|bmp)#34;, RegexOptions.IgnoreCase)).Chunk(Environment.ProcessorCount * 2).AsParallel().WithDegreeOfParallelism(Environment.ProcessorCount * 2).ForAll(g =>
                {
                    foreach (var s in g)
                    {
                        if (IndexRunning)
                        {
                            if (lblProcess.InvokeRequired)
                            {
                                local.Value++;
                                lblProcess.Invoke(() => lblProcess.Text = #34;{local.Values.Sum()}/{filesCount}");
                            }
                            try
                            {
                                _index.GetOrAdd(s, _ => imageHasher.DifferenceHash256(s));
                                size += new FileInfo(s).Length;
                            }
                            catch
                            {
                                LogManager.Info(s + "格式不正确");
                            }
                        }
                        else
                        {
                            break;
                        }
                    }
                });
              lbSpeed.Text = #34;索引速度: {Math.Round(local.Values.Sum() * 1.0 / sw.Elapsed.TotalSeconds)} items/s({size * 1f / 1048576 / sw.Elapsed.TotalSeconds:N}MB/s)";
              if (cbRemoveInvalidIndex.Checked)
              {
                  foreach (var (key, _) in _index.AsParallel().WithDegreeOfParallelism(32).Where(s => !File.Exists(s.Key)))
                  {
                      _index.TryRemove(key, out _);
                  }
              }

              lbIndexCount.Text = _index.Count + "文件";
              cbRemoveInvalidIndex.Show();
              var json = JsonSerializer.Serialize(_index);
              File.WriteAllText("index.json", json, Encoding.UTF8);
              MessageBox.Show("索引创建完成,耗时:" + sw.Elapsed.TotalSeconds + "s");
          }).ConfigureAwait(false);
          IndexRunning = false;
          btnIndex.Text = "更新索引";
      }

索引结构如下:

05、最后效果

匹配度100%:

匹配度74.21%:

相关推荐

“版本末期”了?下周平衡补丁!国服最强5套牌!上分首选

明天,酒馆战棋就将迎来大更新,也聊了很多天战棋相关的内容了,趁此机会,给兄弟们穿插一篇构筑模式的卡组推荐!老规矩,我们先来看10职业胜率。目前10职业胜率排名与一周前基本类似,没有太多的变化。平衡补丁...

VS2017 C++ 程序报错“error C2065:“M_PI”: 未声明的标识符&quot;

首先,程序中头文件的选择,要选择头文件,在文件中是没有对M_PI的定义的。选择:项目——>”XXX属性"——>配置属性——>C/C++——>预处理器——>预处理器定义,...

东营交警实名曝光一批酒驾人员名单 88人受处罚

齐鲁网·闪电新闻5月24日讯酒后驾驶是对自己和他人生命安全极不负责的行为,为守护大家的平安出行路,东营交警一直将酒驾作为重点打击对象。5月23日,东营交警公布最新一批饮酒、醉酒名单。对以下驾驶人醉酒...

Qt界面——搭配QCustomPlot(qt platform)

这是我第一个使用QCustomPlot控件的上位机,通过串口精确的5ms发送一次数据,再将读取的数据绘制到图表中。界面方面,尝试卡片式设计,外加QSS简单的配了个色。QCustomPlot官网:Qt...

大话西游2分享赢取种族坐骑手办!PK趣闻录由你书写

老友相聚,仗剑江湖!《大话西游2》2021全民PK季4月激燃打响,各PK玩法鏖战齐开,零门槛参与热情高涨。PK季期间,不仅各种玩法奖励丰厚,参与PK趣闻录活动,投稿自己在PK季遇到的趣事,还有机会带走...

测试谷歌VS Code AI 编程插件 Gemini Code Assist

用ClaudeSonnet3.7的天气测试编码,让谷歌VSCodeAI编程插件GeminiCodeAssist自动编程。生成的文件在浏览器中的效果如下:(附源代码)VSCode...

顾爷想知道第4.5期 国服便利性到底需优化啥?

前段时间DNF国服推出了名为“阿拉德B计划”的系列改版计划,截至目前我们已经看到了两项实装。不过关于便利性上,国服似乎还有很多路要走。自从顾爷回归DNF以来,几乎每天都在跟我抱怨关于DNF里面各种各样...

掌握Visual Studio项目配置【基础篇】

1.前言VisualStudio是Windows上最常用的C++集成开发环境之一,简称VS。VS功能十分强大,对应的,其配置系统较为复杂。不管是对于初学者还是有一定开发经验的开发者来说,捋清楚VS...

还嫌LED驱动设计套路深?那就来看看这篇文章吧

随着LED在各个领域的不同应用需求,LED驱动电路也在不断进步和发展。本文从LED的特性入手,推导出适合LED的电源驱动类型,再进一步介绍各类LED驱动设计。设计必读:LED四个关键特性特性一:非线...

Visual Studio Community 2022(VS2022)安装图文方法

直接上步骤:1,首先可以下载安装一个VisualStudio安装器,叫做VisualStudioinstaller。这个安装文件很小,很快就安装完成了。2,打开VisualStudioins...

Qt添加MSVC构建套件的方法(qt添加c++11)

前言有些时候,在Windows下因为某些需求需要使用MSVC编译器对程序进行编译,假设我们安装Qt的时候又只是安装了MingW构建套件,那么此时我们该如何给现有的Qt添加一个MSVC构建套件呢?本文以...

Qt为什么站稳c++GUI的top1(qt c)

为什么现在QT越来越成为c++界面编程的第一选择,从事QT编程多年,在这之前做C++界面都是基于MFC。当时为什么会从MFC转到QT?主要原因是MFC开发界面想做得好看一些十分困难,引用第三方基于MF...

qt开发IDE应该选择VS还是qt creator

如果一个公司选择了qt来开发自己的产品,在面临IDE的选择时会出现vs或者qtcreator,选择qt的IDE需要结合产品需求、部署平台、项目定位、程序猿本身和公司战略,因为大的软件产品需要明确IDE...

Qt 5.14.2超详细安装教程,不会来打我

Qt简介Qt(官方发音[kju:t],音同cute)是一个跨平台的C++开库,主要用来开发图形用户界面(GraphicalUserInterface,GUI)程序。Qt是纯C++开...

Cygwin配置与使用(四)——VI字体和颜色的配置

简介:VI的操作模式,基本上VI可以分为三种状态,分别是命令模式(commandmode)、插入模式(Insertmode)和底行模式(lastlinemode),各模式的功能区分如下:1)...

取消回复欢迎 发表评论: