图像质量评估论文 | Deep-IQA | IEEETIP2018

news/2024/5/20 7:54:16 标签: 机器学习, 人工智能, 计算机视觉, python, 聚类

主题列表:juejin, github, smartblue, cyanosis, channing-cyan, fancy, hydrogen, condensed-night-purple, greenwillow, v-green, vue-pro, healer-readable, mk-cute, jzman, geek-black, awesome-green, qklhk-chocolate

贡献主题:https://github.com/xitu/juejin-markdown-themes

theme: juejin
highlight:

文章来自:同作者微信公众号【机器学习炼丹术】~

  • 论文名称:“Deep Neural Networks for No-Reference and Full-Reference Image Quality Assessment”
  • 论文链接:https://arxiv.org/pdf/1612.01697.pdf

0 综述

这一篇文章和上一篇的rank-IQA感觉都是不错的处理NR-IQA任务的框架,让我们好好学一学这一篇文章中的精髓。

1 related work

这一篇文章的related work列举了很多之前的NR-IQA的模型:

  • 【18】
    • DIIVINE:先识别图像失真的类型,然后选择对应类型的回归模型得到具体质量分数;
  • 【20】
    • BRISQUE:利用非对称广义高斯分布在空间域对图像进行建模,模型特征是空间邻域的差值;
  • 【21】
    • NIQE:利用多元高斯模型提取特征,然后利用无监督的方法把他们和质量分布结合起来;
  • 【22】
    • FRIQUEE:把人工提取的特征图输入到4层的深度置信网络中,输出特征向量,利用SVM分类;
  • 【24】
    • CORNIA:最先使用纯数据驱动解决NR-IQA问题的模型之一,使用k-mean聚类处理亮度和对比度被标准化的图片patch,然后从数据中抽取软编码距离来预测质量分数;
  • 【28】
    • BIECOM:第一步用标准话的图片patch经过CNN估计出一个本地质量分数(这个模型是使用现有的FR数据集预训练),然后在把分数的均值和方差作为特征回顾分数;

不说了,看了半天很多都是很老的人工特征的方法,不太行不太行。

1 细节

1.1 FR-IQA

论文中也是使用了和上一篇文章rank-IQA一样的模型,孪生网络saimese net,论文中先提出了FR-IQA的模型框架:

在这个框架中,图片是被patch称32x32的大小,然后feature extractor使用的是VGG19,包含5个maxpool层,也就是说,经过features extractor后,特征会变成(512,1,1)这样的shape。

对于FR-IQA问题,reference patch和distorted patch经过feature extractor得到两个512的向量,然后在fusion阶段使用concat拼接在一起,除了这两个,还把两个特征向量的差值也一同拼接进来,显式的把两个特征的区别也作为特征了,总之是这个样子的: c o n c a t ( f r , f d , f r − f d ) concat(f_r,f_d,f_r-f_d) concat(fr,fd,frfd)

在fusion features vector后面有两个部分,一个是回归,一个是weights;关于如何从很多的patches中得到整个图片的质量分数,作者给出了两个方法: 这个patch是从图像中无重叠的采样

  1. 简单的平均。

对于这种平均的方法,所有patch对于整个图片的影响是相同的,所以损失函数也定位MAE:

  1. 加权平均。
    如上图的结构,对特征进行融合之后,进行回归,输出一个patch的质量分数之后,还要在另外一个分支输出这个patch在整个图片中的权重分数。权重参数保证是大于0的。

1.2 NR-IQA


就是单纯的把reference去掉,然后不做特征融合。

2 总结

这是一种利用CNN来处理质量评估的一个基本框架和思路。作为入门学习是比较好的一个框架。


http://www.niftyadmin.cn/n/1358327.html

相关文章

图片质量评估论文 | 无监督SER-FIQ | CVPR2020

文章转自:同作者微信公主号【机器学习炼丹术】。欢迎交流,共同进步,微信号cyx645016617 论文名称:SER-FIQ: Unsupervised Estimation of Face Image Quality Based on Stochastic Embedding Robustness论文链接:https…

图像分割论文 | DRN膨胀残差网络 | CVPR2017

文章转自:同作者个人微信公众号【机器学习炼丹术】。欢迎交流沟通,共同进步,作者微信:cyx645016617 论文名称:‘Dilated Residual Networks’论文链接:https://arxiv.org/pdf/1705.09914.pdf 0 综述 这篇…

笔记 | 吴恩达新书《Machine Learning Yearning》

这本书共112页,内容不多,偏向于工程向,有很多不错的细节,在此记录一下。 0 书籍获取 关注微信公众号“机器学习炼丹术”,回复【MLY】获取pdf 1 测试集与训练集的比例 2 误差分析 误差分析我感觉是一个成熟的AIer必…

自监督SOTA框架 | BYOL(优雅而简洁) | 2020

文章原创自微信公众号「机器学习炼丹术」作者:炼丹兄联系方式:微信cyx645016617 本篇文章主要讲解两个无监督2020年比较新比较火的论文: 论文名称:“Bootstrap Your Own Latent: A New Approach to Self-Supervised Learning”论…

自监督图像论文复现 | BYOL(pytorch)| 2020

文章原创自微信公众号「机器学习炼丹术」作者:炼丹兄联系方式:微信cyx645016617 继续上一篇的内容,上一篇讲解了Bootstrap Your Onw Latent自监督模型的论文和结构: https://juejin.cn/post/6922347006144970760 现在我们看看如何用pytorch来…

VIT Vision Transformer | 先从PyTorch代码了解

文章原创自:微信公众号「机器学习炼丹术」作者:炼丹兄联系方式:微信cyx645016617 代码来自github 【前言】:看代码的时候,也许会不理解VIT中各种组件的含义,但是这个文章的目的是了解其实现。在之后看论文…

图像分割 | Context Prior CPNet | CVPR2020

文章转自微信公众号:「机器学习炼丹术」文章作者:炼丹兄(已授权)作者联系方式:cyx645016617论文名称:“Context Prior for Scene Segmentation” 0 综述 先上效果图,CPNet似乎对一些难样本有着…

超声心动图评价左室舒张功能的建议:来自美国超声心动图学会和欧洲心血管成像协会的更新

笔记整理人:炼丹兄(已授权) 联系方式:微信cyx645016617(欢迎交流互相学习) 论文名称:“Recommendations for the Evaluation of Left Ventricular Diastolic Function by Echocardiography: A…