SSIM

Индекс структурного сходства (SSIM от англ. structure similarity) является одним из методов измерения схожести между двумя изображениями. SSIM-индекс это метод полного сопоставления, другими словами, он проводит измерение качества на основе исходного изображения (не сжатого или без искажений). SSIM-индекс является развитием традиционных методов, таких как PSNR (peak signal-to-noise ratio) и метод среднеквадратичной ошибки MSE, которые оказались несовместимы с физиологией человеческого восприятия.

Отличительной особенностью метода, помимо упомянутых ранее (MSE и PSNR), является то, что метод учитывает «восприятие ошибки» благодаря учёту структурного изменения информации. Идея заключается в том, что пиксели имеют сильную взаимосвязь, особенно когда они близки пространственно. Данные зависимости несут важную информацию о структуре объектов и о сцене в целом.

SSIM метрика рассчитана на различные размеры окна. Разница между двумя окнами x {\displaystyle x} и y {\displaystyle y} имеющими одинаковый размер N×N:

SSIM ( x , y ) = ( 2 μ x μ y + c 1 ) ( 2 σ x y + c 2 ) ( μ x 2 + μ y 2 + c 1 ) ( σ x 2 + σ y 2 + c 2 ) , {\displaystyle {\text{SSIM}}(x,y)={\frac {(2\mu _{x}\mu _{y}+c_{1})(2\sigma _{xy}+c_{2})}{(\mu _{x}^{2}+\mu _{y}^{2}+c_{1})(\sigma _{x}^{2}+\sigma _{y}^{2}+c_{2})}},}

где

  • μ x {\displaystyle \mu _{x}} среднее x {\displaystyle x} ,
  • μ y {\displaystyle \mu _{y}} — среднее y {\displaystyle y} ,
  • σ x 2 {\displaystyle \sigma _{x}^{2}} дисперсия x {\displaystyle x} ,
  • σ y 2 {\displaystyle \sigma _{y}^{2}} — дисперсия y {\displaystyle y} ,
  • σ x y {\displaystyle \sigma _{xy}} ковариация x {\displaystyle x} и y {\displaystyle y} ,
  • c 1 = ( k 1 L ) 2 {\displaystyle c_{1}=(k_{1}L)^{2}} , c 2 = ( k 2 L ) 2 {\displaystyle c_{2}=(k_{2}L)^{2}} — две переменных:
    • L {\displaystyle L} — динамический диапазон пикселей (обычно 2 (bits per pixel) 1 {\displaystyle 2^{\text{(bits per pixel)}}-1} ),
    • k 1 = 0 , 01 {\displaystyle k_{1}=0{,}01} и k 2 = 0 , 03 {\displaystyle k_{2}=0{,}03} — константы.

Приведённая формула применима только для яркости изображения, по которой и происходит оценка качества. Полученный SSIM-индекс лежит в пределах от −1 до +1. Значение +1 достигается только при полной аутентичности образцов. Как правило, метрика рассчитана на окно размером 8×8 пикселей. Окно может смещаться через пиксель, но специалисты рекомендуют использовать группы окон для уменьшения сложности вычислений.

Структурные отличия (DSSIM от англ. Structural dissimilarity) можно выразить через SSIM-метрику:

DSSIM ( x , y ) = 1 SSIM ( x , y ) 2 . {\displaystyle {\text{DSSIM}}(x,y)={\frac {1-{\text{SSIM}}(x,y)}{2}}.}

См. также

Ссылки

  • Z. Wang, A. C. Bovik, H. R. Sheikh and E. P. Simoncelli, "Image quality assessment: From error visibility to structural similarity", IEEE Transactions on Image Processing, vol. 13, no. 4, p. 600–612, Apr. 2004.
  • Loza et al., "Structural Similarity-Based Object Tracking in Video Sequences", Proc. of the 9th International Conf. on Information Fusion, 2006.

Внешние источники

  • (en) Домашняя страница
  • (en) Исполнение на языке Rust
  • (en) Исполнение на языке C/C++
  • (en) Реализация DSSIM на языке C++
  • (en) Реализация Криса Ломонта на C#
  • (en) qpsnr implementation (multi threaded C++)