C, PHP, VB, .NET

Дневникът на Филип Петров


* Преоразмеряване на изображения

Публикувано на 01 март 2018 в раздел Информатика.

Нека за удобство приемем, че работим със стандарт RGB24. Вече знаем, че за всеки пиксел се пазят три числа в интервала [0; 255]. Искаме на направим т.нар. „upscale“ – да направим изображението по-голямо (с по-голям брой пиксели по хоризонтала и вертикала). Има три популярни алгоритъма за извършване на това и ще разгледаме всеки един от тях поотделно с прости примери.

Нека започнем с едно примерно квадратче от 2х2 пиксела:

R: 100
G: 160
B: 140
R: 200
G: 140
B: 160
R: 150
G: 150
B: 150
R: 350
G: 200
B: 100

Искаме да го разтеглим така, че да стане 4х4 пиксела, т.е. да попълним числата в следната таблица:

R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___

Алгоритъм „най-близък съсед“ (nearest neighboor)

При този алторитъм използваме т.нар. „проксимална интерполация“. При него трябва да вземем съществуващите пиксели и да ги повторим. Нека за старт да вземем по-простия линеен вариант на задачата – матрицата от пиксели ще е само с един ред – първия ред в оригиналната таблица:

№0 №1
0% 100%
R: 100
G: 160
B: 140
R: 200
G: 140
B: 160

В заглавните клетки обозначихме, че първият пиксел се намира в началото на реда (0%), а вторият пиксел се намира в неговия край (100%). Новият ред, който трябва да се попълни, ще бъде следният:

№0 №1 №2 №3
0% 25% 50% 100%
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___

Ще разгледаме новата таблица като една линия с начало в 0,0 (0%) и край в 1,0 (100%). Взимаме нулевата клетка №0. Нейното разстояние от началото на линията е 0,0. Умножаваме по най-големия номер от първата таблица – 1 – и получаваме пак 0,0. Закръгляваме и естествено пак се получава 0. Следователно в първата клетка слагаме пиксел №0 от оригиналната таблица:

№0 №1 №2 №3
0% 25% 50% 100%
R: 100
G: 160
B: 140
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___

Взимаме клетка №1. Нейното разстояние от началото на линията е 25%, т.е. 0,25. Умножаваме по най-големия номер от първата таблица – 1 – и получаваме 0,25. Заклъглено това е 0. Следователно във втората клетка слагаме пиксел №0 от оригиналната таблица.

№0 №1 №2 №3
0% 25% 50% 100%
R: 100
G: 160
B: 140
R: 100
G: 160
B: 140
R: ___
G: ___
B: ___
R: ___
G: ___
B: ___

Взимаме клетка №2. Нейното разстояние от началото на линията е 50%, т.е. 0,50. Умножаваме по най-големия номер от първата таблица – 1 – и получаваме 0,50. Заклъглено това е 1. Следователно във третата клетка слагаме пиксел №1 от оригиналната таблица.

№0 №1 №2 №3
0% 25% 50% 100%
R: 100
G: 160
B: 140
R: 100
G: 160
B: 140
R: 200
G: 140
B: 160
R: ___
G: ___
B: ___

Взимаме клетка №2. Нейното разстояние от началото на линията е 100%, т.е. 1,0. Умножаваме по най-големия номер от първата таблица – 1 – и получаваме 1,0. Заклъглено това е 1. Следователно в четвъртата клетка слагаме пиксел №1 от оригиналната таблица.:

№0 №1 №2 №3
0% 25% 50% 100%
R: 100
G: 160
B: 140
R: 100
G: 160
B: 140
R: 200
G: 140
B: 160
R: 200
G: 140
B: 160

Как да постъпим в двумерния вариант на задачата, т.е. когато трябва да разширим цялата матрица, а не само един нейн ред? Отново ще приложим проксималната интерполация, но вече с алгоритъм за две размерности. Общата формула за изчисление на произволна клетка в резултатната таблица е:

  X_нова_таблица * най-голям-номер-ред-стара
X = ------------------------------------------
      най-голям-номер-ред-нова
 
  Y_нова_таблица * най-голям-номер-колона-стара
Y = ---------------------------------------------
      най-голям-номер-колона-нова

Тук под Х разбираме номер на ред, а под Y номер на колона. Разбира се работим с цели числа, т.е. трябва резултатите да се закръгляват. Да проверим. Ако вземем например клетка (1,3) от товата таблица, ще имаме следната формула (припомняме, че индексирането започва от нулев елемент!):

X_стара_таблица = закръглено(1 * 1 / 3) = 0
Y_стара_таблица = закръглено(3 * 1 / 3) = 1

Следователно в клетка (1,3) от новата таблица трябва да сложим стойността на клетка (0,1) от старата.

Ето изчисленията от попълването на цялата нова таблица (припомняме, че на места се получава индекс по-голям от максималния в старата таблица и там взимаме последния):

X=0*1/3=0
Y=0*1/3=0
.
X=0*1/3=0
Y=1*1/3=0
.
X=0*1/3=0
Y=2*1/3=1
.
X=0*1/3=0
Y=3*1/3=1
.
X=1*1/3=0
Y=0*1/3=0
.
X=1*1/3=0
Y=1*1/3=0
.
X=1*1/3=0
Y=2*1/3=1
.
X=1*1/3=0
Y=3*1/3=1
.
X=2*1/3=1
Y=0*1/3=0
.
X=2*1/3=1
Y=1*1/3=0
.
X=2*1/3=1
Y=2*1/3=1
.
X=2*1/3=1
Y=3*1/3=1
.
X=3*1/3=1
Y=0*1/3=0
.
X=3*1/3=1
Y=1*1/3=0
.
X=3*1/3=1
Y=2*1/3=1
.
X=3*1/3=1
Y=3*1/3=1
.

Извършвайки сметките и закръгляванията им, получаваме:

R: 100
G: 160
B: 140
R: 100
G: 160
B: 140
R: 200
G: 140
B: 160
R: 200
G: 140
B: 160
R: 100
G: 160
B: 140
R: 100
G: 160
B: 140
R: 200
G: 140
B: 160
R: 200
G: 140
B: 160
R: 150
G: 150
B: 150
R: 150
G: 150
B: 150
R: 350
G: 200
B: 100
R: 350
G: 200
B: 100
R: 150
G: 150
B: 150
R: 150
G: 150
B: 150
R: 350
G: 200
B: 100
R: 350
G: 200
B: 100

Изпробвайте да разширите оригиналната таблица до размери 5х5.

Проксималната интерполация, с която се постига реализирането на алгоритъма за „най-близък съсед“, е добра за графики, които трябва да съхранят своята „пикселизация“. При този метод няма преливане на цветовете от една точка в друга точка – има просто тяхно копиране. По този начин „назъбените“ линии ще си останат назъбени. Например следната малка картинка:

Ще бъде увеличена тройно до тази:


Ако увеличите дори още повече, ще видите, че квадратните пиксели се уголемяват (и си остават квадратни), като не се внася никакъв никакъв шум в бялото пространство между тях или около тях. Ето как ще изглежда още по-силно уголемяване на само малък фрагмент от картинката:

Казано по друг начин, при уголемяване на изображения по метода за „най-близък съсед“ се запазва качеството им. Ако след уголемяване те се смалят обратно до оригиналния си размер, обикновено се връщат в точния си първоначален вид – може да има минимални разминавания в рамките на отделни пиксели, като причинител за това ще са закръгленията, когато някой пиксел е точно по средата на линията между други два (0,50 е точно по средата между 0 и 1, но избираме да го закръглим нагоре, т.е. избираме съседа в дясно, а не в ляво).

Колкото до намаляването на изображения – същият метод естествено е приложим и за тази дейност. Трябва обаче да се досетим, че при намаляване на изображението неминуемо ще се изгубят пиксели – ще има такива от старата матрица, които няма да бъдат пренесени в новата. Така може спокойно да се каже, че се губи от качеството. Ето примери за това. Ако вземем следната оригинална картинка (дали снимката е с малко на брой цветове като дадената или не, не е от значение):

Ако я намалим я до много малък размер:

И след това я увеличим обратно до оригиналния, ще получим:

Очевидно е, че огромно количество от информацията се е загубила в процеса на downscale. При това, за разлика от това, което показват по филмите, информацията е невъзстановима.

В днешно време скалирането на изображения по метода „най-близък съсед“ се използва например при емулирането на стари електронни игри при разтягането им на цял екран (например до 1080p или 4K). Ако играчът желае да получи точен (оригинален) образ от играта, независимо от това, че ще получи остри ръбове и „пикселизирана“ картина, това е един адекватен и много бърз алгоритъм за рязтягане на изображенията. По-скоро ще е неподходящ при разтегляне на снимки, защото там бихме очаквали преливания на цветовете и „замазване“ на острите ръбове. За тези цели се използват други алгоритми. Счита се неподходящ за намаляване на картинки независимо от тяхното съдържание.

Билинейна трансформация

… статията предстои да бъде допълнена …

Бикубична трансформация

… статията предстои да бъде допълнена …

 Добави коментар

Адресът на електронната поща няма да се публикува


*