Številni preboji na področju hitrosti in natančnosti super-resolucije posameznih slik (ang. single image super-resolution, SISR) so bili že doseženi. Eden od največjih še nerešenih izzivov je, kako obnoviti fine teksturne podrobnosti pri uporabi super-resolucije z velikimi faktorji povečanja. Tipična rešitev za SISR vključuje uporabo konvolucijske nevronske mreže (ang. convolutional neural network, CNN), vendar pa so na voljo tudi novi pristopi, ki uporabljajo generativne nasprotniške mreže (ang. generative adversarial network, GAN). Obnašanje metod super-resolucije, ki temeljijo na optimizacij, je v principu vodeno in pogojeno z izbiro funkcije izgube (angl. loss function). V tem delu predstavljamo opis in evalvacijo mrež SRResNet in SRGAN. SRResNet predstavlja rezidualno globoko mrežo, SRGAN pa je generativna nasprotniška mreža. Obe mreži uporabimo za reševanje problema super-resolucije slik (angl. super-resolution, SR). SRResNet je zmožna iz močno pomanjšanih slik obnoviti foto-realistične slike sprejemljive kakovosti. SRGAN je zmožna ekstrapolirati foto-realistične naravne slike z visokimi faktorji povečanja. To dosežemo z uporabo funkcije zaznavne izgube (angl. perceptual loss function), ki je sestavljena iz nasprotniške izgube (angl. adversarial loss) in vsebinske izgube (angl. content loss). Nasprotniška izguba potisne rešitev na razsežnost naravnih slik z uporabo diskriminatorne mreže. Ta je naučena razlikovati med originalnimi foto-realističnimi slikami in povečanimi slikami. Vsebinska izguba pa je motivirana z zaznavno podobnostjo namesto s podobnostjo v prostoru pikslov.
Prenesi celotno besedilo:
Članek je v celoti na voljo le v angleškem jeziku.
Avtor: Sebastien Strban