Análise comparativa entre algoritmos de estimação de movimento por block-matching para compressão de vídeo em resolução full HD

Data

Título da Revista

ISSN da Revista

Título de Volume

Editor

Em virtude do recente crescimento das resoluções e qualidades de imagem em vídeos digitais, o aumento gradativo da demanda de largura de banda para a transmissão se torna inviável, despertando a necessidade da compressão destes vídeos. A principal técnica utilizada para a compressão de vídeos consiste em eliminar a redundância de informações entre quadros consecutivos, substituindo-as por vetores de movimento que indicam o deslocamento de determinados pixels do quadro. Esta técnica é chamada estimação de movimento, método empregado para identificar o movimento do quadro atual em comparação com o quadro anterior, sintetizar estes vetores de movimento e utilizá-los, enfim, para a reconstrução o quadro desejado. Essa reconstrução ocorre somente com o quadro anterior e os vetores, permitindo que o quadro atual seja descartado. Tal prática reduz significativamente o peso do vídeo, mas eleva a complexidade computacional e o tempo de compressão. A fim de amenizar esta contrapartida, foi introduzida na literatura a técnica de block-matching, responsável por segmentar o quadro em blocos de determinado tamanho, compará-los com outros blocos e atribuir o mesmo vetor de movimento para todos os pixels deste bloco. Esta técnica é amplamente difundida pela área tecnológica em vista de sua simplicidade de implementação e baixa complexidade computacional, enquanto que produzindo resultados satisfatórios, perante o olho humano. Ao longo dos anos, vários algoritmos de block-matching foram elaborados, refinando cada vez mais seus critérios de seleção de blocos. Contudo, estes algoritmos podem tornar-se obsoletos muito rapidamente, por conta do desenfreado crescimento das resoluções de imagem. Portanto, este trabalho visa apresentar e comparar três algoritmos de block-matching desenvolvidos nos últimos três anos, supostamente adaptados para a resolução full HD (1920x1080), que são os algoritmos PAL (Pal, 2015), WUARPS (Wu; Huang, 2016) e PRO (Ziwei et al, 2017). Os resultados apresentados apontam um equilíbrio entre os três no que diz respeito a qualidade do quadro reconstruído, complexidade computacional e tempo empregado na execução. Em destaque, o algoritmo PRO apresentou, de todos, a melhor qualidade de imagem, enquanto que o WUARPS obteve o menor tempo de execução. Já o algoritmo PAL possui melhor desempenho em sequências de baixo grau de movimentação. É interessante que futuras pesquisas possam abordar a utilização de tamanhos variados de blocos, no lugar de tamanhos de bloco fixos.

Descrição

Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.

Citação