05/11/2024, 15:14 |
Programação
Tópico em 'Informática & Tecnologia (Gadgets)' criado por
PaninoManino em 28/04/2017, 15:14.
|
1041 respostas neste tópico
|
(05/11/2024, 12:44)nando3d Escreveu: Impressionante. A notícia do FFmpeg é legal, mas a interpretação do cara do Toms é incompleta. Citar:"This group of developers tried to implement a handwritten AVX512 assembly code path, something that has rarely been done before, at least not in the video industry." Só o que tem, tanto em filtros de vídeo quanto no x264 e no x265. x265 tem suporte a AVX512 desde 2018, pago pela Intel. Por exemplo, https://www.intel.com/content/www/us/en/...x-512.html O exemplo citado da imagem é de decode de vídeo AV1. Citar:The benchmarking results show that the new handwritten AVX-512 code path performs considerably faster than other implementations, including baseline C code and lower SIMD instruction sets like AVX2 and SSSE3. In some cases, the revamped AVX-512 codepath achieves a speedup of nearly 94 times over the baseline, highlighting the efficiency of hand-optimized assembly code for AVX-512. Comparar com versão crua em C é paia. Na imagem postada, os ganhos do AVX512 sobre AVX2, a comparação que vale a pena, são:
H é horizontal, V é vertical. HV processa nas duas direções ao mesmo tempo: mais trabalho a fazer, logo mais ganhos com o AVX512. O exemplo usa width64, bloco grande de pixels (64x64, 64x48, 64x32...) com mais trabalho a fazer logo vantagem pro AVX512, mas 8bits por pixel. 10bits ou mais dá mais vantagem ainda pro AVX512. Lembrando que C no caso ali são instruções de 64bits no mínimo, SSSE3 de 128, AVX2 de 256 e o AVX512 de 512bits, logo processam muito mais bits por ciclo.
1 usuário curtiu este post: nando3d
|
« Anteriores | Seguintes »
|
Usuários visualizando este tópico: 1 Visitantes