Programação

Páginas (105): 1 ... 101 102 103 104 105
1041 respostas neste tópico
 #1.041
(05/11/2024, 13:33)DK666 Escreveu: Galera que escova bit em assembly são os mais pika de toda a programação.

Logo essa geração vai falecer e não vai ter mais quase ninguém pra fazer esse tipo de coisa.
Responder
 #1.042
(05/11/2024, 12:44)nando3d Escreveu: Impressionante. 


https://x.com/FFmpeg/status/1852542388851601913

Spoiler: Imagem   

A notícia do FFmpeg é legal, mas a interpretação do cara do Toms é incompleta.

Citar:"This group of developers tried to implement a handwritten AVX512 assembly code path, something that has rarely been done before, at least not in the video industry."

Só o que tem, tanto em filtros de vídeo quanto no x264 e no x265. x265 tem suporte a AVX512 desde 2018, pago pela Intel. Por exemplo, https://www.intel.com/content/www/us/en/...x-512.html

O exemplo citado da imagem é de decode de vídeo AV1.

Citar:The benchmarking results show that the new handwritten AVX-512 code path performs considerably faster than other implementations, including baseline C code and lower SIMD instruction sets like AVX2 and SSSE3. In some cases, the revamped AVX-512 codepath achieves a speedup of nearly 94 times over the baseline, highlighting the efficiency of hand-optimized assembly code for AVX-512.

Comparar com versão crua em C é paia. Na imagem postada, os ganhos do AVX512 sobre AVX2, a comparação que vale a pena, são:
  • 0version: AVX512 perde do AVX2
  • H: 15%
  • HV: 60%
  • V: 40%

H é horizontal, V é vertical. HV processa nas duas direções ao mesmo tempo: mais trabalho a fazer, logo mais ganhos com o AVX512.

O exemplo usa width64, bloco grande de pixels (64x64, 64x48, 64x32...) com mais trabalho a fazer logo vantagem pro AVX512, mas 8bits por pixel. 10bits ou mais dá mais vantagem ainda pro AVX512.

Lembrando que C no caso ali são instruções de 64bits no mínimo, SSSE3 de 128, AVX2 de 256 e o AVX512 de 512bits, logo processam muito mais bits por ciclo.
1 usuário curtiu este post: nando3d
Responder
Páginas (105): 1 ... 101 102 103 104 105

Usuários visualizando este tópico: 1 Visitantes