Recherche avancée

Médias (29)

Mot : - Tags -/Musique

Autres articles (58)

  • La file d’attente de SPIPmotion

    28 novembre 2010, par

    Une file d’attente stockée dans la base de donnée
    Lors de son installation, SPIPmotion crée une nouvelle table dans la base de donnée intitulée spip_spipmotion_attentes.
    Cette nouvelle table est constituée des champs suivants : id_spipmotion_attente, l’identifiant numérique unique de la tâche à traiter ; id_document, l’identifiant numérique du document original à encoder ; id_objet l’identifiant unique de l’objet auquel le document encodé devra être attaché automatiquement ; objet, le type d’objet auquel (...)

  • MediaSPIP v0.2

    21 juin 2013, par

    MediaSPIP 0.2 est la première version de MediaSPIP stable.
    Sa date de sortie officielle est le 21 juin 2013 et est annoncée ici.
    Le fichier zip ici présent contient uniquement les sources de MediaSPIP en version standalone.
    Comme pour la version précédente, il est nécessaire d’installer manuellement l’ensemble des dépendances logicielles sur le serveur.
    Si vous souhaitez utiliser cette archive pour une installation en mode ferme, il vous faudra également procéder à d’autres modifications (...)

  • MediaSPIP version 0.1 Beta

    16 avril 2011, par

    MediaSPIP 0.1 beta est la première version de MediaSPIP décrétée comme "utilisable".
    Le fichier zip ici présent contient uniquement les sources de MediaSPIP en version standalone.
    Pour avoir une installation fonctionnelle, il est nécessaire d’installer manuellement l’ensemble des dépendances logicielles sur le serveur.
    Si vous souhaitez utiliser cette archive pour une installation en mode ferme, il vous faudra également procéder à d’autres modifications (...)

Sur d’autres sites (8742)

  • swscale/aarch64 : add neon {lum,chr}ConvertRange

    11 juin 2024, par Ramiro Polla
    swscale/aarch64 : add neon lum,chrConvertRange
    

    chrRangeFromJpeg_8_c : 29.2
    chrRangeFromJpeg_8_neon : 19.5
    chrRangeFromJpeg_24_c : 80.5
    chrRangeFromJpeg_24_neon : 34.0
    chrRangeFromJpeg_128_c : 413.7
    chrRangeFromJpeg_128_neon : 156.0
    chrRangeFromJpeg_144_c : 471.0
    chrRangeFromJpeg_144_neon : 174.2
    chrRangeFromJpeg_256_c : 842.0
    chrRangeFromJpeg_256_neon : 305.5
    chrRangeFromJpeg_512_c : 1699.0
    chrRangeFromJpeg_512_neon : 608.0
    chrRangeToJpeg_8_c : 51.7
    chrRangeToJpeg_8_neon : 22.7
    chrRangeToJpeg_24_c : 149.7
    chrRangeToJpeg_24_neon : 38.0
    chrRangeToJpeg_128_c : 761.7
    chrRangeToJpeg_128_neon : 176.7
    chrRangeToJpeg_144_c : 866.2
    chrRangeToJpeg_144_neon : 198.7
    chrRangeToJpeg_256_c : 1516.5
    chrRangeToJpeg_256_neon : 348.7
    chrRangeToJpeg_512_c : 3067.2
    chrRangeToJpeg_512_neon : 692.7
    lumRangeFromJpeg_8_c : 24.0
    lumRangeFromJpeg_8_neon : 17.0
    lumRangeFromJpeg_24_c : 56.7
    lumRangeFromJpeg_24_neon : 21.0
    lumRangeFromJpeg_128_c : 294.5
    lumRangeFromJpeg_128_neon : 76.7
    lumRangeFromJpeg_144_c : 332.5
    lumRangeFromJpeg_144_neon : 86.7
    lumRangeFromJpeg_256_c : 586.0
    lumRangeFromJpeg_256_neon : 152.2
    lumRangeFromJpeg_512_c : 1190.0
    lumRangeFromJpeg_512_neon : 298.0
    lumRangeToJpeg_8_c : 31.7
    lumRangeToJpeg_8_neon : 19.5
    lumRangeToJpeg_24_c : 83.5
    lumRangeToJpeg_24_neon : 24.2
    lumRangeToJpeg_128_c : 440.5
    lumRangeToJpeg_128_neon : 91.0
    lumRangeToJpeg_144_c : 504.2
    lumRangeToJpeg_144_neon : 101.0
    lumRangeToJpeg_256_c : 879.7
    lumRangeToJpeg_256_neon : 177.2
    lumRangeToJpeg_512_c : 1794.2
    lumRangeToJpeg_512_neon : 354.0

    • [DH] libswscale/aarch64/Makefile
    • [DH] libswscale/aarch64/range_convert_neon.S
    • [DH] libswscale/aarch64/swscale.c
    • [DH] libswscale/swscale_internal.h
    • [DH] libswscale/utils.c
  • aarch64 : hevc : Produce epel_bi_hv functions for both neon and i8mm

    20 mars 2024, par Martin Storsjö
    aarch64 : hevc : Produce epel_bi_hv functions for both neon and i8mm
    

    In addition to just templating, this contains one change to
    ff_hevc_put_hevc_epel_bi_hv32_8, by setting the w6 register
    which ff_hevc_put_hevc_epel_h32_8_neon requires.

    AWS Graviton 3 :
    put_hevc_epel_bi_hv4_8_c : 176.5
    put_hevc_epel_bi_hv4_8_neon : 62.0
    put_hevc_epel_bi_hv4_8_i8mm : 58.0
    put_hevc_epel_bi_hv6_8_c : 343.7
    put_hevc_epel_bi_hv6_8_neon : 109.7
    put_hevc_epel_bi_hv6_8_i8mm : 105.7
    put_hevc_epel_bi_hv8_8_c : 536.0
    put_hevc_epel_bi_hv8_8_neon : 112.7
    put_hevc_epel_bi_hv8_8_i8mm : 111.7
    put_hevc_epel_bi_hv12_8_c : 1107.7
    put_hevc_epel_bi_hv12_8_neon : 254.7
    put_hevc_epel_bi_hv12_8_i8mm : 239.0
    put_hevc_epel_bi_hv16_8_c : 1927.7
    put_hevc_epel_bi_hv16_8_neon : 356.2
    put_hevc_epel_bi_hv16_8_i8mm : 334.2
    put_hevc_epel_bi_hv24_8_c : 4195.2
    put_hevc_epel_bi_hv24_8_neon : 736.7
    put_hevc_epel_bi_hv24_8_i8mm : 715.5
    put_hevc_epel_bi_hv32_8_c : 7280.5
    put_hevc_epel_bi_hv32_8_neon : 1287.7
    put_hevc_epel_bi_hv32_8_i8mm : 1162.2
    put_hevc_epel_bi_hv48_8_c : 16857.7
    put_hevc_epel_bi_hv48_8_neon : 2836.2
    put_hevc_epel_bi_hv48_8_i8mm : 2908.5
    put_hevc_epel_bi_hv64_8_c : 29248.2
    put_hevc_epel_bi_hv64_8_neon : 5051.7
    put_hevc_epel_bi_hv64_8_i8mm : 4491.5

    Signed-off-by : Martin Storsjö <martin@martin.st>

    • [DH] libavcodec/aarch64/hevcdsp_epel_neon.S
    • [DH] libavcodec/aarch64/hevcdsp_init_aarch64.c
  • aarch64 : vp9 : Implement NEON loop filters

    13 novembre 2016, par Martin Storsjö
    aarch64 : vp9 : Implement NEON loop filters
    

    This work is sponsored by, and copyright, Google.

    These are ported from the ARM version ; thanks to the larger
    amount of registers available, we can do the loop filters with
    16 pixels at a time. The implementation is fully templated, with
    a single macro which can generate versions for both 8 and
    16 pixels wide, for both 4, 8 and 16 pixels loop filters
    (and the 4/8 mixed versions as well).

    For the 8 pixel wide versions, it is pretty close in speed (the
    v_4_8 and v_8_8 filters are the best examples of this ; the h_4_8
    and h_8_8 filters seem to get some gain in the load/transpose/store
    part). For the 16 pixels wide ones, we get a speedup of around
    1.2-1.4x compared to the 32 bit version.

    Examples of runtimes vs the 32 bit version, on a Cortex A53 :
    ARM AArch64
    vp9_loop_filter_h_4_8_neon : 144.0 127.2
    vp9_loop_filter_h_8_8_neon : 207.0 182.5
    vp9_loop_filter_h_16_8_neon : 415.0 328.7
    vp9_loop_filter_h_16_16_neon : 672.0 558.6
    vp9_loop_filter_mix2_h_44_16_neon : 302.0 203.5
    vp9_loop_filter_mix2_h_48_16_neon : 365.0 305.2
    vp9_loop_filter_mix2_h_84_16_neon : 365.0 305.2
    vp9_loop_filter_mix2_h_88_16_neon : 376.0 305.2
    vp9_loop_filter_mix2_v_44_16_neon : 193.2 128.2
    vp9_loop_filter_mix2_v_48_16_neon : 246.7 218.4
    vp9_loop_filter_mix2_v_84_16_neon : 248.0 218.5
    vp9_loop_filter_mix2_v_88_16_neon : 302.0 218.2
    vp9_loop_filter_v_4_8_neon : 89.0 88.7
    vp9_loop_filter_v_8_8_neon : 141.0 137.7
    vp9_loop_filter_v_16_8_neon : 295.0 272.7
    vp9_loop_filter_v_16_16_neon : 546.0 453.7

    The speedup vs C code in checkasm tests is around 2-7x, which is
    pretty much the same as for the 32 bit version. Even if these functions
    are faster than their 32 bit equivalent, the C version that we compare
    to also became around 1.3-1.7x faster than the C version in 32 bit.

    Based on START_TIMER/STOP_TIMER wrapping around a few individual
    functions, the speedup vs C code is around 4-5x.

    Examples of runtimes vs C on a Cortex A57 (for a slightly older version
    of the patch) :
    A57 gcc-5.3 neon
    loop_filter_h_4_8_neon : 256.6 93.4
    loop_filter_h_8_8_neon : 307.3 139.1
    loop_filter_h_16_8_neon : 340.1 254.1
    loop_filter_h_16_16_neon : 827.0 407.9
    loop_filter_mix2_h_44_16_neon : 524.5 155.4
    loop_filter_mix2_h_48_16_neon : 644.5 173.3
    loop_filter_mix2_h_84_16_neon : 630.5 222.0
    loop_filter_mix2_h_88_16_neon : 697.3 222.0
    loop_filter_mix2_v_44_16_neon : 598.5 100.6
    loop_filter_mix2_v_48_16_neon : 651.5 127.0
    loop_filter_mix2_v_84_16_neon : 591.5 167.1
    loop_filter_mix2_v_88_16_neon : 855.1 166.7
    loop_filter_v_4_8_neon : 271.7 65.3
    loop_filter_v_8_8_neon : 312.5 106.9
    loop_filter_v_16_8_neon : 473.3 206.5
    loop_filter_v_16_16_neon : 976.1 327.8

    The speed-up compared to the C functions is 2.5 to 6 and the cortex-a57
    is again 30-50% faster than the cortex-a53.

    Signed-off-by : Martin Storsjö <martin@martin.st>

    • [DBH] libavcodec/aarch64/Makefile
    • [DBH] libavcodec/aarch64/vp9dsp_init_aarch64.c
    • [DBH] libavcodec/aarch64/vp9lpf_neon.S