Recherche avancée

Médias (9)

Mot : - Tags -/soundtrack

Autres articles (68)

  • HTML5 audio and video support

    13 avril 2011, par

    MediaSPIP uses HTML5 video and audio tags to play multimedia files, taking advantage of the latest W3C innovations supported by modern browsers.
    The MediaSPIP player used has been created specifically for MediaSPIP and can be easily adapted to fit in with a specific theme.
    For older browsers the Flowplayer flash fallback is used.
    MediaSPIP allows for media playback on major mobile platforms with the above (...)

  • Support audio et vidéo HTML5

    10 avril 2011

    MediaSPIP utilise les balises HTML5 video et audio pour la lecture de documents multimedia en profitant des dernières innovations du W3C supportées par les navigateurs modernes.
    Pour les navigateurs plus anciens, le lecteur flash Flowplayer est utilisé.
    Le lecteur HTML5 utilisé a été spécifiquement créé pour MediaSPIP : il est complètement modifiable graphiquement pour correspondre à un thème choisi.
    Ces technologies permettent de distribuer vidéo et son à la fois sur des ordinateurs conventionnels (...)

  • De l’upload à la vidéo finale [version standalone]

    31 janvier 2010, par

    Le chemin d’un document audio ou vidéo dans SPIPMotion est divisé en trois étapes distinctes.
    Upload et récupération d’informations de la vidéo source
    Dans un premier temps, il est nécessaire de créer un article SPIP et de lui joindre le document vidéo "source".
    Au moment où ce document est joint à l’article, deux actions supplémentaires au comportement normal sont exécutées : La récupération des informations techniques des flux audio et video du fichier ; La génération d’une vignette : extraction d’une (...)

Sur d’autres sites (7805)

  • avcodec/vvcdec : refact, unify {horizontal, vertical}_bs, {horizontal, vertical}_p...

    11 juin 2024, par Nuo Mi
    avcodec/vvcdec : refact, unify horizontal, vertical_bs, horizontal, vertical_p, horizontal, vertical_q
    
    • [DH] libavcodec/vvc/dec.c
    • [DH] libavcodec/vvc/dec.h
    • [DH] libavcodec/vvc/filter.c
  • lavc/hevcdec : move HEVCContext.{horizontal,vertical}_bs to HEVCLayerContext

    5 juin 2024, par Anton Khirnov
    lavc/hevcdec : move HEVCContext.horizontal,vertical_bs to HEVCLayerContext
    
    • [DH] libavcodec/hevc/filter.c
    • [DH] libavcodec/hevc/hevcdec.c
    • [DH] libavcodec/hevc/hevcdec.h
  • using pocketsphinx_continuous with a .wav file

    3 avril 2013, par user2242131

    I am attempting to write an application that will allow a user to speak a small set of commands from a remote system and have them executed on my server. Using pocketsphinx to parse the spoken text. When run locally with the microphone, pocketsphinx_continuous works perfectly no matter how I slur the words. But when importing the audio file and using ffmpeg to downsample the audio to a single channel, 16 bit PCM file, it will parse the first word without difficulty. Then it will skip everything else and treat it as . I am confident that the problem is in the file format and not in the pocketsphinx configuration.

    Using command line
    ffmpeg -y -i Sound\AddSheet.wav -ac 1 -f s16le -acodec pcm_s16le -ar 16k AddTmp.wav
    in a batch file.

    The bottom of the output I get is :

    INFO: fsg_search.c(1407): Start node ADD.0:5:47
    INFO: fsg_search.c(1407): Start node <sil>.0:2:49
    INFO: fsg_search.c(1446): End node <sil>.126:128:305 (-486)
    INFO: fsg_search.c(1662): lattice start node <s>.0 end node <sil>.126
    INFO: ps_lattice.c(1352): Normalizer P(O) = alpha(<sil>:126:305) = -175371
    INFO: ps_lattice.c(1390): Joint P(O,S) = -176076 P(S|O) = -705
    000000000: ADD USER
    </sil></sil></s></sil></sil>

    Which is not the audio in the file. The words spoken in the file are "ADD SPREADSHEET", which works perfectly from the same microphone without the intervening .wav file.

    I have tried increasing the audio volume and decreasing the background noise using sox :

    sox -v 3.0 Sound\%1 Sound\%1-loud.wav ffmpeg -i Sound\%1-loud.wav -vn -ss 00:00:00 -t 00:00:01 -y Sound\%1-noiseaud.wav
    sox Sound\%1-noiseaud.wav -n noiseprof Sound\%1-noise.prof
    sox Sound\%1 Sound\%1-clean.wav noisered sound\noise.prof 0.21
    ffmpeg -y -i Sound\%1-clean.wav -ac 1 -f s16le -acodec pcm_s16le -ar 16k AddTmp.wav

    with no noticeable effect on the final results.

    If you look at the output you will notice that fsg_search.c has found ADD as the start node, then silence for the remainder. Please help on this.