Recherche avancée

Recherche
Choix de la période de publication
Date minimale :

Date maximale :

Type de date :
Choix de la langue
Choix du type de média
Choix de la rubrique
Choix de la licence de publication
Choix de l’auteur

Médias (91)

Spitfire Parade - Crisis

15 mai 2011, par kent1

Mis à jour : Septembre 2011

Langue : English

Type : Audio

Tags : creative commons, drone, punk, sound, son

1
2
3
4
5
Wired NextMusic

14 mai 2011, par kent1

Mis à jour : Février 2012

Langue : English

Type : Video

Tags : creative commons, wired

1
2
3
4
5
Video d’abeille en portrait

14 mai 2011, par kent1

Mis à jour : Février 2012

Langue : français

Type : Video

2 commentaires

Tags : portrait, iphone, 3GS, rotation

1
2
3
4
5
Sintel MP4 Surround 5.1 Full

13 mai 2011, par kent1

Mis à jour : Février 2012

Langue : English

Type : Video

Tags : sintel, creative commons, blender

1
2
3
4
5
Carte de Schillerkiez

13 mai 2011, par kent1

Mis à jour : Septembre 2011

Langue : English

Type : Texte

Tags : illustrator, map, berlin

1
2
3
4
5
Publier une image simplement

13 avril 2011, par kent1, Webmaster - Bij de Brest

Mis à jour : Février 2012

Langue : français

Type : Video

Tags : publier, publishing, media, image

1
2
3
4
5

1 | ... | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16

Autres articles (69)

MediaSPIP v0.2

21 juin 2013, par kent1

MediaSPIP 0.2 est la première version de MediaSPIP stable.
Sa date de sortie officielle est le 21 juin 2013 et est annoncée ici.
Le fichier zip ici présent contient uniquement les sources de MediaSPIP en version standalone.
Comme pour la version précédente, il est nécessaire d’installer manuellement l’ensemble des dépendances logicielles sur le serveur.
Si vous souhaitez utiliser cette archive pour une installation en mode ferme, il vous faudra également procéder à d’autres modifications (...)
Mise à disposition des fichiers

14 avril 2011, par kent1

Par défaut, lors de son initialisation, MediaSPIP ne permet pas aux visiteurs de télécharger les fichiers qu’ils soient originaux ou le résultat de leur transformation ou encodage. Il permet uniquement de les visualiser.
Cependant, il est possible et facile d’autoriser les visiteurs à avoir accès à ces documents et ce sous différentes formes.
Tout cela se passe dans la page de configuration du squelette. Il vous faut aller dans l’espace d’administration du canal, et choisir dans la navigation (...)
Configuration spécifique pour PHP5

4 février 2011, par kent1

PHP5 est obligatoire, vous pouvez l’installer en suivant ce tutoriel spécifique.
Il est recommandé dans un premier temps de désactiver le safe_mode, cependant, s’il est correctement configuré et que les binaires nécessaires sont accessibles, MediaSPIP devrait fonctionner correctement avec le safe_mode activé.
Modules spécifiques
Il est nécessaire d’installer certains modules PHP spécifiques, via le gestionnaire de paquet de votre distribution ou manuellement : php5-mysql pour la connectivité avec la (...)

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 23

Sur d’autres sites (9168)

Transcription via OpenAi's whisper : AssertionError : incorrect audio shape

1er avril 2024, par muratowski

I'm trying to use OpenAI's open source Whisper library to transcribe audio files.

Here is my script's source code :

import whisper&#xA;&#xA;model = whisper.load_model("large-v2")&#xA;&#xA;# load the entire audio file&#xA;audio = whisper.load_audio("/content/file.mp3")&#xA;#When i write that code snippet here ==> audio = whisper.pad_or_trim(audio) the first 30 secs are converted and without any problem they are converted.&#xA;&#xA;# make log-Mel spectrogram and move to the same device as the model&#xA;mel = whisper.log_mel_spectrogram(audio).to(model.device)&#xA;&#xA;# detect the spoken language&#xA;_, probs = model.detect_language(mel)&#xA;print(f"Detected language: {max(probs, key=probs.get)}")&#xA;&#xA;# decode the audio&#xA;options = whisper.DecodingOptions(fp16=False)&#xA;result = whisper.decode(model, mel, options)&#xA;&#xA;# print the recognized text if available&#xA;try:&#xA;    if hasattr(result, "text"):&#xA;        print(result.text)&#xA;except Exception as e:&#xA;    print(f"Error while printing transcription: {e}")&#xA;&#xA;# write the recognized text to a file&#xA;try:&#xA;    with open("output_of_file.txt", "w") as f:&#xA;        f.write(result.text)&#xA;        print("Transcription saved to file.")&#xA;except Exception as e:&#xA;    print(f"Error while saving transcription: {e}")&#xA;

In here :

# load the entire audio file&#xA;audio = whisper.load_audio("/content/file.mp3")&#xA;

when I write below : " audio = whisper.pad_or_trim(audio) ", the first 30 secs of the sound file is transcribed without any problem and language detection works as well,

but when I delete it and want the whole file to be transcribed, I get the following error :



AssertionError : incorrect audio shape




What should I do ? Should I change the structure of the sound file ? If yes, which library should I use and what type of script should I write ?

vf_dnn_processing : remove parameter 'fmt'

27 décembre 2019, par Guo, Yejun

vf_dnn_processing : remove parameter 'fmt'
do not request AVFrame's format in vf_ddn_processing with 'fmt',

but to add another filter for the format.
command examples :

./ffmpeg -i input.jpg -vf format=bgr24,dnn_processing=model=halve_first_channel.model:input=dnn_in:output=dnn_out:dnn_backend=native -y out.native.png

./ffmpeg -i input.jpg -vf format=rgb24,dnn_processing=model=halve_first_channel.model:input=dnn_in:output=dnn_out:dnn_backend=native -y out.native.png
Signed-off-by : Guo, Yejun <yejun.guo@intel.com>

Signed-off-by : Pedro Arthur <bygrandao@gmail.com>

[D H] doc/filters.texi
[D H] libavfilter/vf_dnn_processing.c

Evolution #4103 : Autoriser /local/cache-gd2/ et /local/cache-vignette/ dans robots.txt

27 février 2018, par b b

N’y a t il pas d’autres dossiers, pour gd1, convert et les autres librairies proposées par SPIP ?

D’après ce que j’en ai vu après avoir fait le tour de quelques sites, les vignettes sont dans cache-gd2 quel que soit la librairie utilisée.

(et ’distant’ il est où ?)

Hors sujet, on parle ici des images retaillées, et non des images pleine taille (cf le thread sur la liste).

1 | ... | 1023 | 1024 | 1025 | 1026 | 1027 | 1028 | 1029 | 1030 | 1031 | ... | 3056

Recherche avancée

Médias (91)

Spitfire Parade - Crisis

Wired NextMusic

Video d’abeille en portrait

Sintel MP4 Surround 5.1 Full

Carte de Schillerkiez

Publier une image simplement

Autres articles (69)

MediaSPIP v0.2

Mise à disposition des fichiers

Configuration spécifique pour PHP5

Sur d’autres sites (9168)

Transcription via OpenAi's whisper : AssertionError : incorrect audio shape

vf_dnn_processing : remove parameter 'fmt'

Evolution #4103 : Autoriser /local/cache-gd2/ et /local/cache-vignette/ dans robots.txt

Se connecter

Navigation

Syndication

Boussole SPIP