Transformer une vidéo en texte avec l'IA (Transcription / sous-titres)

Comment se servir de l'intelligence artificielle pour générer du texte à partir d'une vidéo et donc générer des sous-titres, un résumé et un article de blog complet.

L’autre jour j'étais en live pour voir comment l'intelligence artificielle pouvait m'aider dans mon travail quotidien au marketing.
Particulièrement sur la partie "Création de contenu".

Eh bien je peux vous dire que je n’ai pas été déçu de mes recherches, je vous explique.

Le contexte

Dans le cadre de notre activité chez BLC on est amené à mettre en ligne un très grand nombre de vidéos.
Quasiment une par jour à certaines périodes.

Sauf que quand on met une vidéo en ligne, il y a tout un tas de tâches répétitives qu’on est obligé de faire et pour lesquelles on n’apporte aucune valeur ajoutée.

  • Écrire les sous-titres pour la vidéo.
  • Créer un texte qui résume ce que dit la vidéo pour pouvoir l’ajouter en description.
  • Écrire un article de blog complet sur le sujet en lien avec la vidéo.

Bref tout un travail laborieux sur lequel l’humain n’apporte pas réellement de valeur.
(Surtout quand on sait que la vidéo existe déjà et qu’elle raconte déjà tout ça).

Du coup je me suis demandé si on pouvait utiliser l’intelligence artificielle pour nous aider dans cette mission.

Alors si vous aussi vous vous demandez ce que peut concrètement vous apporter l’intelligence artificielle dans votre travail de tous les jours.

Voici un exemple concret avec un sujet “marketing de contenu”.

On proposera 3 alternatives différentes pour arriver au résultat attendu, avec 3 outils :

  • Descript
  • DaVinci Resolve
  • Substack

1. Voice to text : avec Descript

Voilà ce que j'ai réussi à faire en "geekant" pendant 1h30.

  • J’ai utilisé le logiciel Descript, qui a absorbé la piste audio de ma vidéo et en a fait une retranscription écrite.
  • J’ai ensuite “copié / collé” cette retranscription complète dans ChatGPT, tout en lui demandant de générer un résumé.
    En effet, la retranscription écrite mot à mot ne nous est pas d’une très grande aide pour un support “texte”.
  • En partant de ce résumé court, je lui ai demandé d’écrire un article de blog complet, tout en respectant les bonnes pratiques SEO (Référencement naturel).
  • Pour finir, Descript a généré les sous-titres de la vidéo (et aurait même pu le faire dans plusieurs langues).

Si on avait dû faire ça nous-même, on y aurait passé entre 3 et 4 heures.
Alors qu’en utilisant ce process cela ne m’a pris à peine 1 heure.

Jusqu’à présent on avait du mal à produire toute cette valeur.
On se concentrait uniquement sur la production de vidéo et on laissait de coté toute la partie “texte associé”.

Donc le gain de temps n’est même pas comparable, entre quelque chose qu’on ne faisait pas du tout et quelque chose qu’on va commencer à faire grâce à l’IA.

Il ne me restait plus qu’à :

  • Mettre en ligne l’article de blog, en prenant soin de le faire relire en interne pour vérifier qu’il n’y ait pas d’erreurs.
  • Attacher les sous-titres à la vidéo, pour que les gens qui lisent la vidéo sans mettre le son puissent quand même avoir accès à l’information.
  • Mettre le résumé de la vidéo en description sur la chaîne YouTube et améliorer par la même occasion son référencement dans les résultats de recherche.

Bref, la mission a été respectée et si ça vous intéresse de savoir comment j’ai fait, voici le tuto complet dans la vidéo ci-dessous.

À utiliser sans modération, mais avec contrôle.

(Promis cet article n’a pas été écrit par une intelligence artificielle).

2. Voice to text : Avec DaVinci Resolve

Si vous faites du montage vidéo vous utilisez peut-être “DaVinci Resolve” en version payante.

Si c’est le cas vous pouvez désormais générer une transcription audio et des sous-titres directement dans DaVinci Resolve.

Donc un gain de temps considérable puisque vous faites tout dans un seul et même logiciel.

Une fois la transcription générée, vous l’exportez et vous récupérer le process de la solution n°1 pour mettre tout ça dans ChatGPT

3. Voice to dext : avec Substack

La 3ème et dernière alternative se trouve directement dans Substack.

Si vous utilisez Substack pour diffuser votre blog, vous allez directement pouvoir générer une transcription de l’audio de votre vidéo dans l’article généré.

Sur la partie sous-titre ça sera un tout petit peu moins bien, car il n’y aura aucune synchronisation de la transcription et ça sera donc impossible de générer un fichier de sous-titre au format générique *.srt.

Mais si le besoin se situe uniquement sur la transcription texte, alors ça fonctionne parfaitement