Sous-titres dans les publicités vidéo : ce n'est plus facultatif
La plupart des vidéos sociales sont regardées sans le son. Voici les données sur les pubs sous-titrées, les styles qui retiennent l'attention, et comment générer des sous-titres précis à grande échelle.
Ouvrez votre téléphone, faites défiler un fil d'actualité, et comptez combien de publicités vous entendez avant d'en taper une. Pour la plupart des gens, la réponse est zéro. La vidéo a commencé à jouer dès qu'elle a rempli l'écran, le son était coupé, et votre pouce a continué à défiler.
Cette lecture automatique en sourdine est l'état par défaut de chaque fil majeur, depuis des années déjà. Une pub sans sous-titres, c'est une pub pour laquelle vous avez décidé que la moitié de votre audience peut lire sans le son — sauf qu'elle ne peut pas, parce qu'il n'y a rien à lire à l'écran. La voix off que vous avez payée parle à une salle vide.
La lecture silencieuse automatique, c'est tout le problème
Facebook, Instagram, TikTok et LinkedIn lancent tous les vidéos en sourdine dans le fil. Le son ne s'active que si le spectateur appuie sur l'écran, et la plupart ne le font pas. Le chiffre communément cité est que la grande majorité des vidéos mobiles dans les fils est regardée sans son — les chiffres exacts varient selon la plateforme et l'étude, mais aucun acheteur média sérieux ne planifie encore pour un son activé par défaut.
Cela change ce qu'est réellement une "publicité vidéo". Ce n'est pas un spot de 30 secondes qui se trouve simplement sur un téléphone. C'est un objet silencieux, qui défile vite, conçu pour stopper le pouce, et qui doit d'abord faire passer son message visuellement — et récompenser le son ensuite.
La conséquence pratique : chaque ligne importante de votre script doit également exister en texte à l'écran. Pas en option. Comme canal de diffusion principal, avec l'audio en complément pour la minorité qui appuie.
Il y a une deuxième raison pour laquelle les sous-titres méritent leur place : l'accessibilité. Environ une personne sur cinq a une déficience auditive à un degré ou un autre, et beaucoup d'autres regardent dans des endroits où le son est socialement impossible — dans les transports, au bureau, dans un lit avec un partenaire endormi. Les sous-titres ne sont pas une case à cocher de conformité ; c'est comme ça qu'une grande partie de votre audience reçoit la pub.
Ce que les sous-titres font concrètement à la rétention
La rétention est la métrique qui décide si votre pub obtient une distribution bon marché. Les plateformes récompensent les vidéos qui retiennent l'attention avec des CPM effectifs plus bas et une diffusion plus large ; les vidéos qu'on fait défiler dans les deux premières secondes sont pénalisées. Les sous-titres déplacent cette courbe de trois façons concrètes.
- Ils rendent la première seconde lisible. Un spectateur qui fait défiler à toute vitesse décide en bien moins d'une seconde s'il s'arrête. Du texte à l'écran lui donne quelque chose à analyser instantanément — une affirmation, une question, un chiffre — avant même qu'il ait perçu ce qu'est le visuel. Une vidéo silencieuse sans texte lui demande d'attendre et de découvrir, et il ne le fera pas.
- Ils maintiennent le spectateur silencieux dans l'histoire. Une fois que quelqu'un s'arrête, les sous-titres portent le récit battement par battement. Sans eux, un spectateur en sourdine arrive au moment où la voix off délivre le point clé, n'entend rien, et part. Le graphique de rétention montre ça comme une falaise exactement là où l'accroche parlée atterrit.
- Ils ajoutent une deuxième couche visuelle à un plan lent. Même quand rien ne bouge à l'écran, des sous-titres animés mot à mot créent un mouvement qui se lit comme "il se passe quelque chose ici." Ce micro-mouvement vous achète un battement d'attention supplémentaire pendant les plans en caméra fixe ou de présentation produit.
Vous pouvez le voir directement dans vos propres analyses. Lancez la même pub avec et sans sous-titres et observez le taux de maintien à trois secondes et la durée moyenne de visionnage. La version sous-titrée tient presque toujours plus longtemps, parce que vous avez arrêté de vous appuyer sur un canal sonore qui est coupé.
Les styles de sous-titres qui retiennent l'attention (et ceux qui nuisent)
Tous les sous-titres ne se valent pas. Un mur de petit texte gris en bas du cadre est techniquement sous-titré et pratiquement invisible. Les choix de style ci-dessous sont ceux qui déterminent si les sous-titres font vraiment leur travail.
La liste de vérification des styles
- Un à trois mots à l'écran à la fois, pas des phrases entières. Le style "karaoké" ou mot par mot — où les mots apparaissent en synchronisation avec la voix off et le mot actif est mis en évidence — se lit plus vite qu'un bloc statique. Il force aussi l'œil à suivre un rythme, ce qui est lui-même un dispositif de rétention.
- Assez grand pour être lu à bout de bras sur un téléphone. Si vous devez plisser les yeux sur votre propre appareil, c'est trop petit. Le texte des sous-titres doit occuper une fraction significative de la largeur du cadre, pas se cacher dans une fine bande.
- Contraste élevé, toujours. Du texte blanc en gras avec un contour sombre ou un fond semi-opaque résiste à n'importe quelle prise de vue. Un texte fin sans contour disparaît dès que l'arrière-plan devient clair.
- Évitez les pièges des zones de sécurité. En 9:16, les ~10% du haut et les ~20% du bas sont couverts par l'interface propre de la plateforme — nom d'utilisateur, légende, boutons, barre CTA. Placez vos sous-titres dans la bande centrale pour que rien d'important ne soit caché derrière un bouton J'aime.
- Une seule police, un emplacement cohérent. Des sous-titres qui sautent partout dans le cadre ou changent de police semblent amateurs et détournent l'attention du message. Choisissez une position et tenez-vous-y.
- Mettez en évidence le mot clé, pas chaque mot. Si vous surlignez des mots, surlignez ceux qui portent le sens — le chiffre, le bénéfice, le verbe. Tout mettre en évidence ne met rien en évidence.
Ce qui nuit : un texte gris minuscule, des paragraphes entiers qui changent trop lentement pour être suivis, des sous-titres qui chevauchent la bouche du locuteur, et des styles animés décoratifs si chargés qu'ils concurrencent les mots pour attirer l'attention. L'objectif est la lisibilité au premier coup d'œil, pas une vitrine typographique.
Le problème de la précision à grande échelle
Les sous-titres n'aident que s'ils sont corrects. Un nom de marque mal orthographié ou une ligne mal synchronisée fait plus de dégâts qu'aucun sous-titre, parce que ça signale que la pub a été faite avec négligence — et les spectateurs étendent ce jugement au produit.
C'est gérable quand vous diffusez une seule pub. Ça devient problématique quand vous diffusez le volume que la publicité payante requiert réellement. Trouver un créatif gagnant signifie tester de nombreuses variantes, et chaque variante a besoin de sous-titres précis, bien synchronisés, correctement stylisés. Le faire à la main est lent et propice aux erreurs exactement là où les erreurs coûtent le plus cher — les noms propres, les noms de produits, les chiffres et la synchronisation.
Trois approches, avec des compromis honnêtes :
- Sous-titrage manuel dans un éditeur. Contrôle maximal, débit minimal. Acceptable pour une pub phare, ingérable pour vingt variantes de test par semaine. La précision dépend entièrement de l'attention de l'éditeur, qui s'émousse après la cinquième vidéo.
- Outils de transcription automatique. Rapides, mais la transcription devine les mots qu'elle a mal entendus. Les noms de marques, le jargon et les chiffres sont exactement ce qu'elle se trompe, et ce sont exactement les mots qui doivent être corrects. Vous devez quand même relire chacun.
- Sous-titres générés à partir du script, pas de l'audio. Si le système connaît déjà le script — parce qu'il l'a écrit et a généré la voix off à partir de celui-ci — les sous-titres sont dérivés d'un texte connu, pas rétro-ingénierés à partir d'une forme d'onde. L'orthographe et la formulation sont correctes par construction. La synchronisation est le problème d'alignement, et c'est bien plus abordable que deviner les mots.
Cette dernière approche est celle qui passe à l'échelle, parce qu'elle supprime l'étape de relecture qui bloque les deux autres. Quand les mots sont connus à l'avance, la précision cesse d'être un pari par vidéo.
Une liste de vérification pré-lancement pour les sous-titres
Avant qu'une pub sous-titrée ne soit mise en ligne, passez-la à travers celle-ci. Ça prend moins d'une minute par vidéo et ça attrape les erreurs qui gaspillent discrètement le budget.
- Regardez-la en sourdine, en premier. Si la pub n'a pas de sens sans le son, les sous-titres échouent. C'est la vérification la plus importante et celle que la plupart des gens sautent.
- Lisez le texte de la première image en isolation. Est-ce que la légende d'ouverture seule ferait s'arrêter un inconnu qui fait défiler ? Si c'est "Bienvenue sur notre marque", réécrivez-la.
- Vérifiez chaque nom propre et chaque chiffre. Nom de marque, nom de produit, prix, pourcentages. Ce sont les erreurs les plus coûteuses.
- Confirmez que les sous-titres sont dans la zone de sécurité pour chaque rapport d'aspect que vous exportez. Ce qui est centré en 1:1 peut entrer en collision avec l'interface en 9:16.
- Vérifiez la synchronisation avec la voix off. Des sous-titres qui traînent ou courent en avance sur l'audio brisent le rythme pour les spectateurs qui ont bien le son activé.
- Testez la lisibilité sur les images les plus claires et les plus sombres du montage. Si le texte résiste aux deux, le contraste est bon.
FAQ
Ai-je vraiment besoin de sous-titres si ma pub n'a pas de voix off ?
Oui, sans doute encore plus. Une pub en b-roll silencieux sans sous-titres demande au spectateur de déduire votre message uniquement à partir des images, ce qui ne fonctionne presque jamais dans un fil qui défile vite. Les sous-titres sont la façon dont vous exposez l'offre, l'accroche et l'appel à l'action quand il n'y a pas de piste parlée pour les porter. Ils deviennent le script, à l'écran.
Les sous-titres doivent-ils correspondre mot pour mot au script parlé ?
Pour la publicité payante sur les réseaux sociaux, quasi-verbatim est généralement la bonne approche, avec un léger élagage. L'exception est l'accroche : la première ligne à l'écran peut être plus percutante et plus courte que celle parlée, parce que le texte se scanne plus vite que la parole. Gardez le corps proche du verbatim pour que les spectateurs avec le son ne lisent pas quelque chose de différent de ce qu'ils entendent.
Quel style de sous-titres convertit le mieux sur TikTok par rapport à Meta ?
Les principes sont les mêmes sur toutes les plateformes — grands, à fort contraste, centraux, mot par mot — mais TikTok et Reels récompensent un rythme plus rapide et plus natif avec un regroupement de mots plus serré, tandis que Meta et LinkedIn tolèrent un rythme légèrement plus calme. La valeur par défaut sûre est le style énergique mot par mot ; c'est lui qui sous-performe le moins dans tous les emplacements quand vous réutilisez un seul montage.
Sous-titrer chaque variante à la main, c'est là que la rigueur des sous-titres meurt en silence — correct en théorie, abandonné à la troisième version. Aitachyon comble cet écart : collez une URL, et il génère le script, la voix off, et des sous-titres incrustés dérivés de ce script connu, puis exporte le montage en 9:16, 16:9 ou 1:1 pour TikTok, Reels, Shorts, Meta et LinkedIn en environ deux minutes. Les sous-titres sont corrects parce que les mots n'ont jamais été devinés. Les plans commencent à 29 $/mois avec une garantie de remboursement de 14 jours, donc lancer un lot complet de variantes sous-titrées coûte à peu près ce qu'une seule pub phare sous-titrée à la main coûterait. Commencez gratuitement et regardez la première en sourdine.
Articles similaires
La pub fondateur : comment la rendre crédible sans tomber dans le ridicule
Pourquoi un fondateur face caméra surpasse la vidéo léchée sur une audience froide, et les trois mouvements narratifs qui rendent la pub fondateur convaincante.
GuidesPublicités Vidéo Explicatives : Courtes pour Convertir, Claires pour Marquer
Comment comprimer une explication produit complète en une pub vidéo de 45 secondes sans perdre le spectateur ni le message. Une structure reproductible et des scripts.
GuidesLe format de la publicité vidéo produit : découpage plan par plan
Dissection image par image d'une pub vidéo produit performante — ordre des plans, rythme, timing des sous-titres, et ce qui fait vraiment cliquer sur le end card.