Avez-vous déjà essayé de mesurer la qualité d'une vidéo ? Vous pouvez certes vérifier si des artefacts sont visibles, changer le câble HDMI ou le câble secteur pour espérer que la scène s'ouvre et même demander à votre femme si elle voit la différence. 1Ou tout simplement passer par un média physique, réputé meilleur. Mais vous pouvez aussi, comme Netflix, développer des outils pour une mesure à peu près factuelle, ou tout du moins automatisée. C'est la raison d'être du VMAF (Video Multimethod Assessment Fusion), une méthode open source qui passe de la v0 à la v1.

Le but du VMAF est de trouver le bon compromis entre la qualité perçue et la bande passante, le nerf de la guerre. Un débit plus faible permet une meilleure stabilité chez les utilisateurs, réduit les coûts chez Netflix et améliore globalement l'expérience… tant que l'image reste acceptable. Le problème de la v0 du VMAF, selon Netflix, c'est que la méthode tend à privilégier un flux en haute définition avec un débit bas à un flux basse définition avec un débit élevé, ce qui n'est pas toujours souhaitable. Dans le premier cas, on se retrouve plus fréquemment avec des artefacts de compression (les fameux macroblocs), dans le second, l'image est moins nette et le résultat est en partie dépendant du matériel. Un flux avec une définition plus faible peut être acceptable sur un petit téléviseur ou un smartphone, ou même sur un téléviseur avec un bon upscale, mais à l'inverse peut devenir gênant sur un grand écran.
Une des raisons est que la base du VMAF est une personne qui regarde un contenu en 1080p dans une pièce standard à une distance qui est de l'ordre de trois fois la hauteur de l'écran (un téléviseur de 55 pouces à 2 mètres pour se donner une idée). Dans la v1, ce point a été modifié, avec une adaptation plus fine au contenu, parce que (par exemple) les artefacts de compression sont moins visibles sur un smartphone à cause de la taille réduite des écrans.

VMAF v1 prend aussi en compte le banding, ce problème qui arrive parfois sur des dégradés qui sont affichés avec des bandes séparées bien visibles et les artefacts liés à la couleur (chroma), qui touchent parfois le rouge. Avec VMAF v1, des outils pour simuler l'absence d'améliorations sont aussi présents par défaut. Si beaucoup de téléviseurs disposent de modules d'upscale et d'améliorations de l'image performantes, ce n'est pas systématique, et les outils sont donc plus efficace en partant du principe que les améliorations en question sont absentes.

Dans la pratique, le nouveau modèle prend donc en compte un utilisateur qui a un téléviseur 1080p, un smartphone (avec une distance de cinq fois la hauteur ici) et un écran 4K. Le calcul se fait ici sur une distance identique au 1080p (trois fois la hauteur) mais aussi avec une valeur plus faible (1,5x), probablement pour des raisons pragmatiques : la taille des salons n'augmente pas en parallèle de la diagonale des téléviseurs.
Selon Netflix, VMAF v1 offre un meilleur résultat que VMAF v0 et (surtout) le fait plus rapidement. Il y a toujours des optimisations et des changements à prévoir pour prendre en compte certaines évolutions modernes, mais c'est une avancée intéressante pour une tâche souvent invisible mais importante.
-
Soyons clairs : c'est de l'ironie sur certains adeptes de l'audio, pas du sexisme au premier degré. ↩︎




















