Apple a vu des films avant de créer le mode cinématique des iPhone 13

Nicolas Furno |

Quand Apple a créé les éclairages de portrait pour les iPhone 8, Phil Schiller expliquait en interview que les ingénieurs de Cupertino avaient analysé non seulement des photos, mais aussi des portraits peints pour créer la nouvelle fonction. Quatre ans plus tard, rebelote, mais cette fois pour le mode cinématique des iPhone 13 et avec le cinéma.

Édition d’une vidéo en mode cinématique (image TechCrunch).

Matthew Panzarino de TechCrunch a papoté avec Kaiann Drance, vice-présidente en charge du marketing iPhone, et avec Johnnie Manzari, l’un des designers en charge de l’interface chez Apple. Son interview revient sur la fonction, ses limites et aussi la création de ce mode. Comme toujours, l’entreprise tient à rappeler qu’elle n’a pas essayé de créer une fonction, elle a cherché une réponse à une question.

La question en l’occurrence concernait les films, les vrais, ceux que l’on peut voir au fond de son canapé ou au cinéma. Qu’est-ce qui les rend intemporels ? Qu’est-ce qui les distingue d’une vidéo tournée à l’iPhone ? Pour commencer, Apple a donc… vu beaucoup de films, et parlé avec des réalisateurs et techniciens dans le monde du cinéma. Une constante s’est dévoilée à travers les âges : la mise au point est un élément clé de la mise en scène.

L’élément net à l’image est un outil essentiel pour raconter une histoire, tandis que le flou autour de cet élément facilite la compréhension du film en guidant le spectateur. Fort de ce constat, les créateurs de la fonction se sont rendus sur des tournages pour comprendre à la fois les choix du directeur de la photographie — qui est responsable de l’image au sens large — et les gestes des opérateurs. Ils ont analysé comment le « pointeur », la personne chargée de tourner la bague de mise au point sur les caméras, travaille.

La caméra peut être gérée par deux personnes : l’une pour contrôler le cadre, l’autre pour manipuler la bague de mise au point (photo Wikimedia Commons).

Tout ce savoir a permis de collecter des informations sur les techniques de tournage, pour ensuite les convertir en fonctions accessibles pour le grand public. Sur un tournage, c’est un travail minutieux et complexe qui nécessite de coordonner plusieurs opérateurs et les acteurs, mais aussi de contrôler entièrement l’environnement. Sur un iPhone, cela doit être une fonction utilisable par n’importe qui, en tenant le smartphone et en le laissant travailler au maximum.

C’est pour cette raison que la mise au point évolue selon les regards des personnes filmées. La personne au premier plan est nette par défaut et l’arrière-plan est flou, mais si elle tourne la tête, le mode cinématique va tenter de deviner ce qu’elle va regarder, que ce soit une personne ou un objet, et faire la mise au point sur cet élément. C’est un classique au cinéma pour guider le regard du spectateur sur l’élément le plus important et tout est fait automatiquement par l’iPhone.

Autre idée, il faut anticiper l’entrée d’un personnage dans le cadre, pour coordonner le changement de mise au point au bon moment. Pour cela, les développeurs d’Apple ont eu une idée astucieuse : en mode vidéo, la stabilisation réduit le cadre pour garder de la marge, mais les capteurs sous les objectifs enregistrent davantage d’informations. Ces données sont utilisées par le mode cinématique pour anticiper la transition d’une mise au point à l’autre : l’iPhone « sait » qu’une personne va entrer dans le cadre avant qu’elle n’apparaisse à l’écran.

Ce savoir, combiné à la puce Apple A15 qui travaille dur pour afficher l’effet de flou en temps réel à l’écran tout en traitant les 30 images par seconde qui forment la vidéo finale, donne le mode cinématique. Qui est loin d’être parfait dans sa première version, comme Matthew Panzarino le relève et le prouve avec cet exemple tourné sans aucun accessoire lors d’un séjour à Disneyland.

La mise au point a plus de mal dans les environnements sombres et surtout l’édition a posteriori est vite indispensable pour corriger les erreurs en temps réel. Et puis l’effet de flou se trompe parfois, comme avec le mode portrait, en détourant n’importe comment les gens et objets.

Même sans aucun matériel supplémentaire, on peut aussi obtenir un résultat assez convaincant à condition de faire simple. Jonathan Morrison l’a prouvé avec ce clip réalisé entièrement en mode cinématique. La chanteuse se contente de marcher dans la rue et elle est la seule dans le cadre en permanence, ce qui simplifie le travail. Mais comme on peut le voir par intermittence, le youtubeur est seul devant elle et il tient l’iPhone à bout de bras, il n’a même pas de stabilisateur pour s’aider.

avatar cybercooll | 

@YetOneOtherGit

C’est une réponse générée par une IA? 😏😉

avatar YetOneOtherGit | 

@cybercooll

"C’est une réponse générée par une IA? 😏😉"

Nope je suis une bêtise naturelle 😛🙃🥲🥳

avatar pat3 | 

@fred5150

"alors artificielle avec des algorithmes mais bon rien ne remplacera le taf d’un mec qui aura sa sensibilité et les exigences d’un real !"

On parle d’une fonction auto sur l’iPhone de M. Toutlemonde qui va filmer son chien, t’inquiète, c’est pas ça qui va tuer là boulot des pointeurs…

avatar fosterj | 

« Apple is now in the business of making incremental seem monumental. »

avatar YetOneOtherGit | 

@fosterj

"« Apple is now in the business of making incremental seem monumental. »"

On ne fait que peu de bon business en se reposant sur les innovations de rupture.

L’innovation incrementale est bien plus profitable pour un business établi.

Et les vrais innovations de rupture sont toujours très rares de toutes façon.

Les outsiders sur-vendent de innovations de rupture souvent douteuses et sans avenir pour essayer de créer un momentum, les leaders sur-vendent des innovations incrementales en profitant de leur momentum.

Ce n’est pas Apple qui a inventé cette règle 😎

avatar fte | 

@YetOneOtherGit

"On ne fait que peu de bon business en se reposant sur les innovations de rupture.
L’innovation incrementale est bien plus profitable pour un business établi."

Le distinguo entre les unes ou les autres n’est souvent possible qu’après les faits. C’est le "marché" qui décide de quelle nature est une innovation.

avatar YetOneOtherGit | 

@fte

"Le distinguo entre les unes ou les autres n’est souvent possible qu’après les faits. C’est le "marché" qui décide de quelle nature est une innovation."

Pas si certains que toi : les innovations de rupture sont des risques sur le marché et effectivement toutes ne réussissent pas, alors que les innovations incremenales représentent peu de risque.

C’est d’ailleurs pour ça qu’elle sont souvent portée par des acte en situation fort différente sur le marché 😉

avatar fte | 

@YetOneOtherGit

"Pas si certains que toi"

La définition que tu donnes est celle d’innovations risquées ou peu risquées. La corrélation avec la rupture ou l’incrémentalité est tout sauf démontrée. Tu voudrais me faire croire à une telle corrélation ?

avatar YetOneOtherGit | 

@fte

"Tu voudrais me faire croire à une telle corrélation ?"

On rentre dans les classiques pb de définition de concept au contours un rien flou et de ce que je vois nous n’avons pas de définition commune.

Pour moi une innovation de rupture est toujours liée à un risque ne serait-ce qu’au niveau marketing 😉

avatar oomu | 

@fosterj

ne soyez pas traumatisé que l'entreprise annonce son nouveau produit comme super cool.

L'entreprise pour laquelle je travaille le fait aussi. (au fait: la prochaine version de notre produit sera la meilleure version jamais faites, bien mieux que les précédentes moins abouties, moins complètes, moins cool que la nouvelle. et le pire ? c'est que c'est vrai)

mais okay, d'accord, un jour Apple viendra prendre l'antenne et dira "notre nouveau produit, il est potable. pas foufou, convenable ouais.. je dirais convenable... ça résume bien notre intention et notre ambition aujourd'hui : "Le nouvel iphone, + convenable que le précédent" "

avatar Pico | 

Les pointeurs bientôt au chômage !

avatar iPop | 

@Pico

Je m’étais dit la même chose, j’ai un vieil ami pointeur.

avatar Lemon19 | 

Je me permets de signaler à l’équipe MacG que j’ai parfois des difficultés à accéder aux commentaires des articles depuis que je suis sous iOS15. Je ne sais pas si c’est un bug local.
Après j’ai pas mal critiqué Apple cette année donc c’est aussi normal que Cupertino me punisse un peu 😊😁, le vrai sujet étant de mon côté le déverrouillage inopérant de l’iPhone avec l’Apple Watch.

avatar Adodane | 

Pas de quoi fouetter un chat quoi... A 30 images par secondes 😂

avatar YetOneOtherGit | 

@Adodane

"Pas de quoi fouetter un chat quoi... A 30 images par secondes 😂"

Tu a conscience de la proportion de contenus diffusée dépassant cette cadence d’image ?

avatar gigoo | 

@YetOneOtherGit

Le mode cinématique est destiné pour tourner des courts / long métrages et , par définition, un film tourne à 24 / 25 images par secondes

avatar YetOneOtherGit | 

@gigoo

"Le mode cinématique est destiné pour tourner des courts / long métrages et , par définition, un film tourne à 24 / 25 images par secondes"

Destinée à produire du contenu familial et des vidéos youtube 😄

Et le sous échantillonnage fonctionne plutôt bien de nos jours si nécessaire au pire 😎

avatar otisphone | 

@YetOneOtherGit

C’est parce qu’il ne regarde que Gemini Man, les films diffusés en 24 ips c’est pour les ieuv 🙄

avatar Adodane | 

@YetOneOtherGit

Oui, tout YouTube ou twitch !

avatar YetOneOtherGit | 

@Adodane

"Oui, tout YouTube ou twitch ! "

Nope loin s’en faut 😎

avatar Adodane | 

@YetOneOtherGit

Les youtubers ne filment pas en 60 im/s ?

avatar YetOneOtherGit | 

@Adodane

"Les youtubers ne filment pas en 60 im/s ? "

Les contenus sur youtube sont très loin de tous être à 60 im/s.

Youtube ce n’est pas que les Youtubers 😎

Et tous ne sont pas à 60 im/s loin s’en faut.

Et la diffusion les statistiquement loin d’être majoritairement à cette cadence.

Les cadences d’image supérieur n’ont d’intérêt réel que sur certains types de contenus 😎

Il faut arrêter de croire que c’est une amélioration essentielle pour tout qui est incontournable.

avatar Adodane | 

@YetOneOtherGit

A mon niveau je ne film qu'en 60 ims avec mon portable, et la différence se voit tout de suite avec du 30 ims.
Après si pour certains c'est pas essentiel c'est leur avis.
Tout youtuber qui veut diffuser de la qualité d'image pour ses abonnés achètera une caméra (plutôt un appareil photo capable en vidéo) qui conviendra.

avatar YetOneOtherGit | 

@Adodane

"A mon niveau"

Qui visiblement est assez bas sur les enjeux techniques.

Tu es dans des recettes de cuisine mal comprises et mal digérées 🙄🙄🙄

C’est toujours impressionnant cette capacité à défendre des bêtises corps et âme.

Ne pas savoir n’est pas honteux, défendre des inepties auxquelles ont ne comprends rien réellement… c’est autre chose 🥺

avatar YetOneOtherGit | 

@Adodane

"je ne film qu'en 60 ims avec mon portable, et la différence se voit tout de suite avec du 30 ims."

Nope tu penses la voir, nuance 😎

L’effet placebo ça existe.

Il faut des mouvements vraiment rapides pour que des cadences d’images supérieures apportent un gain démontré de ressenti.

Comment fait le cinéma pour offrir des images de grande qualité avec son « minable » 24 im/s ? 🙄🙄

avatar Adodane | 

@YetOneOtherGit

Placebo ?
Tu trouves qu'il n'y a pas de différence entre une vidéo à 60 images par seconde et 30 ?

avatar YetOneOtherGit | 

@Adodane

"Tu trouves qu'il n'y a pas de différence entre une vidéo à 60 images par seconde et 30 ? "

Ce n’est pas moi qui le trouve mais ma psycho-physiologie de la perception.

Les cadences d’image élevées n’ont d’intérêt que sur des sujets rapides et sur un véritable test à « l’aveugle » tu seras absolument incapable de détecter du 25p et du 50p sur tous les contenus n’impliquant pas des mouvements rapides.

Mais bon puisque tu n’es même pas capable de comprendre la notion d’entrelacements et que tu crois que la télévision est depuis toujours en 50 im/s je te laisse à tes croyances et à tes pensées magiques 🙄

Impressionnant cette volonté farouche de vouloir rester dans l’erreur qu’on certain pour de médiocre enjeux d’égo

avatar Adodane | 

@YetOneOtherGit

A l' "aveugle" je te fais la différence entre du 25p et du 50p en 5 secondes top chrono ! Enfin tout le monde fait la différence, je ne suis pas suhumain !

C'est pour ça que les utilisateurs Android de mycanal ont demander les 50 images par seconde depuis longtemps ( en plus du full HD), ils étaient limités à 25 avant et c'était dégueulasse.
C'est pour ça que les joueurs pc et consoles considèrent le 60 fps comme le minimum, maintenant la mode est au 120 fps sur consoles.

Toit le monde voit la différence sauf toi apparemment.

avatar YetOneOtherGit | 

@Adodane

"C'est pour ça que les joueurs pc et consoles considèrent le 60 fps comme le minimum, maintenant la mode est au 120 fps sur consoles."

Tu mélanges absolument tout le cas de la 3D Temps Réel et du jeu vidéo est fort différent ;
- Mouvementa très rapide
- Grande difficulté à créer comme sur de l’image en PdV réel un motion blur liant les images

Les cadence d’image élevées n’ont de sens que sur certains type de contenus 😎

Et je le répète comment explique tu que le pauvre cinéma avec ces « misérables» 24 im/s reste un sommet de qualité d’image (Les quelques explorations en 48 im/s ont été pour le moins discuté)

Je ne me fatigue pas à essayer de t’éduquer, c’est clairement vain, mais il faut éviter que tes inepties ne contamine les lecteurs 🧐

avatar Adodane | 

@YetOneOtherGit

Éduquer qui ?

Tu prétends que le 60 ims vs 30 ims n'est qu'un argument marketing, il que personne ne fait la différence ! Qu'il y a même des études.

Tu ne sais même pas que la fluidité d'un signal tv est supérieur à celle du cinéma.

Quel culot !

avatar YetOneOtherGit | 

@Adodane

"Tu prétends que le 60 ims vs 30 ims n'est qu'un argument marketing, il que personne ne fait la différence ! Qu'il y a même des études."

Nope : que les cadences d’image élevées non d’intérêt en terme de perception de la qualité que sur quelques typologies de contenus impliquant des mouvements rapides tel le sport.

Un youtubers face à son micro : strictement aucun intérêt.

avatar YetOneOtherGit | 

@Adodane

"Tu ne sais même pas que la fluidité d'un signal tv est supérieur à celle du cinéma."

😂😂😂

C’est ça 🙄

En dehors du choix très mal approprié des termes de « fluidité » et de « signal »

Où diable vois tu que je ne saurais pas que le cinéma est depuis le parlant normalisé à une cadence de 24 im/s ?

Où diable vois tu que j’ignore que la cadence d’image de la diffusion télévisée est selon les standards de 25 im/s ou 29,97 im/s ?

C’est si difficile que cela d’accepter son besoin d’apprendre à sortir de connaissances très bricolées et superficielles ?

Tu t’enfonces dans des semblants d’argumentaire de plus en plus spécieux pour ne surtout pas reconnaître ton besoin d’apprendre et accepter la leçon que je te donne gracieusement et avec bienveillance 🧐

C’est magique de défendre ainsi des croyances.

Quand je pense que c’est parti d’une inepte stigmatisation du 30 im/s qui te semble être d’un autre temps dans tes visions de jeune neo-geek ne jurant que par le fantasme marketing du : si ce n’est pas le plus gros chiffre possible aujourd’hui, c’est de la merde 🙄🙄🙄

avatar YetOneOtherGit | 

@Adodane

"Quel culot ! "

Effectivement tu n’en manques pas en essayant de défendre des connaissances approximatives bricolées 👏👏👏

avatar YetOneOtherGit | 

@Adodane

"Éduquer qui ?"

Toi qui en a un grand besoin au regard des approximations et des pensées magiques que tu défends.

Il n’y strictement aucune honte à ne pas savoir ou à mal savoir… par contre défendre par pure ego cet état de fait face à des connaissances véritables et éprouver c’est tout oser et c’est rarement bon signe 😀

avatar Adodane | 

@YetOneOtherGit

Il n'y a aucune honte à admettre que 50 demi-trames prises à 50 moments différents dînent effectivement de 50 images par secondes.

Il n'y a aucune a admettre que 60 images par secondes n'est pas seulement un argument marketing et que la différence se voit immédiatement face à 30 i/s !

Sissi !

avatar YetOneOtherGit | 

@Adodane

"Il n'y a aucune honte à admettre que 50 demi-trames prises à 50 moments différents dînent effectivement de 50 images par secondes."

J’essaye une dernière fois :

Tu essaye de m’expliquer pourquoi le 25 im/s entrelacés se transforme en 25 im/s progressive et non 50 im/s ?

Le même principe s’applique évidemment au NTSC 😎

avatar Adodane | 

@YetOneOtherGit

Le 25i doit se transformer en 50p si le de-entrelacement est bien fait.
Pour justement garder la fluidité perçue initial.

avatar YetOneOtherGit | 

@Adodane

"Le 25i doit se transformer en 50p si le de-entrelacement est bien fait."

😀🙄

C’est ça on invente les moitiés d’image en résolution verticale manquantes à chaque demie trame 🤯🙄🙄🙄

D’ailleurs si on est rigoureux on parle plutôt de 50i donnant du 25p.

J’avais été un peu vite sur ça.

avatar Adodane | 

@YetOneOtherGit

Oui on invente. Vlc fait ça par exemple. Comme une demi-frame est constituée seulement des lignes paires ou impairs, on copie la ligne 1 dans la ligne 2 manquante et ainsi de suite. Ce sont les modes bob, linear ou yadif il me semble.
Après d'autres méthodes existent avec de l'interpolation, on peut faire la moyenne des deux lignes aussi.

Certaines méthodes fonctionnent mieux que d'autres ou exigent moins de puissance processeur.

L'important c'est de garder une perception de 50 i/s.

avatar YetOneOtherGit | 

@Adodane

"L'important c'est de garder une perception de 50 i/s. "

Qui,n’existe pas : en entrelacé c’est 50 fields/s pour 25 frame/s 😎

avatar Adodane | 

@YetOneOtherGit

Donc c'est 50 !

avatar YetOneOtherGit | 

@Adodane

"Donc c'est 50 ! "

Là deux hypothèses :

- Sois tu fais exprès
- Sois ton cas et désespéré

Tant tout les il me faut accepter que je ne peux visiblement rien pour toi et mon égo a du mal à l’accepter 😂

On ne sauve pas les gens contre leur volonté 😄

avatar YetOneOtherGit | 

@Adodane

"Oui on invente. Vlc fait ça par exemple. Comme une demi-frame est constituée seulement des lignes paires ou impairs, on copie la ligne 1 dans la ligne 2 manquante et ainsi de suite. Ce sont les modes bob, linear ou yadif il me semble.
Après d'autres méthodes existent avec de l'interpolation, on peut faire la moyenne des deux lignes aussi. "

Ça c’est autre chose une volonté de faire un sur-échantillonnage temporel doublant la cadence d’image en acceptant que la résolution spatiale soit divisée par deux.

Les processus de desentrelacement standard combine les deux demi frame en compensant idéalement le décalage temporel entre elles et respect la cadence d’image : du 50 fields/s entrelacé devient du 25 frame/seconde progressif

Le nombre de frame par seconde est le même avant et après le des entrelacement : 25 frame par seconde et la résolution spatiale est préservée 🤓

avatar Adodane | 

@YetOneOtherGit

Donc un de entrelacement qui transforme via logiciel, chaque field en image complète donc combien d'images par seconde ?

avatar YetOneOtherGit | 

@Adodane

"Donc un de entrelacement qui transforme via logiciel, chaque field en image complète donc combien d'images par seconde ? "

Nope pas en imagine complète sur 50 im/s mais en image ayant une résolution verticale divisée par deux.

Dualité entre résolution spatiale et temporelle sur du desentrelacement.

Comme expliqué précédemment soit tu préserve la résolution spatiale en restant sur la cadence d’image de la source qui est de 25 im/s, soit tu préserve l’illusion de cadences d’image en sacrifiant la résolution spatiale.

Là clairement tu joues au con, si non ce n’est pas humainement possible d’être aussi obtus 🥳

avatar YetOneOtherGit | 

@Adodane

"Il n'y a aucune a admettre que 60 images par secondes n'est pas seulement un argument marketing et que la différence se voit immédiatement face à 30 i/s !"

Si car c’est faux pour tous les contenus n’impliquant pas de mouvements rapides 😎

avatar Adodane | 

@YetOneOtherGit

Ça se voit pour tout contenu, même un journaliste présentant le telejornal de 20h.

avatar YetOneOtherGit | 

@Adodane

"Sissi ! "

Et en dehors de ta compréhension très approximative du sujet abordé nous sommes partie d’un constat que tu réfute : les cadence d’image élevées reste ultra minoritaire dans la production audiovisuelle et un système en 30 im/s n’est en rien obsolète ce qui était ton affirmation péremptoire initiale.

Sur ce j’arrête d’essayer de croire en ton potentiel d’intelligence et d’apprentissage.

Reste dans tes compréhensions bricolées et grands bien te fasses.

J’aurais essayé de t’élèver au dessus du raz des pâquerettes, tu ne veux pas ce n’est pas bien grave j’ai fait ma BA de la journée 😎

avatar Adodane | 

@YetOneOtherGit

en.m.wikipedia.org / wiki / Interlaced_video

Tout est la.

avatar YetOneOtherGit | 

@Adodane

"Tout est la. "

Ce que tu en comprends plutôt 😎

C’est un des phénomènes merveilleux de l’époque : la capacité de tirer des interprétations fausses de documents justes 🤯

Ce que tu n’arrive pas à comprendre c’est qu’une demi frame est réellement une demi image n’ayant que la moitié de ses lignes

L’image complète est la somme des demi-frame

On a bien 50 demi frame par seconde mais seulement 25 images complètes par seconde 😎

C’est le principe même de l’entrelacement, de sa raison d’être, des notions d’échantillonnage spécial et temporel, de rémanence… qui t’échappe complètement visiblement.

Pages

CONNEXION UTILISATEUR