Interrogations sur l’IA, encore !

J’ai lu il y a quelques jours un article qui d’une certaine manière me fait un peu peur. C’était un peu avant les histoires autour du studio Ghibli, ce n’est donc pas de ça que je veux parler — il s’agit de toute façon d’un épiphénomène, une utilisation spécifique et pas forcément très intelligente de ces outils. Il parlait du futur de la téléphonie mobile, en évoquant les possibilités que l’IA apporterait à ce domaine précis. En préambule, je voudrais faire quelques rappels sur des principes de base de la photographie.

La physique de la photo

La photographie est un monde fascinant, d’un point de vue physique. On y associe l’optique, l’électronique (ou la chimie, dans le cas de l’argentique), et… d’une certaine manière, la mécanique quantique !

En très gros, la capture d’images est un monde de compromis : on veut pouvoir attraper beaucoup de lumière ? Alors il faudra une surface importante pour la capturer — la surface de référence, à partir de laquelle on évalue les autres, est celle d’une bonne vieille pellicule 24×36, soit 24mm de haut pour 36mm de large, les personnes qui ont connu les années 90 savent de quoi je parle. Une surface plus réduite pourra capturer moins de lumière, mais elle pourra se contenter d’un système optique plus simple et compact pour y amener la lumière. Dans un appareil photo électronique compact, le capteur est bien plus petit que la taille de référence. Dans un téléphone, il l’est encore plus. Parfois, il est même tellement petit que la taille d’un élément sensible approche la longueur d’onde de la lumière visible…

À la réflexion, je crois que j’approfondirai cette partie pour plus tard, je sais, c’est lâche, mais si je me lance je crois que je dépasserai largement le cadre de cet article ! Sachez simplement que si vos vieux appareils photo à pellicule étaient aussi gros (même pour les appareils “compacts”), si un appareil “reflex” moderne est plus gros qu’un smartphone, si un zoom 400-1200 f/4 est si gros et si cher, il y a de très bonnes raisons qui découlent de limites physiques, des choses auxquelles on ne peut rien. En pratique, le microscopique capteur d’un téléphone ne peut pas donner une qualité d’image similaire à celui d’un reflex ou d’une bonne vieille pellicule. Et pourtant, ils fournissent des photos tout à fait correctes, voire assez bonnes quand on monte en gamme.

Les solutions

Pour contourner les limitations liées aux capteurs et à l’optique, les constructeurs ont mis en place plusieurs stratégies. La plus basique est celle dite du « pixel binning ». Il s’agit d’un processus électronique consistant à assembler plusieurs points sensibles du capteur (on parle de pixels) dans le but de capturer plus de lumière. Pourquoi, dans ce cas, ne pas faire un capteur avec moins de pixels ? Le résultat devrait être meilleur, mais cette solution présente un défaut rédhibitoire : les équipes marketing préfèrent dire que le téléphone a un capteur « 100MPix » plutôt que « 25MPix ». Même si le 2e est à priori meilleur, ça leur évite de devoir expliquer pourquoi. De mémoire, un constructeur s’y était risqué, je crois que c’était LG, ça n’avait pas pris.

Deuxième idée, exploitée depuis une grosse dizaine d’années : le « multi-frame ». En pratique, à chaque fois que vous capturez une image sur votre téléphone, celui-ci en capture en réalité une dizaine en rafale, qu’il assemble ensuite pour former l’image finale. Ce procédé permettait par exemple à un de mes anciens téléphones de capturer des images en 50MPix, malgré un capteur limité à 13MPix, photos de qualité plus que correcte (j’avais comparé à l’époque avec mon reflex APS-C, le téléphone n’avait pas à rougir). Cette méthode est devenue possible quand la puissance des puces de téléphone est devenue suffisante, ce qui nous place autour de 2013.

[galerie/ exemples OP7]

Mais la solution qui la le vent en poupe actuellement est l’IA générative. Ce qui m’amène à l’article qui m’a alarmé. Ce dernier présente les avancées de Google sur le sujet, et j’avoue ne pas être sûr de les apprécier. Google n’est pas un nouveau venu dans le domaine : leurs téléphones sont connus pour, justement, la qualité des photos qu’ils proposent grâce à un traitement logiciel poussé : ils ne sont pas forcément les meilleurs à la capture, mais savent très bien corriger les problèmes qui sont intervenus à ce moment. Les plans ? Ajouter des traitements IA, de plus en plus. Certains sont relativement légitimes, à première vue : réduire le bruit lors de prises en haute sensibilité, ça peut être utile, surtout quand on peut le faire sans avoir recours à un flou un peu violent. Même si dans ce cas déjà, l’IA va recréer des détails. D’autres posent à mon avis plus question : l’entreprise se propose, par exemple, d’utiliser l’IA générative pour améliorer le cadrage : placer le sujet au centre du cadre (ou au tiers, ou au centre de la spirale de Fibonacci, si la fonctionnalité est configurable), quitte à générer la partie de l’image qui était hors cadre. Autre proposition : améliorer le “zoom numérique”, là aussi en générant les détails perdus par le processus de zoom. Et, pourquoi pas, donner la possibilité de supprimer un indésirable sur l’image ? De créer des sourires ? D’ajouter une personne ? De revoir l’éclairage pour placer cette scène capturée sous le soleil de midi à l’heure dorée, beaucoup plus jolie ? “Il est joli, ce faîtage que tu as photographié, est-ce que ça t’intéresse que j’ajoute une cigogne dessus ?”

En fait, ce qui me chagrine dans ces propositions, c’est, d’une certaine manière, la promesse que quel que soit votre niveau, votre téléphone va capturer pour vous la meilleure version de votre souvenir. Même si, dans le processus, il doit en générer la moitié. La question que je me pose : le produit de ce travail algorithmique est-il encore mon souvenir ? Une seule chose est sûre : il n’existe aucune réalité où il s’est vraiment produit comme mon téléphone me le montre… La Tour de Pise sans touristes ? C’est possible ! Un château sans ce pilône disgracieux ? Bien sûr ! Et pourquoi pas dans un environnement pseudo moyen-âgeux reconstitué ? Un sourire sur le visage de votre enfant qui baisse la tête pour ne pas être pris en photo ? Aucun problème !

Objection : retouche a posteriori

On pourra m’objecter qu’en pratique, ce que propose Google ici, ce n’est rien moins que ramener à la prise de vue un processus qui, aujourd’hui, a lieu après. La différence, c’est que même si les résultats sont similaires concernant l’image qui partira sur les réseaux sociaux, dans un cas elle a été fabriquée directement par le téléphone, dans l’autre cas j’ai repris une photo peut-être imparfaite, mais sur laquelle j’ai choisi quels traitements appliquer. Traitements parfois un peu lourds, comme ce mec que je veux faire disparaître de mes souvenirs, mais je choisis les photos sur lesquelles je les applique. Qu’est-ce qui se passera quand les photophones choisiront eux-mêmes ces traitements ? Uniformisation, standardisation, des personnages, des sujets toujours au même endroit, on se retrouvera comme aux débuts d’Instagram, quand tout le monde partageait ses photos artificiellement vieillies en mode sépia…

Je crois qu’il est vraiment temps de revenir au bon vieil argentique pour les souvenirs les plus précieux !



8 réponses à « Interrogations sur l’IA, encore ! »

  1. oui L IA generative c est pas le meilleur cadeau en photo y compris en postprod ca se voit la résolution est moindre que ta photo donc pas top. Et ou est le plaisir d en faire si tu as plus rien à faire ou est asse le temps de l argentique ou avait les mains dans le combuis façon de parler. Er aussi nos escrocecolo on les voit pas pour la consommation hallucinante d énergie pour justement alimenter ces fermes à serveur informatique pour créer et gérer cette fameuse IA et le reste de tout ce qui est connecté

    bonne journée

    Aimé par 2 personnes

    1. Ça râle beaucoup, de plus en plus, sur la consommation des fermes de serveurs dédiés à ce travail — au passage, pas toujours avec les meilleurs arguments, typiquement j’ai pu lire sur l’histoire de la consommation d’eau pour générer une image est largement exagérée, l’eau de refroidissement d’un centre de données tournant en circuit fermé. Mais ici, ce n’est pas vraiment le sujet : on est sur du traitement local, réalisé par la puce installée sur le téléphone. Mais un traitement local auquel le “photographe” ne comprend rien, et qui est réalisé à son insu, qui ajoute des éléments qui n’existent pas parce-que c’est crédible dans ce contexte…
      Effectivement, il est loin le temps où on s’amusait à fabriquer des caches pour faire varier l’exposition d’une zone donnée sur l’agrandisseur !

      Aimé par 1 personne

  2. Très bel article sur le sujet 👍
    Pour ma part, cela ne m’étonne plus guère, toute stratégie marketing venant des technocrates clonés est au final une « arnaque », tant sur la technique que financièrement…
    Entre le green washing et la techno course, on est servi.
    Un sujet que j’avais abordé avec un article sur une revue (en fait, réellement un seul magazine en particulier que j’avais acheté) qui est devenue une de mes références sur la photo.

    Aimé par 1 personne

  3. Pour ma part, l’idée d’utiliser une IA n’est pas prévue du tout.
    Je préfère avoir des photos imparfaites, telle que je pouvais en avoir en argentique.
    Les pros hurleront au cadrage et autres choses, mais j’y recherche d’abord à témoigner de ce que je vois.
    Et que ce soit via un reflex numérique (que je n’ai point car l’escarcelle hurle elle aussi 😸!) ou un smartphone…
    Mes seules corrections sont soit le cadre mis autour, un focus sur une zone en particulier, ou juste le réglage des couleurs (pour un effet particulier ou simplement remettre les couleurs vues, les capteurs de mon mobile captant ce qu’ils peuvent… Capter !).

    Aimé par 1 personne

    1. Vous le savez, il m’arrive d’y avoir recours, de temps en temps j’ai une idée et je suis curieux du résultat (bon, la dernière en date cadrerait plus dans le thème avec Halloween qu’avec Pâques, vous y avez donc échappé pour l’instant 😁), parfois je me surprends à regretter de n’avoir pas passé plus de temps à travailler mon dessin — je fais des choses qui peuvent être jolies, mais mon respect des proportions fait de mes dessins des œuvres résolument… modernes 😁
      Ce n’est pas idéal pour illustrer un tel site ! Heureusement que j’ai le soutien d’un véritable photographe, mais parfois j’ai une idée si spécifique que c’est compliqué de trouver la bonne photo…

      Aimé par 1 personne

  4. Plus les photos sur le portable sont juste de l’IA, moins j’y fais confiance. Le portable me montre souvent des couleurs qui n’étaient pas là du tout, et où je peux le voir au moment de les prendre. Si l’argentique n’était pas si cher de nos jours, j’y reviendrais avec plaisir.

    Aimé par 2 personnes

    1. C’est un peu la plaie sur les portables. Le mien est équipé d’un mode spécifique pour photographier la Lune, les résultats sont assez jolis mais honnêtement, parfois, je me demande s’il me montre la Lune que je vois ou s’il va en chercher une photo en ligne pour la placer au bon endroit dans le cadre 😅
      Pour l’argentique, j’ai la chance d’avoir un papa qui était actif dans des clubs photo, et qui a du matériel inutilisé. J’ai un appareil à faire remettre en état, et un autre dont je vais tester les résultats dès que j’aurai acheté du révélateur. Conversation dans une Fnac : “avez-vous des produits pour développer du noir et blanc ?” “on n’en a pas actuellement, mais vu que l’argentique repart très fort actuellement, on va peut-être finir par en avoir de-nouveau.”. Ça laisse de l’espoir !
      On peut trouver du matériel correct (reflex, optiques) sur les sites de vente d’occasion, reste ensuite à trouver les pellicules… et de quoi les développer ! Pour ma part, c’est la raison pour laquelle je me relance plutôt sur le noir et blanc.

      Aimé par 2 personnes

  5. […] parce-que mon téléphone, malgré toute son « intelligence », ne l'ajoute pas lui-même (et c'est heureux […]

    J’aime

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.