L’une de nos pièces préférées de cette année, initialement publiée le 27 octobre 2022.
J’ai beaucoup joué avec l’outil d’art de l’IA, Stable Diffusion, depuis le Version de l’interface utilisateur Web Automatic1111 (s’ouvre dans un nouvel onglet) d’abord lancé. Je ne suis pas vraiment un type de ligne de commande, donc avoir une interface simple avec la souris est beaucoup plus dans ma rue. Et c’est un jouet amusant pour un homme sans un os artistique visuel dans son corps. J’ai imaginé le guide de l’auto-stoppeur de la galaxie, une peinture de Monet de Boris Johnson assis sur les toilettes au milieu d’un étang et Donald Trump lisant mon format PC bien-aimé.
Mais rien ne m’a autant touché que de marteler le Nvidia RTX 4090 (s’ouvre dans un nouvel onglet) pendant huit heures et demie d’affilée, l’entraînant à peindre comme mon grand-oncle Hermann.
Vous ne connaissez pas le nom d’Hermann Kahn. Je serais également incroyablement surpris si vous le reconnaissiez par le nom sous lequel il était en fait plus connu, Aharon Kahana (s’ouvre dans un nouvel onglet). Honnêtement, je ne le connaissais pas non plus; malheureusement il est mort bien avant ma naissance.
Mais j’ai entendu tellement d’histoires, tellement parlé de l’oncle Hermann de la part de ma mère et de ma défunte grand-mère pendant que je grandissais, que j’ai l’impression de le connaître en quelque sorte. Au moins une partie de lui en tout cas.
Le style artistique de Kahana est distinctif et une caractéristique distincte de mon enfance.
Le lien familial est fort, encore plus depuis mon voyage à Tel-Aviv juste avant la naissance de mon fils de trois ans. C’était l’endroit où ma grand-mère, Inge, et mon arrière-grand-mère, Rosa Kahn, ont fui l’Allemagne d’avant la nuit de cristal au milieu des années 30. Et l’endroit où Hermann Khan s’est installé après avoir rencontré sa femme alors qu’il étudiait l’art à Berlin.
J’ai marché dans les rues qu’ils ont parcourues, passé devant l’appartement dans lequel ma grand-mère a grandi, parcouru la route de Haïfa que Rosa empruntait chaque matin pour son travail et visité la maison d’Hermann à Ramat Gan.
Cette maison qu’il partageait avec sa femme, Mideh, est devenue un musée de son art et bien qu’elle ait été fermée lors de ma visite, et qu’elle l’ait clairement été pendant un certain temps, elle a apparemment rouvert depuis et accueille à nouveau des expositions.
Le style artistique de Kahana est distinctif et une caractéristique distincte de mon enfance. J’étais entouré de ses céramiques et de peintures de style ancien et tardif dans les maisons de mes parents et grands-parents. Même enfant, j’étais attiré par eux. Il y a un vase particulier que je ne pourrais jamais ne pas voir comme le vaisseau spatial Enterprise, grâce à sa section de soucoupe de type Trek.
Une image géométrique entièrement abstraite de ce que j’ai toujours supposé être un couple amoureux ornait notre manteau de cheminée, une image des toits parisiens et une scène de plage orageuse peinte à l’huile épaisse montait nos escaliers.
Mais forcément, ce peintre et céramiste germano-israélien du début du XXe siècle ne figure pas parmi les artistes répertoriés par Stable Diffusion. Et bien que j’aie expérimenté avec des invites détaillées, que j’ai joué avec des tracés X/Y pour essayer de trouver des leviers à tirer pour obtenir une approximation proche des peintures abstraites qu’il a produites, je n’y suis jamais vraiment arrivé.
Le fichier de points de contrôle de diffusion stable n’a tout simplement pas les points de référence nécessaires. Mais il existe des moyens d’encourager l’IA à comprendre différentes images liées et à construire à partir de celles-ci spécifiquement. Ils s’appellent des incorporations et les gens les ont utilisés pour entraîner l’outil à reconnaître leurs propres visages. De cette façon, vous pouvez vous inclure dans tous les fantasmes sauvages peints par l’IA que vous pourriez désirer.
Mais je voulais l’entraîner à reconnaître et à comprendre – du mieux qu’une IA relativement simple le pouvait – l’art d’Aharon Kahana. C’est un outil étonnamment puissant, surtout compte tenu des mises en garde dans l’explication des intégrations selon lesquelles “la fonctionnalité est très brute, à utiliser à ses risques et périls”. Cependant, grâce à la dernière version de l’application Web UI sur Github, tout peut être fait via un navigateur.
Vous aurez besoin de Stable Diffusion, et donc de Python, déjà opérationnel sur votre machine, mais vous pouvez ensuite rassembler un dossier d’images sous un nom particulier, et il écrasera votre GPU à 100 % de charge, et 50 % de votre CPU, pendant des heures pour créer des points de référence que Stable Diffusion peut utiliser lorsqu’il est invité avec le nom exact de l’intégration.
Je voulais l’entraîner à reconnaître et à comprendre – du mieux qu’une IA relativement simple pouvait – l’art d’Aharon Kahana.
Cela semble relativement simple, mais il a certainement fallu quelques essais et erreurs de ma part. Notamment après avoir réalisé qu’une fois que j’avais téléchargé environ 70 images du travail de mon grand-oncle, à partir de divers sites d’enchères à travers le monde, je devais en fait les étiqueter avec quelque chose de vaguement détaillé pour que la formation ait un impact.
Cela a pris beaucoup de temps pour déterminer le support et les sujets de chacune des pièces que j’avais téléchargées, puis renommer chaque fichier à la main. Et lorsque vous travaillez avec des images parfois très abstraites, ce n’est pas toujours aussi facile.
J’ai ensuite pointé le RTX 4090 et mon Core i9 10900K vers le dossier approprié, créé le wrapper d’intégration et l’ai laissé s’éloigner pendant plus de huit heures et demie pour accepter ce que je lui avais donné. Les 16 432 cœurs et une bonne partie des 24 Go de mémoire de la nouvelle carte Nvidia, ainsi que la moitié de mon Core i9 de 10e génération, ont été utilisés pour cette tâche.
Je ne vais pas prétendre être assez intelligent pour vraiment comprendre ce que j’avais confié au GPU grand public le plus puissant au monde, mais lorsque je me suis enregistré avec lui dans la soirée, j’ai pu voir qu’il avait pris les images d’entrée et faire ses propres approximations.
C’était comme un enseignement d’outre-tombe, comme si mon PC avait passé la nuit à apprendre d’Hermann, à gribouiller dans un hommage à son style pour essayer de comprendre comment le faire sans l’aide de l’artiste.
Au matin, l’intégration était terminée et je pouvais redémarrer l’interface utilisateur Web – désormais répertoriée avec une intégration d’inversion textuelle – et apposer le texte “par aharon_kahana” à la fin de n’importe quelle invite et voir ce que l’IA avait appris du jour au lendemain.
Et c’était remarquable. Mon ordinateur créait hommage après hommage à mon grand-oncle, plus fascinant encore lorsqu’il faisait des images de choses que Kahana ne toucherait jamais. Je suis un novice absolu en ce qui concerne l’art mystique de l’invite, mais même mes demandes de base ont livré des images qui évoquaient la mémoire de l’artiste.
Là où il manquait l’âme pure et la compréhension de ce qu’il faisait réellement, il compensait par une étrange créativité numérique et un effort soutenu par le GPU. Certes, tout cela était reconnaissable et inextricablement lié à son style artistique.
Je sais que beaucoup d’artistes modernes s’opposent au développement de l’art de l’IA, frustrés par la surabondance d’images de femmes fantastiques créées par des personnes sans talent artistique – ainsi que ces fantasmes à fourrure – et je ne prétends pas savoir exactement comment Aharon Kahana aurait ressenti, mais je ne peux pas m’empêcher de penser qu’il aurait adopté ce nouvel outil.
Et c’est ce que c’est, un outil. Autant j’ai été impressionné par la façon dont Stable Diffusion est venu à recréer son style artistique, c’est tout ce qu’il peut vraiment faire : recréer. Cela ne va pas vraiment faire évoluer le style tout seul ; il faudra encore un artiste humain pour pousser l’art plus loin. Et il a encore besoin d’une contribution humaine détaillée pour lui donner suffisamment de sujet à partir duquel construire.
Plutôt que quelque chose qui va remplacer les artistes, c’est juste un autre outil – comme les SLR haute résolution et Photoshop sont devenus pour les peintres paysagistes – qui s’intégrera dans l’arsenal des artistes intéressés à amener la technologie dans de nouveaux endroits intéressants.
L’art de l’IA, à son niveau actuel, ressemble alors à un point de départ plutôt qu’à quelque chose capable de créer véritablement le produit fini. Mais cela ne m’empêchera probablement pas de remplir mon PC d’un million d’images colorées et abstraites à l’infini. Tous inspirés par une partie de ma famille que je n’ai jamais vraiment connue mais que j’espère toujours embrasser.