L'IA au KMSKA : un nouveau défi

Le Musée royal des Beaux-Arts d'Anvers (KMSKA) a récemment lancé un projet innovant d'IA, qui en est actuellement aux dernières phases de préparation. Ce qui a commencé comme un outil pratique pour répondre aux questions des visiteurs est devenu une expérience passionnante autour de l'art, de la technologie et de l'expérience du public. Petit aperçu.
Aucune question n'est de trop
À l'origine, l'idée est venue des restaurateurs et des conservateurs qui travaillent depuis l'automne 2023 sur le projet de restauration Studio Rubens. Ils ont remarqué que les visiteurs leur posaient souvent des questions pratiques sur le fonctionnement du musée ou certaines installations. Afin d'aider l'équipe, l'idée d'un chatbot a rapidement été envisagée. Au départ, celui-ci était uniquement destiné à servir de point d'information supplémentaire pour les visiteurs, mais il a rapidement été étendu à des questions plus approfondies sur des sujets liés à l'histoire de l'art. Le département ICT a délibérément choisi de développer le projet en interne, car cela permet de conserver toutes les données au sein du musée et à l'équipe d'acquérir des connaissances précieuses sur les possibilités offertes par l'IA.
Étape par étape
Après une étude approfondie des possibilités, il a été décidé de construire le chatbot à l'aide d'outils open source tels que Ollama, Whisper et Piper TTS. Le concept est simple: les visiteurs peuvent poser une question à Studio Rubens, après quoi le logiciel la convertit en texte, la traite, puis la prononce d'une voix naturelle. Comment ce processus se déroule-t-il exactement ?
Ollama est une application serveur dans laquelle un modèle linguistique de grande taille (LLM) est chargé afin de pouvoir être interrogé. Lorsqu'un visiteur pose une question, cet extrait audio est converti en texte à l'aide de Whisper, un outil de reconnaissance vocale. Il en résulte une question textuelle, qui est ensuite réunie avec les informations recherchées dans Ollama. Le résultat, qui est également la réponse à la question initiale du visiteur, est à ce stade un texte. À l'aide de Piper TTS, celui-ci est à son tour généré en audio, avec une voix néerlandaise ou anglaise. Ces fragments audio sont enfin renvoyés à l'endroit d'où provenait la question à l'origine: l'application IA chez Studio Rubens.
Difficultés
Le plus grand défi s'est avéré être le matériel: un modèle linguistique de grande taille nécessite beaucoup de mémoire et de puissance de calcul, alors que seul du matériel grand public était disponible. Il a donc fallu opter pour un modèle plus petit, et donc pour un compromis entre vitesse et qualité. Le multilinguisme a également posé des obstacles. Bien que les modèles reconnaissent très bien l'anglais, il y avait au départ des problèmes d'orthographe et de grammaire en néerlandais. Finalement, la combinaison d'une saisie en néerlandais, y compris les connaissances à rechercher, et d'un mappage anglais-néerlandais s'est avérée la plus efficace.
Conclusion
Avec ce premier projet d'IA, le KMSKA a réussi à transformer une idée théorique en un concept fonctionnel. Bien qu'il n'en soit encore qu'à ses débuts, ce projet a permis à l'équipe informatique de découvrir le domaine de l'IA et promet d'optimiser prochainement l'expérience des visiteurs. En essayant différentes choses et en tirant les leçons de ses erreurs, le musée a pu déterminer les choix qui fonctionnent, les limites et la manière dont certains aspects, tels que le multilinguisme, peuvent être mieux abordés. Fort de ces enseignements, le musée espère inspirer d'autres acteurs à utiliser la technologie de manière créative et pertinente.