La Vision par Ordinateur
au service de l'Art et
des Collections
Les techniques de vision artificielle ont atteint un niveau de maturité qui transforme en profondeur l'analyse des collections culturelles. Thot apporte cette expertise aux institutions françaises — pour analyser, indexer et valoriser leur patrimoine à une échelle sans précédent.
Une révolution silencieuse dans les musées
La Computer Vision appliquée à l'art n'est plus un horizon expérimental — c'est une réalité opérationnelle. Dans les institutions de premier rang, des algorithmes croisent des centaines de milliers d'œuvres avec des archives photographiques pour reconstruire l'histoire des expositions, automatiquement et en quelques heures.
Des projets pionniers ont démontré ce qui est désormais possible : identifier automatiquement des dizaines de milliers d'œuvres dans des fonds photographiques, connecter des collections par palette de couleurs et similarité visuelle, rendre des corpus entiers interrogeables par les modèles de Vision API. Ces institutions ne testent plus — elles opèrent.
Pourtant, la grande majorité des musées français n'a pas encore accès à ces capacités. C'est exactement notre terrain d'action.
le plus grand corpus
artistique en ligne
dont les collections
restent à explorer par IA
de classification stylistique
sur les grandes catégories
Ce qui distingue Thot
Notre conviction : les collections muséales sont des données visuelles structurées, et elles méritent les mêmes outils que les secteurs les plus avancés. Mais appliqués avec le respect et la rigueur qu'exige le patrimoine.
Expertise française en IA
Notre équipe conçoit des pipelines de vision artificielle pour des cas d'usage exigeants depuis Paris. CamemBERT, DINOv2, CLIP — nous maîtrisons les modèles fondamentaux et savons les adapter aux spécificités des corpus culturels, où les distributions d'images sont structurellement distinctes des datasets naturels.
Souveraineté des données
Là où d'autres solutions dépendent d'infrastructures américaines, nous déployons sur cloud européen (OVHcloud) ou on-premise. Les données patrimoniales restent en France, sous le contrôle des institutions, conformément aux exigences des tutelles publiques et aux préconisations de la CNIL.
L'humain reste décisionnaire
L'IA accélère le travail préparatoire — vos équipes de documentation et de conservation conservent le contrôle. Nous proposons, l'expertise humaine valide. C'est le seul modèle acceptable pour le patrimoine culturel.
Fine-tuning sur vos collections
Un modèle entraîné uniquement sur des images photographiques est structurellement mal adapté à l'analyse d'œuvres d'art. Grâce aux techniques de LoRA, nous adaptons les modèles fondamentaux à vos collections spécifiques sans ressources de calcul prohibitives.
Les corpus sur lesquels
nous nous appuyons
La recherche en CV artistique repose sur des datasets spécialisés, construits par la communauté académique et les musées eux-mêmes. Ces corpus permettent d'entraîner et d'évaluer les modèles sur des tâches propres au domaine de l'art.
| Corpus | Volume | Contenu & annotations | Usage principal |
|---|---|---|---|
| WikiArt | ~250 000 | 3 000 artistes, 125 styles, 41 genres | Classification style / artiste / genre |
| SemArt | ~21 000 | 8 attributs par œuvre : commentaires, auteur, technique, école, période | Compréhension sémantique |
| MultitaskPainting100k | ~100 000 | 1 508 artistes, annotations multi-tâches simultanées | Apprentissage multi-tâches |
| ArtBench-10 | Équilibré | Premier benchmark standardisé pour la synthèse d'images | Évaluation modèles génératifs |
| WikiArt Emotions | 4 105 | Annotations émotionnelles humaines, 22 catégories stylistiques | Analyse affective |
Les musées français disposent aujourd'hui d'une fenêtre stratégique pour transformer la richesse de leurs collections en avantage numérique.
Le patrimoine culturel français est parmi les plus riches au monde. La numérisation progresse. Les modèles de vision sont matures. Il manque un partenaire technique qui comprend à la fois les contraintes institutionnelles et l'état de l'art en vision artificielle.
Contacter ThotCe que nous apportons
aux institutions culturelles
Des solutions clés en main, déployées sur vos infrastructures ou en cloud souverain européen, sans dépendance à des plateformes tierces.
Indexation visuelle automatique
Analyse et classification à grande échelle : attribution de style, période, technique, détection de sujets iconographiques. L'IA accélère le travail préparatoire, vos équipes valident.
Recherche par similarité visuelle
Moteur basé sur les embeddings visuels profonds : retrouvez des œuvres par palette, composition, style ou motif. Idéal pour la médiation numérique et la découverte par les visiteurs.
Analyse tonale et colorimétrique
Extraction des signatures colorimétriques d'une collection entière. Détection de tendances stylistiques sur le long terme, comparaison entre artistes ou périodes.
Détection d'œuvres en archives
Identifiez automatiquement vos œuvres dans vos archives photographiques historiques. Reconstituez l'histoire des expositions. Créez des liens entre fonds d'archives et collection numérique.
Authentification et provenance
Analyse de coups de pinceau, textures et signatures visuelles propres à chaque artiste. Détection d'anomalies stylistiques pour assister les experts en authentification et provenance.
Intégration souveraine
Déploiement sur cloud européen ou infrastructure on-premise. Conformité RGPD native. Données patrimoniales hébergées en France selon les exigences des institutions publiques.
Scénarios d'application
pour les musées français
Six applications directement opérationnelles pour les institutions culturelles, du plus accessible au plus ambitieux.
Catalogage assisté par IA
Accélérer la documentation de fonds non catalogués — photographies, arts graphiques, arts décoratifs — en proposant automatiquement style, période et sujets iconographiques pour validation humaine.
Outil de découverte pour visiteurs
Interface mobile permettant de photographier une œuvre et d'explorer la collection par similarité visuelle, couleur ou composition. Médiation numérique sans audioguide traditionnel.
Analyse de fonds photographiques
Identification des œuvres présentes dans les archives d'exposition. Reconstruction de l'historique des accrochages. Valorisation de fonds documentaires jusqu'ici inexploitables à cette échelle.
Surveillance de l'état de conservation
Détection automatique des dégradations, craquelures, variations colorimétriques entre deux campagnes photographiques. Priorisation des interventions de restauration par score d'urgence.
Analyse culturelle à grande échelle
Visualisation des tendances stylistiques sur l'ensemble d'une collection, évolution chromatique sur des siècles, comparaisons inter-collections pour la recherche en histoire de l'art.
Interopérabilité et données ouvertes
Production de métadonnées enrichies compatibles avec les standards du patrimoine numérique (IIIF, Dublin Core, Linked Open Data). Contribution aux grands corpus ouverts avec souveraineté des données.
Le moment est décisif
« La culture est une donnée en attente d'être traduite en motifs significatifs par la visualisation. » — Manuel Lima, fondateur de VisualComplexity.com
Les verrous technologiques sont levés
Les techniques de fine-tuning par LoRA permettent d'adapter des modèles fondamentaux (DINOv2, CLIP) à des collections spécifiques sans ressources de calcul prohibitives. La classification de style sur WikiArt atteint des niveaux de précision comparables à l'expertise humaine. Le retrieval multimodal texte/image est opérationnel pour la médiation.
La souveraineté numérique, un avantage français
Les institutions françaises ont la possibilité de s'appuyer sur une infrastructure souveraine dès le départ. Thot déploie sur OVHcloud depuis Paris — les données patrimoniales restent en France, sous le contrôle des institutions, conformément aux préconisations de la CNIL.
Un tissu muséal unique à valoriser
La France compte plus de 1 200 musées de France, dont les collections photographiques, les fonds d'arts graphiques et les archives d'exposition représentent un patrimoine visuel d'une richesse exceptionnelle — en grande partie non catalogué à l'échelle que permettent aujourd'hui les outils de vision artificielle.
Votre collection mérite
les meilleurs outils d'analyse
Nous proposons un audit gratuit de votre collection numérique et une démonstration sur vos propres données. Sans engagement, avec nos ingénieurs.
Contacter ThotDEEP-5 · 75008 Paris · Computer Vision