Le problème
Je voulais des workflows d’agents IA pour traiter des médias en batch — images, audio, vidéo, texte — en pouvant comparer les résultats entre différents modèles et plateformes d’inférence. Il n’existait pas de bibliothèque simple pour ça, alors j’en ai fait une.
Polymage
C’est une bibliothèque Python modulaire et agnostique aux plateformes. Elle permet de définir des agents avec des prompts et des entrées multimodales, puis de les exécuter sur plusieurs backends pour comparer les résultats.
Plateformes supportées
En local :
- Ollama — macOS, Windows, Linux
- LM Studio — macOS, Windows, Linux
- DrawThings — macOS uniquement
En cloud :
- Groq — inférence LLM rapide
- Cloudflare Workers AI — modèles en edge
- Together AI — modèles open-source hébergés
- HuggingFace — hub et API d’inférence
Fonctionnalités
- Définir des agents avec prompts + entrées multimodales
- Exécuter le même agent sur plusieurs plateformes et modèles
- Orchestration via scripts Python ou Apache Airflow
Stack technique
Python comme bibliothèque centrale, Docker pour la reproductibilité, Hermes Agent et Strix Agent pour l’orchestration, OpenCode pour le développement assisté.
Où on en est
Développement actif. La bibliothèque sert pour mes projets personnels.
Ce que j’ai appris
L’inférence LLM locale demande une gestion sérieuse des ressources. La coordination multi-agent est nettement plus complexe qu’un agent unique.