Le problème

Je voulais des workflows d’agents IA pour traiter des médias en batch — images, audio, vidéo, texte — en pouvant comparer les résultats entre différents modèles et plateformes d’inférence. Il n’existait pas de bibliothèque simple pour ça, alors j’en ai fait une.

Polymage

C’est une bibliothèque Python modulaire et agnostique aux plateformes. Elle permet de définir des agents avec des prompts et des entrées multimodales, puis de les exécuter sur plusieurs backends pour comparer les résultats.

Plateformes supportées

En local :

  • Ollama — macOS, Windows, Linux
  • LM Studio — macOS, Windows, Linux
  • DrawThings — macOS uniquement

En cloud :

  • Groq — inférence LLM rapide
  • Cloudflare Workers AI — modèles en edge
  • Together AI — modèles open-source hébergés
  • HuggingFace — hub et API d’inférence

Fonctionnalités

  • Définir des agents avec prompts + entrées multimodales
  • Exécuter le même agent sur plusieurs plateformes et modèles
  • Orchestration via scripts Python ou Apache Airflow

Stack technique

Python comme bibliothèque centrale, Docker pour la reproductibilité, Hermes Agent et Strix Agent pour l’orchestration, OpenCode pour le développement assisté.

Où on en est

Développement actif. La bibliothèque sert pour mes projets personnels.

Ce que j’ai appris

L’inférence LLM locale demande une gestion sérieuse des ressources. La coordination multi-agent est nettement plus complexe qu’un agent unique.