Un assistant de code IA pour les administrations publiques?

En combinant :

  • Visual Studio / IntelliJ IDEA + Continue.dev pour une assistance fluide dans l’IDE,
  • Qwen Coder pour un code‑LLM performant, open source et auto‑hébergé,
  • Ollama pour la gestion locale de modèles,
  • des infrastructures dimensionnées selon vos besoins,

…vous obtenez une solution robuste, conforme aux exigences de confidentialité et sécurité des administrations publiques.

Eh oui. Le problème avec Cursor et Windsurf c’est que, malgré leur intérêt indéniable, il vont transmettre vos données à des modèles comme Claude ou Gemini ce qui n’est pas conforme aux exigences et administrations publiques.

Les fonctionnalités qui sont offertes multiples :

  • Chat avec un agent IA
  • Autocomplétion intelligente
  • Refactoring et migration de code
  • Documentation du code source
  • Ecriture des tests unitaires, etc

Je vous propose donc ici une solution auto-hébergée (on premise). Attention, cette solution peut sembler coûteuse du fait du dimensionnement nécessaire à l’hébergement du modèle orienté code.

Pourquoi Qwen Coder est intéressant ?

  • Open source : le modèle 32 B d’instructeur atteint des performances comparables à GPT‑4o pour génération, refactoring et raisonnement de code.

  • Multilingue : sur plus de 40 langages de programmation, excellente maîtrise de langages complexes (Haskell, Racket…)

  • Licence permissive Apache 2.0, adaptée aux besoins des administrations.

Installation sur serveur local possible via Ollama.

Exemple :

ollama install qwen2.5-coder:7b
ollama run qwen2.5-coder:7b

plus votre modèle aura de paramètres et plus il sera pertinent dans ses résultats.

Recommandations :

  • GPU recommandé (NVIDIA A100, Tesla, RTX, etc).
  • Déploiement en bare metal ou VM privée pour garantir la confidentialité.

Plugins IDE

Il existe plusieurs plugins dont celui pour intellij IDEA https://plugins.jetbrains.com/plugin/22707-continue

Le problème

Le prix.
Une serveur pouvant héberger ce type de modèle pour une dizaine de développeurs nécessite beaucoup de RAM et un carte graphique puissante (compter 500 euros minimum).

Conclusion

A mon avis, le gain en termes de productivité compense largement le coût de mise en place.
Je serais curieux de savoir ce que vous utilisez dans le cadre de vos projets et si ce type de solution serait envisageable dans votre équipe ?