En plus des modèles de langage d’IA commerciaux que nous avons à notre disposition (ChatGPT, Gemini, Claude, etc.), il existe un vaste éventail de modèles de langage open source qui peuvent servir à de nombreuses applications, tant au niveau domestique qu’entreprise. J’ai passé pas mal de temps à expérimenter avec des LLMs en local et, honnêtement, avoir un système fonctionnant sans connexion Internet est sacrément utile.
Installer un LLM en local sur notre téléphone mobile est plus simple qu’il n’y paraît. Aujourd’hui, nous pouvons trouver des outils faciles à utiliser, avec une interface conviviale pour tout utilisateur. De plus, il n’est pas nécessaire d’avoir un smartphone avec des spécifications techniques élevées pour faire fonctionner un modèle petit. Dans cet article, je vous explique comment procéder et l’intérêt d’avoir une IA en local sur votre mobile.
Qu’est-ce que PocketPal et pourquoi une IA en local ?
Une des applications qui facilite cela s’appelle PocketPal AI. Le meilleur dans tout ça, c’est qu’installer et configurer cette app ne nécessite pas de connaissances techniques. L’application est gratuite et disponible pour iOS et Android. Elle permet d’installer des modèles d’intelligence artificielle directement sur le téléphone, et ainsi l’utilisateur peut les utiliser sans connexion Internet, avec une totale confidentialité, sans que ses conversations arrivent sur des serveurs externes.
Le principal atout de cette solution repose sur l’utilisation de versions réduites de certains modèles de langage connus. Ces petits modèles sont conçus pour s’exécuter directement sur le CPU ou la GPU d’un appareil de consommation. Certes, ils n’ont pas la même capacité de raisonnement que les modèles avancés d’OpenAI ou d’Anthropic, mais ils restent suffisamment performants pour un large éventail de tâches quotidiennes : résumer des textes, répondre à des questions, traduire, aider à la rédaction, générer du code simple ou simplement avoir une conversation.


Cette solution est utile dans de nombreuses situations. Imaginez que vous êtes dans le métro sans couverture, en voyage à l’étranger sans données, ou dans une zone rurale. Avec une IA installée localement sur votre mobile, vous avez toujours à disposition une sorte d’encyclopédie intelligente : un interlocuteur pour consulter, réfléchir à voix haute ou résoudre des questions en temps réel. De plus, la confidentialité est garantie : tout le traitement se fait sur l’appareil. Les conversations et les données ne quittent jamais le téléphone.
Quels équipements pour utiliser PocketPal ?
Avant de télécharger l’application, il est conseillé de vérifier si votre appareil répond aux exigences nécessaires. Exécuter un modèle d’IA en local nécessite que le dispositif ait certaines spécifications techniques, bien qu’il ne soit pas nécessaire d’avoir des appareils haut de gamme. Personnelement, j’utilise PocketPal sur un OnePlus Nord 2 modeste mais tout à fait capable.
Les modèles d’intelligence artificielle sont assez lourds, donc vous aurez besoin d’un certain espace de stockage libre, et le traitement local demande des performances matérielles adéquates. Avec une quantité de RAM suffisante et une CPU correcte, vous êtes sur la bonne voie.

Les exigences varient selon le modèle que vous souhaitez installer, mais comme directive générale :
- RAM : Au moins 6 Go pour des modèles petits (1-3B paramètres). Pour des modèles moyens de 7B paramètres, il est conseillé d’avoir au moins 8 Go.
- Stockage libre : Entre 2 et 5 Go pour les modèles les plus légers. Un modèle PocketPal AI occupe généralement entre 1 et 4 Go par installation.
- Processeur : Toute gamme moyenne-haute des quatre ou cinq dernières années est fonctionnelle. Pour des modèles plus exigeants, il vaut mieux un processeur puissant.
- Système d’exploitation : Pour PocketPal, Android 7.0 (Nougat) ou supérieur est requis, et elle est également disponible à partir de iOS 15.1.
La bonne nouvelle, c’est que des modèles plus légers, comme Qwen2.5-1.5B, fonctionnent même sur des appareils modestes. L’équipe de PocketPal recommande même cela comme point de départ. Une fois, j’ai installé Qwen3-4B et cela fonctionne bien sur un téléphone de milieu de gamme d’il y a 5 ans.
Comment installer PocketPal étape par étape
Pour faire fonctionner PocketPal correctement sur votre mobile, vous n’avez pas besoin de faire grand-chose. Voici comment procéder :
1. Téléchargez l’application
PocketPal AI est disponible sur le Play Store d’Android et l’App Store d’Apple. Liens pour Android et pour iOS.
2. Téléchargez un modèle d’IA
Une fois dans l’application, elle vous demandera de télécharger un modèle pour commencer. Dans la section ‘Models’, vous verrez une liste des modèles disponibles. Vous ne trouverez pas de noms comme Gemini ou GPT, mais des versions open source comme Gemma (la version ouverte de Gemini de Google), Llama (le modèle de Meta), Phi (le modèle ouvert de Microsoft), et Qwen (d’Alibaba).


Si vous êtes novice et souhaitez essayer, l’un des modèles recommandés et légers est Qwen2.5-1.5B. Il donne de bons résultats pour des requêtes simples et est assez rapide si le matériel de votre téléphone est adéquat. Si votre mobile a plus de 6 Go de RAM et suffisamment d’espace libre, vous pouvez essayer des modèles de 3B-4B paramètres comme Llama 3.2 3B, qui offre des réponses plus élaborées.
De plus, vous avez accès à tout le dépôt de Hugging Face pour expérimenter en appuyant sur le bouton en bas à droite. Vous pouvez installer directement depuis Hugging Face n’importe quel modèle, par exemple Qwen3-4B-Instruct, que j’ai installé sur mon Nord 2, ou essayer d’autres modèles de DeepSeek ou Mistral. Tout se fait depuis l’application, sans quitter l’interface.
Important : le téléchargement du modèle nécessite une connexion Internet. Une fois cette étape effectuée, tout fonctionnera en local.

3. Chargez le modèle et commencez à discuter
Une fois téléchargé, appuyez sur le modèle pour le charger en mémoire. Ensuite, rendez-vous dans la section Chat, écrivez votre message et l’IA répondra en le traitant entièrement sur votre téléphone. Vous pouvez le vérifier en désactivant le Wi-Fi et les données.
Quelles performances attendre ?
Il est important d’être réaliste. Une IA locale sur mobile n’atteint pas le niveau de ChatGPT. Les réponses arriveront plus lentement et le téléphone peut chauffer davantage que d’habitude en raison de l’utilisation intensive du processeur. Les modèles génèrent entre 5 et 20 tokens par seconde sur des appareils haut de gamme, suffisant pour maintenir une conversation fluide, mais loin de la vitesse d’un serveur avec GPU.


Pour améliorer les performances sur iPhone, il existe une option d’activation de Metal, l’API d’accélération matérielle d’Apple, avec un paramètre “Layers on GPU” à augmenter jusqu’à environ 80. Cela permet à iOS de transférer une partie du traitement du CPU vers la GPU de l’appareil, accélérant ainsi de manière significative la génération de texte. Sur certains appareils récents, activer également l’option ‘Flash Attention’ peut apporter un gain supplémentaire.
Concernant le format des fichiers, le point optimal pour les smartphones est d’utiliser des modèles au format .gguf d’environ 4 Go. Au-delà de cette taille, la vitesse de traitement peut significativement ralentir.

PocketPal n’est pas la seule option
PocketPal est probablement l’application la plus accessible pour les débutants, mais d’autres alternatives existent. Sur Android, MNN Chat se distingue avec un support multimodal. Pour les utilisateurs d’iPhone, Private LLM est également disponible, bien qu’il soit payant et propose des modèles optimisés utilisant des techniques de quantification pour mieux fonctionner sur des appareils plus modestes.
Si vous souhaitez faire la même chose sur un ordinateur, deux options se démarquent : Ollama et LM Studio. Ces deux applications permettent très facilement d’avoir une IA en local sur votre PC. LM Studio possède une interface visuelle très conviviale tandis qu’Ollama est plus technique mais offre plus de flexibilité. Les deux sont gratuits et permettent d’exécuter des modèles jusqu’à 13B paramètres ou plus en fonction du matériel de votre machine.

Est-ce que ça vaut la peine, avec quelques nuances ?
Une IA locale sur mobile ne remplace pas les grands assistants connus, du moins pour l’instant. Pour des tâches complexes, des documents longs ou des raisonnements sophistiqués, les versions serveur restent supérieures. Cependant, pour un usage quotidien (répondre à une question, résumer un paragraphe, chercher des idées, traduiser rapidement ou simplement avoir une conversation), les petits modèles offrent un service plus que satisfaisant. Cela dit, soyez prêts à des incohérences.
En conclusion, avoir une IA localement sur votre appareil peut être un complément utile à votre quotidien numérique.

