Récemment, le Bureau du Directeur du Renseignement National (ODNI) a dévoilé une nouvelle stratégie pour le renseignement de source ouverte (OSINT) et a qualifié l’OSINT de « renseignement de premier recours ». Les organisations des secteurs public et privé se rendent compte de la valeur que cette discipline peut apporter, mais constatent également que la croissance exponentielle des données numériques ces dernières années a submergé de nombreuses méthodes OSINT traditionnelles. Heureusement, l’intelligence artificielle (IA) et l’apprentissage automatique (ML) commencent à avoir un impact transformateur sur l’avenir de la collecte et de l’analyse des informations.
Qu’est-ce que le renseignement open source (OSINT) ?
Le renseignement en open source désigne la collecte et l’analyse d’informations provenant de sources accessibles au public. Ces sources peuvent inclure les médias traditionnels, les plateformes de médias sociaux, les publications universitaires, les rapports gouvernementaux et toute autre donnée ouvertement accessible. La principale caractéristique de l’OSINT est qu’elle n’implique pas de méthodes secrètes ou clandestines de collecte d’informations telles que le renseignement humain ou l’ingénierie sociale. Si j’avais pu obtenir des données pendant que je travaillais pour le gouvernement américain mais que je ne le peux plus en tant que civil, ce n’est pas de l’OSINT.
Historiquement, l’OSINT a été un processus à forte intensité de main-d’œuvre impliquant plusieurs étapes clés :
- Identification des sources : Les analystes déterminent quelles sources publiques sont susceptibles de contenir des informations pertinentes.
- Collecte de données: Les informations sont collectées à partir de ces sources, souvent au moyen de recherches manuelles ou d’outils de scraping Web.
- Traitement de l’information: Les informations collectées sont organisées et structurées pour être analysées.
- Analyse: Des analystes qualifiés examinent les données pour identifier des modèles, des tendances et des informations.
- Rapports : Les résultats sont compilés dans des rapports destinés aux décideurs afin de leur permettre de prendre des décisions plus éclairées.
Bien qu’efficace, cette approche se heurte à des limites en raison du volume considérable d’informations disponibles. Les analystes humains ont du mal à tout traiter manuellement et des informations précieuses peuvent être cachées dans des schémas complexes difficiles à détecter par les humains. C’est là que l’IA/ML peut apporter un avantage considérable dans la manière dont les informations peuvent être collectées, traitées et analysées, libérant ainsi l’analyste humain pour se concentrer sur des tâches pour lesquelles il est particulièrement qualifié, comme fournir un contexte. En outre, ce changement a souvent pour avantage d’améliorer le moral des employés, car les humains passent moins de temps sur des tâches de traitement banales et plus de temps à analyser et à examiner les informations.
Les tâches pour lesquelles l’IA/ML peut apporter un bénéfice immédiat incluent :
- Gestion de volumes de données massifs : Les systèmes d’IA peuvent traiter et analyser d’énormes quantités de données à des vitesses bien supérieures à celles des humains. Cela permet aux praticiens de l’OSINT d’élargir leur champ d’action à un plus grand nombre de personnes, tout en gérant les résultats.
- Analyse en temps réel : Le volume des flux d’informations dans le monde numérique d’aujourd’hui est stupéfiant. Les outils OSINT basés sur l’IA peuvent surveiller et analyser les flux de données en temps réel, fournissant des renseignements à la minute près et permettant une réponse rapide aux situations émergentes.
- Analyse multilingue et multimodale : L’IA peut faire tomber les barrières linguistiques en traduisant et en analysant simultanément des contenus dans plusieurs langues. De plus, elle peut traiter différents types de données (texte, images, audio et vidéo) de manière intégrée, offrant ainsi une image plus complète des renseignements. Bon nombre de ces fonctionnalités, comme Whisper d’OpenAI, peuvent être utilisées hors ligne, éliminant ainsi toute inquiétude concernant la sécurité opérationnelle (OPSEC).
- Analyses prédictives: En analysant les données historiques et les tendances actuelles, l’IA peut aider à prédire les événements ou les comportements futurs, ajoutant une dimension proactive à l’OSINT.
- Automatisation des tâches de routine : L’IA peut aider à automatiser de nombreux aspects chronophages de l’OSINT, tels que la collecte de données et le filtrage initial, ce qui permet aux analystes humains de se concentrer sur des analyses et des prises de décision de niveau supérieur. Des choses qui étaient auparavant très difficiles, voire impossibles à mettre en œuvre, comme l’analyse précise des sentiments, sont désormais triviales.
À Sécurité du réseau SANS le SEC497 OSINT pratique cours et le SEC587 OSINT avancé Le cours offrira aux étudiants une expérience pratique de l’utilisation de ces capacités d’IA pour non seulement augmenter la productivité, mais également découvrir de nouvelles possibilités.
Bien qu’aucune technologie ne soit parfaite et que nous devions prendre en compte les ramifications potentielles qu’une hallucination pourrait entraîner avant de mettre en œuvre l’IA, les éléments clés de la technologie actuellement utilisés pour l’OSINT comprennent :
- Traitement du langage naturel (TAL) : Le traitement du langage naturel permet aux machines de comprendre, d’interpréter et de générer le langage humain. Dans le domaine de l’OSINT, le traitement du langage naturel est essentiel pour :
- Analyse des sentiments des publications sur les réseaux sociaux
- Reconnaissance d’entités pour identifier des personnes, des organisations et des lieux dans un texte
- Modélisation de sujets pour catégoriser de grands volumes de données textuelles
- Traduction automatique pour la collecte de renseignements multilingues
- Vision par ordinateur: Cette technologie permet aux machines d’interpréter et d’analyser des informations visuelles. Dans le domaine de l’OSINT, la vision par ordinateur est utilisée pour :
- Reconnaissance faciale dans les images et les vidéos
- Comparaisons faciales pour identifier si la même personne apparaît sur plusieurs images
- Détection d’objets dans l’imagerie
- Reconnaissance optique de caractères (OCR) pour extraire du texte à partir d’images
- Compréhension de la scène dans les séquences vidéo
- Apprentissage automatique et exploration de données : Combien de fois avez-vous entendu dire que « ceux qui ne connaissent pas l’histoire sont condamnés à la répéter » ? L’apprentissage automatique est la personnification de ce concept car il permet aux systèmes d’apprendre à partir des données et d’améliorer leurs performances au fil du temps. Dans OSINT, ils sont utilisés pour :
- Analyse prédictive pour prévoir les tendances ou les événements
- Détection d’anomalies pour identifier des modèles ou des comportements inhabituels
- Regroupement et classification des données pour une analyse plus facile
- Analyse de réseau pour comprendre les relations entre les entités
Je fais de l’OSINT depuis près de deux décennies et c’est de loin la période la plus dynamique et la plus passionnante que j’ai vue, avec de nouveaux développements dans ce domaine qui se produisent littéralement quotidiennement. Si vous allez être à Sécurité Internet À Las Vegas en septembre prochain, j’ai hâte de discuter de la manière dont cette capacité peut améliorer notre efficacité et notre efficience aujourd’hui, ainsi que de ce à quoi nous pouvons nous attendre à l’avenir.
Vous n’êtes pas encore inscrit à SANS Network Security ? Consultez cette page pour voir tout ce qui nous attend !
Note: Cet article est rédigé de manière experte par Matt Edmondsoninstructeur principal du SANS et directeur des laboratoires Argelius, avec une décennie d’expérience professionnelle OSINT.