Suite aux événements dramatiques qui ont touché la France (attentat à paris du 13/11/2015), je me suis demandée si la data pouvait aider la lutte contre le terrorisme. Comme vous vous en doutez, la réponse ne peut être que oui.
ATTENTION, CECI EST UN TRAVAIL THÉORIQUE, je n’ai bien sur pas accès aux données permettant de valider l’efficacité de cette réflexion.
> La détection du passage à l’acte
On connait tous l’existence du fichier S. La problématique est que ce fichier de potentiel terroriste augmente très rapidement et que les moyens de surveillance ne peuvent pas suivre. Il faut donc arriver à orienter la surveillance. La data peut aider à ce niveau en tentant de calculer la probabilité pour une personne dans cette liste de passer à l’acte.
Cette détection se fera en fonction de ce que l’on appelle des signaux faibles (contacts avec des organisations terroristes, navigation sur certains sites, location de matériel, …) ou des absences de signaux (arrêt de contact, absence de navigation internet, …).
Les méthodes de machine learning sont un moyen d’arriver à établir ces signaux faibles et ainsi de calculer cette probabilité du passage à l’acte.
Au vu de la communication dans les médias sur les profils des terroristes, on peut estimer que le travail autour de la création de dataset (échantillon de données) va être très important : plusieurs populations peuvent être constituer (selon le casier judiciaire, selon le niveau de contacts avec des organisations terroriste, …)
Le programme gouvernemental américain PRISM est une illustration de ce que les data peuvent permettre d’éviter. Voici le résumé d’un article présentant quelques résultats de ce programme mais aussi les risques de dérive d’un tel programme.
http://business-analytics-info.fr/archives/4815/actualite-les-big-data-et-la-lutte-antiterrorisme/
A l’instar du marketing où on tente de recréer la qualité de service d’un petit commerçant local proche de ses clients, on cherche ici à automatiser le savoir-faire des enquêteurs afin de leur faire gagner du temps pour qu’ils se consacrent à des cibles plus à risque. L’objectif serait ici d’optimiser les ressources.
> La détection des lieux à risque
Comment sont choisis les lieux des attentats ? Peut-on estimer les risques d’attentat pour un pays/lieu donné ?
En théorie, une étude sur la géolocalisation/géopolitique peut nous permettre d’orienter les efforts sur des lieux en particulier.
Cependant, les lieux attaqués ce 13 novembre dernier : des terrasses de restaurant semblent indiquer que ce genre d’étude serait décevantes et risque d’être contre-productives.
> La problématique principale : la collecte des données
Pour faire tout cela, la problématique principale est celle de la collecte des données. En effet, pour mettre en oeuvre ce genre d’études nous avons besoin de données de types et de sources diverses :
- communications téléphoniques
- navigations internet
- activités sur les réseaux sociaux
- dépenses
- déplacements
- consommation télévisuelle
Plus on arrivera à collecter de la donnée sur l’ensemble de l’activité des personnes, plus on pourra calculer avec « précision » leur probabilité à passer à l’acte.
Tout ceci pose la question du respect de la vie privée. Le « big brother » fait peur et surtout les risques de dérive.
Voici un article qui résume les principales interrogations sur le programme de lutte anti-terrorisme américain PRISM :
http://www.itespresso.fr/prism-big-brother-data-service-lutte-antiterrorisme-etats-unis-65371.html
> L’union, une stratégie gagnante
Comme dans toutes luttes, l’union fait la force. La lutte du terrorisme grâce à la data ne déroge pas à cette règle. La collecte des données est un point essentiel. Le travail commun des différents pays est un point, qui me semble, crucial afin de collecter au mieux la donnée.
Voici un article sur les différentes mesures récemment prise par l’union européenne qui sont en contradiction avec cet objectif : http://blogs.lexpress.fr/noellelenoir/2015/11/15/le-big-data-au-service-de-la-lutte-contre-le-terrorisme/
J’espère que cet article vous aura éclairé sur le travail possible grâce aux données.
PRAY FOR PARIS