Quelle éthique pour les systèmes de recommandation ?

Céline Béclard - Juriste

 

Comment Netflix et Amazon ont réussi en quelques années à s’imposer comme les leaders du marché en matière de films et séries et de vente en ligne? Comment ces deux géants se sont basés sur des algorithmes prédicteurs de nos goûts pour arriver à plaire à un plus grand nombre de personnes ? C’est en développant des recommandations personnalisées grâce aux algorithmes de recommandation qu’ils ont pu construire leur empire.

 

Mais que sont ces algorithmes prédicteurs de nos goûts ?

Il s’agit de systèmes de recommandation, définis comme étant: « une forme spécifique de filtrage de l’information visant à présenter les éléments d’information (films, musique, livres, news, images, pages Web, etc.) qui sont susceptibles d’intéresser l’utilisateur»[1]. Ces algorithmes de recommandation se basent sur des prédictions afin de proposer aux utilisateurs uniquement des éléments par lesquels ils pourraient être intéressés. Ces systèmes de recommandation font d’internet un lieu qui n’est plus neutre, mais un lieu qui est personnalisé en fonction des goûts et préférences de chacun. Les recommandations de contenu sont omniprésentes dans tous les grands secteurs d’activités numériques, comme par exemple  le e-commerce, la presse en ligne, les services de streaming vidéo et musical mais aussi les réseaux sociaux qui y ont aussi massivement recours.

On s’est d’ailleurs rendu compte à travers des recherches que des moteurs de recherche comme Google et Yahoo ne proposent pas aux utilisateurs un résultat identique pour la même recherche effectuée. Des réseaux sociaux comme par exemple « Facebook ou Twitter analysent les interactions entre un utilisateur et les autres usagers constituant son cercle d’amis ou non. Ces sites se concentrent sur les interactions sociales telles que les « likes », les « partages », les abonnements, etc. »[2].

D’autres sites de vente bien connus comme Amazon utilisent également l’algorithme de recommandation afin de proposer aux clients des articles qui pourraient les intéresser. Combien de fois après avoir passé une commande pour tel ou tel article, vous recevez des propositions d’achat pour d’autres articles similaires ou complémentaires. Un système de recommandation est un outil de business qui peut renforcer jusqu’à 30% les revenus d’une entreprise.

« Aujourd’hui, un utilisateur ne veut pas qu’on lui propose sur internet des produits qu’il a déjà achetés ou bien qui ne l’intéressent pas »[3]. C’est pour cette raison que les systèmes de recommandation cherchent en permanence à affiner leur compréhension du comportement de l’utilisateur afin de s’adapter au mieux à ses envies.

Comment ces système de prédiction fonctionnent-ils ?

Les algorithmes agissent en collectant une grande quantité d’informations. Pour atteindre leurs objectifs, les systèmes de recommandation ont besoin de procéder en trois étapes :[4]

La première étape est la collecte de données. Pour être capable de proposer aux utilisateurs des informations adéquates, les algorithmes ont besoin d’une grande quantité d’informations sur les personnes visées.

Cette collecte de données est ensuite divisée en trois étapes. La première qui est dite « explicite » suppose que les utilisateurs «  définissent et révèlent eux-mêmes leurs préférences au site internet ». Il est par exemple demandé à l’utilisateur de classer une collection d’objets en fonction de sa préférence. Il arrive aussi que ce soit le système qui propose deux choix à un utilisateur et lui demande de choisir le meilleur. Il peut également être demandé à un utilisateur de créer une liste d’articles qui l’intéressent. Cette personnalisation du système est basée sur des révélations volontaires de la part de l’utilisateur.

À la deuxième étape on trouve  la collecte « implicite d’information » (également appelée le filtrage passif), qui, elle, ne requiert pas une participation active de l’utilisateur. Le site internet va analyser lui-même le comportement ainsi que les habitudes des usagers pour générer les préférences de chaque utilisateur. « Pour récolter suffisamment d’informations, les sites internet utilisent des éléments tels que les cookies ou l’historique de navigation». Facebook utilise un filtrage collaboratif passif, « c’est-à-dire qu’il collecte « en arrière-plan » les informations et interactions des utilisateurs et en déduit leurs goûts et préférences »[5]. Sur un réseau social (Facebook, Twitter, Instagram, etc.), un ensemble d’algorithmes décident du contenu à afficher sur le fil d’actualité en fonction des diverses informations telles que les goûts ou les réactions de l’utilisateur, les derniers contenus consultés, etc.

Cette deuxième étape est la classification des données. Dans cette étape très importante, on construit un « modèle de données » qui consiste à mettre en relation les informations récoltées sur l’utilisateur avec les produits qui sont disponibles sur le site internet. Cette mise en commun permet d’obtenir les meilleures correspondances afin de répondre au mieux aux besoins ou envies de chaque utilisateur.

Finalement la dernière étape appelée « filtrage des informations ». C’est un filtrage qui peut être réalisé sur base de trois approches différentes. Il peut se faire par un filtrage « par le contenu » (content-based approach), c’est le filtrage le plus répandu. L’objectif de celui-ci est d’évaluer, du contenu nouveau en fonction de ce que l’utilisateur a déjà consommé et apprécié dans le passé. Ce système peut néanmoins présenter un désavantage non négligeable puisque les éléments subjectifs ne sont pas pris en compte.

Une autre manière de filtrer l’information est la méthode dite « collaborative » qui se base sur le contexte social en cherchant à lier le client à d’autres utilisateurs.[6] Cette méthode suppose que les utilisateurs qui présentent un profil similaire seront par intéressés par un type de produit semblable dans le futur. L’avantage principal de cette méthode est que le site internet n’a pas besoin de récolter énormément d’informations sur les objets.

Il faut néanmoins garder à l’esprit que cette méthode présente trois inconvénients majeurs.[7] Le premier est que cette forme de recommandation demande une grande puissance de calcul. Le second est que ces systèmes de recommandation nécessitent une quantité de données très importantes pour être capables de réaliser des prédictions suffisamment précises. Et enfin, il est également difficile de réaliser des recommandations lorsque le nombre d’objets présents sur le site est très important car même les produits les plus populaires ne disposent que d’un nombre d’opinions limité. Ce type de filtre est utilisé notamment par des sites internet les plus connus comme Amazon, Netflix ou encore Google.

Quel est l’objectif de ces algorithmes de recommandation ?

De nombreux grands secteurs d’activités se sont très vite saisis des opportunités offertes à eux suite à la collecte d’une immensité de données mises à leur disposition par les utilisateurs eux-mêmes.

Bien sûr les secteurs qui l’utilisent prônent une amélioration de l’expérience des utilisateurs qui se trouvent face à une telle masse d’informations qu’il leur est impossible de les traiter toutes. Même si les données générées en ligne ne font qu’accroître de façon exponentielle, notre capacité à les absorber n’a, quant à elle, pas changé.

Des recherches ont été effectuées par McKinsey et montrent que le phénomène de « big data »[8], bien que déjà énorme, est chaque jour de plus en plus important.

Ces algorithmes sont devenus indispensables au traitement du flux grandissant de données dont les plateformes disposent. A l’heure où chaque recherche dans un moteur de recherche peut donner lieu à plusieurs milliards de résultats, il semble impossible de se passer d’un algorithme capable d’analyser et de classer les résultats en fonction de leur pertinence mais aussi de l’intérêt qu’il représente pour l’utilisateur.

Malgré l’évolution extrêmement rapide du monde, nos capacités mentales quant à elles ne s’adaptent pas assez rapidement pour pouvoir suivre celle-ci. Nous possédons, en tant qu’êtres humains, « une rationalité limitée ». C’est un concept qui a été développé par Herbert Simon et qui met en évidence « le fait que les acteurs économiques ne peuvent traiter qu’une quantité d’informations très limitée face à l’immensité des informations disponibles et ne disposent que de capacités cognitives limitées ne leur permettant pas d’optimiser leurs choix ».

Les êtres humains peuvent bénéficier d’outils extérieurs pour les aider à prendre des décisions. Ces algorithmes de recommandation permettent aux utilisateurs de gagner du temps pour trouver les informations qu’ils estiment pertinentes. Si l’objectif est de faciliter la vie des usagers, ce n’est pas l’unique avantage pour les plateformes qui, grâce à leurs algorithmes, peuvent non seulement répondre aux besoins de leurs utilisateurs mais parfois même les anticiper. Les sites de vente en ligne utilisent également énormément ces algorithmes car ils leur permettent de proposer rapidement de nouveaux produits aux utilisateurs et ainsi de déclencher des ventes supplémentaires.

Quels sont les risques ?

Un des risques liés à l’utilisation de ces algorithmes consisterait simplement à ne proposer aucune recommandation d’actualité à l’utilisateur. Le risque est donc que ces algorithmes ne limitent l’accès à l’information des utilisateurs.

Un autre désavantage du système de recommandation est que le filtrage par utilisateur est sensible au Shilling Attack, phénomène qui peut permettre à certaines personnes mal intentionnées de détourner le système et de faire en sorte que certains produits soient plus recommandés que d’autres, et ce, à leur avantage.[9]

Une étude américaine a prouvé également que les algorithmes de recommandation peuvent réussir à modifier l’émotion des personnes. Un test a été réalisé sur un groupe de personnes qu’on a divisé en deux parties. Aux premiers que l’on appelle « groupe de contrôle », un contenu classique a été proposé, quant au second groupe, on lui a proposé un contenu considéré comme étant plus triste. Après quelques temps, on constate que les personnes du second groupe sont plus susceptibles de poster des publications tristes que ceux du premier groupe.[10]

D’autres problèmes associés à ce type d’implémentation peuvent également apparaître comme par exemple les changements de préférence des utilisateurs qui peuvent générer de nombreuses suggestions inappropriées. Il a également été remarqué que plus le nombre d’utilisateurs augmente, plus il sera difficile de générer des recommandations.

Conclusion

Si les algorithmes de recommandation peuvent être vus comme intéressants en ce qu’ils sont utiles pour traiter l’information en la rendant plus effective pour le consommateur, ces types algorithmes sont surtout utilisés pour rendre plus productive la vente de produits dans le marketing ciblé, en utilisant notamment les réseaux sociaux.

On s’inquiète peu aujourd’hui des dangers engendrés par ces algorithmes. Cependant, il ne faut pas perdre de vue que les algorithmes de recommandation se permettent de prendre les décisions de choix eux-mêmes, ne vous laissant plus aucune autonomie de décision. Lorsqu’il s’agit de choisir un film ou une série, ça ne semble pas être problématique, mais lorsque ces mêmes algorithmes vous enferment dans une bulle ne vous proposant plus qu’un certain type de contenu, ils vous limitent l’accès l’information.

Cela devient réellement problématique lorsque l’algorithme ne nous laisse plus le choix et décide pour nous ce que nous devons lire ou penser comme cela peut être le cas avec les articles de presse en ligne.

Les algorithmes nous analysent et tentent – et réussissent parfois – de nous pousser à la consommation, ce qui pose bien évidemment des questions éthiques notamment quant au respect de notre vie privée : ils savent presque tout de nous, choisissent ce qu’on regarde, ce qu’on lit, ce qu’on achète et peuvent même décider qui seront nos amis (Facebook).

  1. Système de recommandation. (s. d.). Dans Wikipédia, l’encyclopédie libre ? Repéré le 27/10/20 à https://fr.wikipedia.org/wiki/Syst%C3%A8me_de_recommandation
  2. B. UPBIN, (2011). Facebook Ushers In Era Of New Social Gestures. Forbes, disponible sur : https://www.forbes.com/sites/bruceupbin/2011/09/22/facebook-ushers-in-era-of-new-social- gestures/#2219d174263d
  3. Disponible sur : https://blog.invivoo.com/systeme-de-recommandation/ (consulté le 9 novembre 2020) ; J. LESKOVEC, A. RAJARAMAN, J.D. ULLMAN, « Mining of massive Datasets », disponible sur :http://infolab.stanford.edu/~ullman/mmds/book.pdf (consulté le 9 novembre 2020).
  4. Mathieu,. (2012, 25 avril). Les algorithmes de recommandation [Billet de blogue]. Disponible sur : http://www.podcastscience.fm/dossiers/2012/04/25/les-algorithmes-de-recommandation/
  5. Disponible sur : https://www.csa.fr/Informer/Toutes-les-actualites/Actualites/Terminologies-autour-des-algorithmes-de-recommandation-des-plateformes-de-contenus-numeriques (consulté le 10 novembre 2020).
  6. N. BECHET, (2016).Etat de l’art sur les Systèmes de Recommandation. Disponible sur : http://people.irisa.fr/Nicolas.Bechet/Publications/EtatArt.pdf
  7. MATHIEU,. (2012, 25 avril). Les algorithmes de recommandation [Billet de blogue]. Disponible sur : http://www.podcastscience.fm/dossiers/2012/04/25/les-algorithmes-de-recommandation/
  8. « Le Big Data fait référence à l’explosion du volume des données dans l’entreprise et des nouveaux moyens technologiques proposés par les éditeurs, en particulier de la Business Intelligence, pour y répondre » (JDN, 2016). Il a été inventé pour être capable de traiter des bases de données gigantesques. B. BROWN, J. BUGHIN, A.H. BYERS, M. CHUI, R. DOBBS, J. MANYIKA, & C. ROXBURGH, (2011). Big data: The next frontier for innovation, competition, and productivity. Repéré à http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the- next-frontier-for-innovation
  9. Disponible sur : https://medium.com/@Arcbees/introduction-aux-systèmes-de-recommandation-d2f98d3e4160 (consulté le 7 novembre 2020).
  10. Disponible sur : https://www.forbes.fr/technologie/les-algorithmes-de-recommandations-mettent-en-danger-votre-liberte/ (consulté le 10 novembre 2020).