Motivations, défis et fonctionnement du stockage distribué: le cas de l'InterPlanetary File System

Défense de mémoire de Monsieur Pierre-Yves Crutzen

Catégorie : mémoire
Date : 29/08/2022 12:30 - 29/08/2022 14:30
Lieu : Salle académique - Faculté d'informatique
Orateur(s) : P.-Y. Crutzen
Organisateur(s) : Benjamine Lurquin



L'InterPlanetary File System (IPFS) est un protocole d'échange de données pair-à-pair proposant un système de stockage de fichiers distribué. Il permet de stocker des données réparties au sein d'un réseau de nœuds pairs formant un système web décentralisé et il prend en charge le contenu de type hypermédia pour créer un réseau distribué semblable au World-Wide-Web; il peut se substituer aux protocoles de distribution de contenus de type hypermédia basés sur la localisation tels http et https. Les données échangées et réparties sur les réseau sont identifiées de manière unique grâce au système d'adressage de contenu IPNS, car les adresses correspondent à des hachages cryptographiques calculés à partir des données diffusées à l'aide du protocole. Ce mémoire de fin d’études a pour objectif de mener à comprendre pourquoi et comment mettre en œuvre une solution de stockage décentralisé avec l’InterPlanetary File System. Les types d’infrastructures du web, les systèmes pair-à-pair, les systèmes de fichiers décentralisés, ainsi que le protocole IPFS sont mis en relation dans un contexte de décentralisation du stockage des données du web. Pour ce faire, le protocole IPFS et son système de fichiers sont étudiés en profondeur afin de comprendre leur fonctionnement, leur contexte d’utilisation et ce qui les différencie des autres systèmes afin de fournir une solution interopérable pour l’hébergement et le partage de données en pair-à-pair. Les moyens que la littérature scientifique présente afin d’y arriver sont étudiés dans un état de l’art. Les critères et les défis que soulèvent les systèmes de stockage de fichiers et les solutions de communication pair-à-pair sont mis en perspective afin de comprendre la relation qu’ils peuvent avoir pour mener le web vers une distribution complète des infrastructures grâce aux réseaux pair-à-pair. Une étude de cas d’application du protocole IPFS pour le stockage décentralisé et le partage de contenu sur le Web, ainsi que la mesure de ses performances pour l’échange de données sont étudiés. Les manières dont cela peut être mis en œuvre, en perspective des contraintes d’application liées au contexte du web distribué, sont ensuite soulignées. Enfin, les résultats de la recherche sont discutés et permettent d’aboutir à une conclusion, ainsi qu’à une proposition d’arbre de décision permettant de comprendre dans quel cas l’InterPlanertary File System peut être pertinemment utilisé comme système de stockage dans une infrastructure web décentralisée.


The InterPlanetary File System (IPFS) is a peer-to-peer data exchange protocol providing a distributed file storage system. It allows distributed data storage within a network of peer nodes forming a decentralized web system and supports hypermedia content to create a distributed network similar to the World-Wide-Web; it can replace location-based hypermedia content distribution protocols such as http and https. The data exchanged and distributed over the networks is uniquely identified by the IPNS content addressing system, as the addresses correspond to cryptographic hashes computed from the data distributed using the protocol. The objective of this Master Thesis is to understand why and how to implement a decentralized storage solution with the InterPlanetary File System. The types of web infrastructure, peer-to-peer systems, decentralized file systems, and the IPFS protocol are related in a context of decentralized web data storage. To do so, the IPFS protocol and its file system are studied in depth to understand how they work, their context of use and what differentiates them from other systems in order to provide an interoperable solution for peer-to-peer data hosting and sharing. The ways in which this can be achieved in the scientific literature are examined in a state of the art. The criteria and challenges of file storage systems and peer-to-peer communication solutions are put into perspective in order to understand the relationship between them in leading the web towards a complete distribution of infrastructures through peer-to-peer networks. A case study of the application of the IPFS protocol for decentralized storage and content sharing on the web, as well as the measurement of its performance for data exchange, is studied. The ways in which this can be implemented, in perspective of the application constraints related to the distributed web context, are then outlined. Finally, the results of the research are discussed and lead to a conclusion, as well as a proposed decision tree to understand when the InterPlanertary File System can be appropriately used as a storage system in a decentralized web infrastructure.


