Qu'est-ce que FHEML

Avancé4/2/2024, 3:19:26 PM
Exploration de l'apprentissage automatique basé sur le chiffrement entièrement homomorphique (EML), une technologie révolutionnaire qui permet des calculs sur des données chiffrées, garantissant la confidentialité et la sécurité des données. Découvrez les principaux cas d'utilisation de l'EML, y compris le calcul externalisé, l'inférence chiffrée et les informations sur la formation chiffrée, ainsi que les principaux cadres et bibliothèques prenant en charge le développement de l'EML.

Un peu sur EML d'abord

Le chiffrement entièrement homomorphe (FHE) représente une classe de techniques de chiffrement conçues pour permettre des calculs significatifs à partir de données chiffrées. Cela signifie que lorsque les résultats de ces calculs sont déchiffrés, ils sont cohérents avec les résultats qui auraient été obtenus si ces calculs avaient été effectués sur les données en clair.

En bref

fenc est une fonction de chiffrement homomorphe

La propriété homomorphique préserve le calcul dans l'espace chiffré

Dans la catégorie plus large de l'EML, nous voyons généralement la catégorisation des schémas EML en deux ou trois types de schémas EML qui sont

  • Chiffrement Somewhat Homomorphique (SHE) : prend en charge un nombre limité d'opérations d'addition et de multiplication sur les textes chiffrés.
  • Cryptage pleinement homomorphe (FHE) : prend en charge tout nombre d'opérations de multiplication et/ou d'addition sur le texte chiffré sans compromettre son intégrité lors du déchiffrement.
  • Cryptage homomorphe partiel (HE partiel) : prend en charge soit l'addition, soit la multiplication sur le texte chiffré, mais pas les deux à la fois.

Tentatives antérieures en ML avec FHE

L'exploration de l'apprentissage automatique (ML) avec le chiffrement pleinement homomorphique (FHE) contribue directement à la préservation de la vie privée en permettant que les calculs soient effectués sur des données chiffrées.

Cette région a vu plusieurs contributions notables, telles que celle de Lauter (2021) sur l'intégration du cryptage homomorphique avec l'IA pour la formation privée et les prédictions, mettant en lumière le mariage de la cryptographie et de l'apprentissage automatique pour protéger la confidentialité des données tout en exploitant la puissance de l'IA.

De plus, les travaux sur les réseaux neuronaux profonds préservant la confidentialité en utilisant FHE, tels qu'expliqués dans une étude portant sur un modèle hybride de FHE et de calcul multipartite (MPC) pour évaluer les fonctions non arithmétiques dans les modèles ML, repoussent les limites de la confidentialité des données et des modèles pendant les calculs.

L'œuvre fondatrice de Graepel, Lauter et Naehrig (2012) papierSur ML Confidential présente l'application du chiffrement quelque peu homomorphe pour déléguer les calculs de ML aux services de calcul de manière sécurisée, ce qui permet des algorithmes de ML confidentiels garantissant la confidentialité des données. De plus, la recherche sur les algorithmes de régression logistique et d'apprentissage non supervisé sur des données chiffrées illustre l'application pratique et l'adaptation des méthodes traditionnelles de ML pour fonctionner dans des contraintes de chiffrement, démontrant la faisabilité et l'efficacité de telles approches dans la préservation de la confidentialité des données. Ces travaux soulignent collectivement l'intersection critique entre l'apprentissage automatique et la cryptographie, offrant un modèle pour les futures recherches sur les algorithmes de ML sécurisés et respectueux de la vie privée.

Introduction à FHEML

La cryptographie entièrement homomorphe basée sur l'apprentissage automatique (FHEML) est une méthode permettant d'implémenter des algorithmes d'apprentissage automatique utilisant des schémas de cryptage entièrement homomorphes. Elle permet d'effectuer des calculs sur des données chiffrées, garantissant ainsi la confidentialité des données traitées.

FHEML peut être considéré comme complémentaire à l'apprentissage automatique à connaissance nulle (ZKML), où ce dernier se concentre sur la preuve de l'exécution correcte des algorithmes d'apprentissage automatique, tandis que FHEML met l'accent sur l'exécution de calculs sur des données chiffrées pour maintenir la confidentialité des données.

L'essence de FHEML réside dans sa capacité à permettre des calculs sur des données chiffrées de manière à ce que, une fois les résultats du calcul déchiffrés, ils correspondent aux résultats qui auraient été obtenus si les calculs avaient été effectués sur les données initiales en texte clair. Cette capacité ouvre des perspectives importantes pour les applications d'apprentissage automatique car elle permet aux algorithmes de fonctionner sur des données chiffrées sans compromettre la confidentialité ou la sécurité des données.

Il peut être visualisé comme :

calcul sur des données chiffrées

FHEML se compose d'algorithmes d'apprentissage automatique adaptés pour fonctionner avec des schémas de cryptage entièrement homomorphes. En tirant parti de ces schémas, FHEML ouvre la porte à un large éventail de cas d'utilisation d'apprentissage automatique centrés sur la confidentialité. À un niveau élevé, cela comprend le calcul confidentiel, la formation chiffrée et les inférences privées, entre autres. Ces avancées non seulement renforcent la sécurité des données, mais élargissent également les applications potentielles de l'apprentissage automatique dans des contextes sensibles et exigeants en termes de confidentialité.

Bibliothèques existantes dans la direction de FHEML

Peu de bibliothèques et de cadres vers FHEML, Pour l'instant, il n'y a pas de norme établie pour écrire des programmes FHEML mais quelques-uns des cadres et bibliothèques les plus populaires pour la construction de programmes FHEML sont :

Concrete-mlest une bibliothèque créée par Zama, construite sur leur compilateur TFHE de bas niveau,Bétonqui permet la compilation de code Python arbitraire en circuits FHE, permettant aux développeurs d'écrire des fonctions en Python qui peuvent effectuer des calculs sur des données chiffrées.

Concrete-ml permet aux développeurs de travailler avec une API d'apprentissage automatique familière (modèles linéaires, modèles basés sur les arbres, réseau neuronal) disponible dans scikitapprendre ou d'autres frameworks, permet la conversion des modèles PyTorch en leurs versions compatibles FHE, classificateurs basés sur la descente de gradient stochastique qui peuvent être entraînés sur des données chiffrées, etc. Concrete-ml abaisse considérablement la barrière à l'entrée pour mettre en œuvre des opérations de ml sur des données chiffrées.

Tenseal, développé par le OpenMinedcommunauté, se concentre sur la possibilité d'effectuer des opérations homomorphiques sur les tenseurs (unités fondamentales dans les réseaux neuronaux et pouvant représenter ou manipuler des données sous différentes formes). Construit sur la base de Microsoft SEAL(Bibliothèque arithmétique cryptée simple), Tenseal fournit une API efficace accessible en Python avec des opérations sous-jacentes écrites en C++ pour des performances améliorées permettant la fonction HE sur des tenseurs cryptés.

PySyft, est une autre contribution d'OpenMined visant à assurer un apprentissage profond sécurisé et privé en Python. Il est construit avec les capacités de chiffrement homomorphique de Tenseal pour améliorer ses fonctionnalités de préservation de la vie privée. PySyft introduit le tenseur CKKS, basé sur le CKKSschéma de chiffrement homomorphique, permettant des opérations sur des nombres réels et fournissant des résultats approximatifs. Cela va au-delà du chiffrement homomorphique, incorporant également le calcul sécurisé multipartite et la confidentialité différentielle pour offrir une suite complète pour l'apprentissage automatique préservant la confidentialité.

TF Chiffré, est un cadre conçu pour l'apprentissage automatique chiffré au sein de l'écosystème TensorFlow. Imitant l'expérience TensorFlow, en particulier à travers le API Keras, TF Encrypted facilite l'entraînement et la prédiction sur des données chiffrées. Il exploite la computation sécurisée multi-parties et le chiffrement homomorphe pour fournir des capacités d'apprentissage machine préservant la vie privée. TF Encrypted vise à démocratiser l'apprentissage machine chiffré en le rendant accessible à ceux qui n'ont pas de solide expérience en cryptographie, systèmes distribués ou informatique haute performance.

Quelques cas d'utilisation génériques de FHEML

Externalisation de la computation

Puisque le calcul s'effectue désormais sur des données chiffrées, la partie qui souhaite que les calculs se déroulent peut partager en toute sécurité la forme chiffrée des données avec un tiers pour les traiter.

Inférences cryptées

Il facilite l'inférence chiffrée, où l'inférence demandée par l'utilisateur n'est pas révélée aux modèles et reste chiffrée par défaut, et seul l'utilisateur peut la décrypter avec ses clés.

Entraînement chiffré Insights

Permettre aux entreprises de tirer parti de formes cryptées de données sensibles pour former des modèles d'apprentissage automatique et en tirer des insights. Cela permet aux organisations d'utiliser leurs données pour améliorer leurs opérations, développer de nouvelles stratégies et améliorer les processus de prise de décision, le tout en garantissant la confidentialité et la sécurité des données impliquées.

Avertissement:

  1. Cet article est reproduit à partir de [Foresightnews]. Transmettre le titre original '速览 Gitcoin 推出的 Allo Protocol:社区赠款计划的协议层基础设施'. Tous les droits d'auteur appartiennent à l'auteur original [Frank, Foresight News]. Si des objections sont soulevées à cette réimpression, veuillez contacter le Porte Apprendreéquipe, et ils s'en occuperont rapidement.

  2. Clause de non-responsabilité: Les points de vue et opinions exprimés dans cet article sont uniquement ceux de l'auteur et ne constituent aucun conseil en investissement.

  3. Les traductions de l'article dans d'autres langues sont réalisées par l'équipe Gate Learn. Sauf mention contraire, il est interdit de copier, distribuer ou plagier les articles traduits.

Qu'est-ce que FHEML

Avancé4/2/2024, 3:19:26 PM
Exploration de l'apprentissage automatique basé sur le chiffrement entièrement homomorphique (EML), une technologie révolutionnaire qui permet des calculs sur des données chiffrées, garantissant la confidentialité et la sécurité des données. Découvrez les principaux cas d'utilisation de l'EML, y compris le calcul externalisé, l'inférence chiffrée et les informations sur la formation chiffrée, ainsi que les principaux cadres et bibliothèques prenant en charge le développement de l'EML.

Un peu sur EML d'abord

Le chiffrement entièrement homomorphe (FHE) représente une classe de techniques de chiffrement conçues pour permettre des calculs significatifs à partir de données chiffrées. Cela signifie que lorsque les résultats de ces calculs sont déchiffrés, ils sont cohérents avec les résultats qui auraient été obtenus si ces calculs avaient été effectués sur les données en clair.

En bref

fenc est une fonction de chiffrement homomorphe

La propriété homomorphique préserve le calcul dans l'espace chiffré

Dans la catégorie plus large de l'EML, nous voyons généralement la catégorisation des schémas EML en deux ou trois types de schémas EML qui sont

  • Chiffrement Somewhat Homomorphique (SHE) : prend en charge un nombre limité d'opérations d'addition et de multiplication sur les textes chiffrés.
  • Cryptage pleinement homomorphe (FHE) : prend en charge tout nombre d'opérations de multiplication et/ou d'addition sur le texte chiffré sans compromettre son intégrité lors du déchiffrement.
  • Cryptage homomorphe partiel (HE partiel) : prend en charge soit l'addition, soit la multiplication sur le texte chiffré, mais pas les deux à la fois.

Tentatives antérieures en ML avec FHE

L'exploration de l'apprentissage automatique (ML) avec le chiffrement pleinement homomorphique (FHE) contribue directement à la préservation de la vie privée en permettant que les calculs soient effectués sur des données chiffrées.

Cette région a vu plusieurs contributions notables, telles que celle de Lauter (2021) sur l'intégration du cryptage homomorphique avec l'IA pour la formation privée et les prédictions, mettant en lumière le mariage de la cryptographie et de l'apprentissage automatique pour protéger la confidentialité des données tout en exploitant la puissance de l'IA.

De plus, les travaux sur les réseaux neuronaux profonds préservant la confidentialité en utilisant FHE, tels qu'expliqués dans une étude portant sur un modèle hybride de FHE et de calcul multipartite (MPC) pour évaluer les fonctions non arithmétiques dans les modèles ML, repoussent les limites de la confidentialité des données et des modèles pendant les calculs.

L'œuvre fondatrice de Graepel, Lauter et Naehrig (2012) papierSur ML Confidential présente l'application du chiffrement quelque peu homomorphe pour déléguer les calculs de ML aux services de calcul de manière sécurisée, ce qui permet des algorithmes de ML confidentiels garantissant la confidentialité des données. De plus, la recherche sur les algorithmes de régression logistique et d'apprentissage non supervisé sur des données chiffrées illustre l'application pratique et l'adaptation des méthodes traditionnelles de ML pour fonctionner dans des contraintes de chiffrement, démontrant la faisabilité et l'efficacité de telles approches dans la préservation de la confidentialité des données. Ces travaux soulignent collectivement l'intersection critique entre l'apprentissage automatique et la cryptographie, offrant un modèle pour les futures recherches sur les algorithmes de ML sécurisés et respectueux de la vie privée.

Introduction à FHEML

La cryptographie entièrement homomorphe basée sur l'apprentissage automatique (FHEML) est une méthode permettant d'implémenter des algorithmes d'apprentissage automatique utilisant des schémas de cryptage entièrement homomorphes. Elle permet d'effectuer des calculs sur des données chiffrées, garantissant ainsi la confidentialité des données traitées.

FHEML peut être considéré comme complémentaire à l'apprentissage automatique à connaissance nulle (ZKML), où ce dernier se concentre sur la preuve de l'exécution correcte des algorithmes d'apprentissage automatique, tandis que FHEML met l'accent sur l'exécution de calculs sur des données chiffrées pour maintenir la confidentialité des données.

L'essence de FHEML réside dans sa capacité à permettre des calculs sur des données chiffrées de manière à ce que, une fois les résultats du calcul déchiffrés, ils correspondent aux résultats qui auraient été obtenus si les calculs avaient été effectués sur les données initiales en texte clair. Cette capacité ouvre des perspectives importantes pour les applications d'apprentissage automatique car elle permet aux algorithmes de fonctionner sur des données chiffrées sans compromettre la confidentialité ou la sécurité des données.

Il peut être visualisé comme :

calcul sur des données chiffrées

FHEML se compose d'algorithmes d'apprentissage automatique adaptés pour fonctionner avec des schémas de cryptage entièrement homomorphes. En tirant parti de ces schémas, FHEML ouvre la porte à un large éventail de cas d'utilisation d'apprentissage automatique centrés sur la confidentialité. À un niveau élevé, cela comprend le calcul confidentiel, la formation chiffrée et les inférences privées, entre autres. Ces avancées non seulement renforcent la sécurité des données, mais élargissent également les applications potentielles de l'apprentissage automatique dans des contextes sensibles et exigeants en termes de confidentialité.

Bibliothèques existantes dans la direction de FHEML

Peu de bibliothèques et de cadres vers FHEML, Pour l'instant, il n'y a pas de norme établie pour écrire des programmes FHEML mais quelques-uns des cadres et bibliothèques les plus populaires pour la construction de programmes FHEML sont :

Concrete-mlest une bibliothèque créée par Zama, construite sur leur compilateur TFHE de bas niveau,Bétonqui permet la compilation de code Python arbitraire en circuits FHE, permettant aux développeurs d'écrire des fonctions en Python qui peuvent effectuer des calculs sur des données chiffrées.

Concrete-ml permet aux développeurs de travailler avec une API d'apprentissage automatique familière (modèles linéaires, modèles basés sur les arbres, réseau neuronal) disponible dans scikitapprendre ou d'autres frameworks, permet la conversion des modèles PyTorch en leurs versions compatibles FHE, classificateurs basés sur la descente de gradient stochastique qui peuvent être entraînés sur des données chiffrées, etc. Concrete-ml abaisse considérablement la barrière à l'entrée pour mettre en œuvre des opérations de ml sur des données chiffrées.

Tenseal, développé par le OpenMinedcommunauté, se concentre sur la possibilité d'effectuer des opérations homomorphiques sur les tenseurs (unités fondamentales dans les réseaux neuronaux et pouvant représenter ou manipuler des données sous différentes formes). Construit sur la base de Microsoft SEAL(Bibliothèque arithmétique cryptée simple), Tenseal fournit une API efficace accessible en Python avec des opérations sous-jacentes écrites en C++ pour des performances améliorées permettant la fonction HE sur des tenseurs cryptés.

PySyft, est une autre contribution d'OpenMined visant à assurer un apprentissage profond sécurisé et privé en Python. Il est construit avec les capacités de chiffrement homomorphique de Tenseal pour améliorer ses fonctionnalités de préservation de la vie privée. PySyft introduit le tenseur CKKS, basé sur le CKKSschéma de chiffrement homomorphique, permettant des opérations sur des nombres réels et fournissant des résultats approximatifs. Cela va au-delà du chiffrement homomorphique, incorporant également le calcul sécurisé multipartite et la confidentialité différentielle pour offrir une suite complète pour l'apprentissage automatique préservant la confidentialité.

TF Chiffré, est un cadre conçu pour l'apprentissage automatique chiffré au sein de l'écosystème TensorFlow. Imitant l'expérience TensorFlow, en particulier à travers le API Keras, TF Encrypted facilite l'entraînement et la prédiction sur des données chiffrées. Il exploite la computation sécurisée multi-parties et le chiffrement homomorphe pour fournir des capacités d'apprentissage machine préservant la vie privée. TF Encrypted vise à démocratiser l'apprentissage machine chiffré en le rendant accessible à ceux qui n'ont pas de solide expérience en cryptographie, systèmes distribués ou informatique haute performance.

Quelques cas d'utilisation génériques de FHEML

Externalisation de la computation

Puisque le calcul s'effectue désormais sur des données chiffrées, la partie qui souhaite que les calculs se déroulent peut partager en toute sécurité la forme chiffrée des données avec un tiers pour les traiter.

Inférences cryptées

Il facilite l'inférence chiffrée, où l'inférence demandée par l'utilisateur n'est pas révélée aux modèles et reste chiffrée par défaut, et seul l'utilisateur peut la décrypter avec ses clés.

Entraînement chiffré Insights

Permettre aux entreprises de tirer parti de formes cryptées de données sensibles pour former des modèles d'apprentissage automatique et en tirer des insights. Cela permet aux organisations d'utiliser leurs données pour améliorer leurs opérations, développer de nouvelles stratégies et améliorer les processus de prise de décision, le tout en garantissant la confidentialité et la sécurité des données impliquées.

Avertissement:

  1. Cet article est reproduit à partir de [Foresightnews]. Transmettre le titre original '速览 Gitcoin 推出的 Allo Protocol:社区赠款计划的协议层基础设施'. Tous les droits d'auteur appartiennent à l'auteur original [Frank, Foresight News]. Si des objections sont soulevées à cette réimpression, veuillez contacter le Porte Apprendreéquipe, et ils s'en occuperont rapidement.

  2. Clause de non-responsabilité: Les points de vue et opinions exprimés dans cet article sont uniquement ceux de l'auteur et ne constituent aucun conseil en investissement.

  3. Les traductions de l'article dans d'autres langues sont réalisées par l'équipe Gate Learn. Sauf mention contraire, il est interdit de copier, distribuer ou plagier les articles traduits.

Lancez-vous
Inscrivez-vous et obtenez un bon de
100$
!