Care este tehnologia și soluția de mascare a datelor în brokerul de pachete de rețea?

1. Conceptul de mascare a datelor

Mascarea datelor este cunoscută și sub denumirea de mascare de date. Este o metodă tehnică de a converti, modifica sau acoperi date sensibile, cum ar fi numărul de telefon mobil, numărul cardului bancar și alte informații atunci când am dat reguli și politici de mascare. Această tehnică este utilizată în principal pentru a preveni utilizarea datelor sensibile direct în medii nesigure.

Principiul de mascare a datelor: mascarea datelor ar trebui să mențină caracteristicile originale ale datelor, regulile de afaceri și relevanța datelor pentru a se asigura că dezvoltarea ulterioară, testarea și analiza datelor nu vor fi afectate de mascare. Asigurați consistența și validitatea datelor înainte și după mascare.

2. Clasificarea mascării datelor

Mascarea datelor poate fi împărțită în mascarea statică a datelor (SDM) și în mascarea dinamică a datelor (DDM).

Masking de date statice (SDM): Mascarea statică a datelor necesită înființarea unei noi baze de date de mediu non-producție pentru izolarea din mediul de producție. Datele sensibile sunt extrase din baza de date de producție și apoi stocate în baza de date de non-producție. În acest fel, datele desensibilizate sunt izolate de mediul de producție, care răspunde nevoilor de afaceri și asigură securitatea datelor de producție.

SDM

Mascare dinamică a datelor (DDM): În general, este utilizat în mediul de producție pentru a desensibiliza datele sensibile în timp real. Uneori, diferite niveluri de mascare sunt necesare pentru a citi aceleași date sensibile în situații diferite. De exemplu, diferite roluri și permisiuni pot implementa diferite scheme de mascare.

Ddm

Aplicația de raportare a datelor și a produselor de date de mascare

Astfel de scenarii includ în principal produse interne de monitorizare a datelor sau panou publicitar, produse de date de servicii externe și rapoarte bazate pe analiza datelor, cum ar fi rapoartele de afaceri și revizuirea proiectului.

Mascarea produselor de raportare a datelor

3. Soluție de mascare a datelor

Schemele comune de mascare a datelor includ: invalidare, valoare aleatorie, înlocuire a datelor, criptare simetrică, valoare medie, compensare și rotunjire etc.

Invalidare: Invalidarea se referă la criptare, trunchiere sau ascunderea datelor sensibile. Această schemă înlocuiește de obicei date reale cu simboluri speciale (cum ar fi *). Operația este simplă, dar utilizatorii nu pot cunoaște formatul datelor originale, care pot afecta aplicațiile de date ulterioare.

Valoare aleatorie: Valoarea aleatorie se referă la înlocuirea aleatorie a datelor sensibile (numerele înlocuiesc cifrele, literele înlocuiesc literele și caracterele înlocuiesc caracterele). Această metodă de mascare va asigura formatul datelor sensibile într -o anumită măsură și va facilita aplicarea ulterioară a datelor. Dicționarele de mascare pot fi necesare pentru unele cuvinte semnificative, cum ar fi numele oamenilor și locurilor.

Înlocuirea datelor: Înlocuirea datelor este similară cu mascarea valorilor nule și aleatorii, cu excepția faptului că, în loc să folosească caractere speciale sau valori aleatorii, datele de mascare sunt înlocuite cu o valoare specifică.

Criptare simetrică: Criptarea simetrică este o metodă specială de mascare reversibilă. Criptează date sensibile prin tastele și algoritmii de criptare. Formatul de cifră este în concordanță cu datele originale din regulile logice.

Medie: Schema medie este adesea folosită în scenarii statistice. Pentru date numerice, mai întâi calculăm media lor, apoi distribuim la întâmplare valorile desensibilizate în jurul mediei, păstrând astfel suma constantă a datelor.

Compensare și rotunjire: Această metodă schimbă datele digitale prin schimbarea aleatorie. Rotunjirea compensată asigură autenticitatea aproximativă a gamei, menținând în același timp securitatea datelor, care este mai aproape de datele reale decât schemele anterioare și are o semnificație mare în scenariul analizei mari de date.

ML-NPB-5660- 数据脱敏

Modelul recomandă "ML-NPB-5660„Pentru mascarea datelor

4. Tehnici utilizate în mod obișnuit de mascare a datelor

(1). Tehnici statistice

Eșantionare de date și agregarea datelor

- Eșantionare de date: Analiza și evaluarea setului de date originale prin selectarea unui subset reprezentativ al setului de date este o metodă importantă pentru a îmbunătăți eficacitatea tehnicilor de identificare.

- Agregarea datelor: ca o colecție de tehnici statistice (cum ar fi însumarea, numărarea, medierea, maximul și minimul) aplicate atributelor din microdata, rezultatul este reprezentativ pentru toate înregistrările din setul de date original.

(2). Criptografie

Criptografia este o metodă comună pentru a desensibiliza sau îmbunătăți eficacitatea desensibilizării. Diferite tipuri de algoritmi de criptare pot obține diferite efecte de desensibilizare.

- Criptare deterministă: o criptare simetrică non-aleatorie. De obicei, procesează datele de identificare și poate decripta și restabili cifra la ID -ul inițial atunci când este necesar, dar cheia trebuie protejată în mod corespunzător.

- Criptare ireversibilă: funcția hash este utilizată pentru procesarea datelor, care este de obicei utilizată pentru datele de identificare. Nu poate fi decriptată direct și relația de mapare trebuie salvată. În plus, din cauza caracteristicii funcției hash, poate apărea coliziunea de date.

- Criptare homomorfică: se folosește algoritmul homomorf cifrExt. Caracteristica sa este că rezultatul funcționării cifrului este același cu cel al funcționării de text după decriptare. Prin urmare, este utilizat în mod obișnuit pentru procesarea câmpurilor numerice, dar nu este utilizat pe scară largă din motive de performanță.

(3). Tehnologia sistemului

Tehnologia de suprimare șterge sau protejează elementele de date care nu îndeplinesc protecția confidențialității, dar nu le publică.

- Mascare: se referă la cea mai frecventă metodă de desensibilizare pentru a masca valoarea atributului, cum ar fi numărul adversarului, cartea de identitate este marcată cu un asterisc, sau adresa este trunchiată.

- Suprimare locală: se referă la procesul de ștergere a valorilor de atribute specifice (coloane), eliminarea câmpurilor de date neesențiale;

- Suprimarea înregistrărilor: se referă la procesul de ștergere a înregistrărilor specifice (rânduri), ștergerea înregistrărilor de date neesențiale.

(4). Pseudonim Tehnologie

Pseudomanning-ul este o tehnică de identificare care folosește un pseudonim pentru a înlocui un identificator direct (sau un alt identificator sensibil). Tehnicile pseudonime creează identificatori unici pentru fiecare subiect de informare individuală, în loc de identificatori direcți sau sensibili.

- Poate genera valori aleatorii în mod independent pentru a corespunde ID -ului inițial, salva tabelul de mapare și controlează strict accesul la tabelul de mapare.

- Puteți utiliza, de asemenea, criptarea pentru a produce pseudonime, dar trebuie să păstrați corect cheia de decriptare;

Această tehnologie este utilizată pe scară largă în cazul unui număr mare de utilizatori de date independenți, cum ar fi OpenID în scenariul platformei deschise, unde diferiți dezvoltatori obțin OpenID -uri diferite pentru același utilizator.

(5). Tehnici de generalizare

Tehnica de generalizare se referă la o tehnică de identificare care reduce granularitatea atributelor selectate într-un set de date și oferă o descriere mai generală și mai abstractă a datelor. Tehnologia de generalizare este ușor de implementat și poate proteja autenticitatea datelor la nivel de înregistrare. Este utilizat în mod obișnuit în produsele de date sau în rapoartele de date.

- Rotunjire: implică selectarea unei baze de rotunjire pentru atributul selectat, cum ar fi criminalistica ascendentă sau descendentă, obținând rezultate 100, 500, 1k și 10k

- Tehnici de codificare de sus și de jos: înlocuiți valorile deasupra (sau mai jos) pragul cu un prag reprezentând nivelul de sus (sau de jos), obținând un rezultat al „deasupra x” sau „sub x”

(6). Tehnici de randomizare

Ca un fel de tehnică de identificare, tehnologia de randomizare se referă la modificarea valorii unui atribut prin randomizare, astfel încât valoarea după randomizare este diferită de valoarea reală inițială. Acest proces reduce capacitatea unui atacator de a obține o valoare a atributului din alte valori ale atributului din aceeași înregistrare de date, dar afectează autenticitatea datelor rezultate, care este comună cu datele de testare de producție.


Timpul post: 27-2022 sept