Mis on andmemaskimise tehnoloogia ja lahendus võrgupaketimaakleris?

1. Andmete maskeerimise kontseptsioon

Andmete maskeerimist tuntakse ka kui andmete maskeerimist. See on tehniline meetod tundlike andmete (nt mobiiltelefoni number, pangakaardi number ja muu teave) teisendamiseks, muutmiseks või katmiseks, kui oleme andnud maskeerimisreeglid ja -poliitikad. Seda tehnikat kasutatakse peamiselt selleks, et vältida tundlike andmete otsest kasutamist ebausaldusväärsetes keskkondades.

Andmete maskeerimise põhimõte: andmete varjamine peaks säilitama algsed andmete omadused, ärireeglid ja andmete asjakohasuse tagamaks, et maskeerimine ei mõjuta hilisemat arendust, testimist ja andmete analüüsi. Tagada andmete järjepidevus ja kehtivus enne ja pärast maskeerimist.

2. Andmete maskeerimise klassifikatsioon

Andmete maskeerimise võib jagada staatiliseks andmete maskeerimiseks (SDM) ja dünaamiliseks andmemaskimiseks (DDM).

Staatiline andmete maskeerimine (SDM): Staatiline andmete maskeerimine nõuab tootmiskeskkonnast eraldamiseks uue mittetootmiskeskkonna andmebaasi loomist. Tundlikud andmed ekstraheeritakse tootmisandmebaasist ja salvestatakse seejärel mittetootmisandmebaasi. Nii eraldatakse desensibiliseeritud andmed tootmiskeskkonnast, mis vastab ärivajadustele ja tagab tootmisandmete turvalisuse.

SDM

Dünaamiline andmete maskeerimine (DDM): Seda kasutatakse tavaliselt tootmiskeskkonnas tundlike andmete reaalajas desensibiliseerimiseks. Mõnikord on samade tundlike andmete lugemiseks erinevates olukordades vaja erinevaid maskeerimistasemeid. Näiteks võivad erinevad rollid ja õigused rakendada erinevaid maskeerimisskeeme.

DDM

Andmete aruandlus ja andmetoodete maskeerimisrakendus

Sellised stsenaariumid hõlmavad peamiselt sisemisi andmeseiretooteid või stendi, välisteenuse andmetooteid ja andmeanalüüsil põhinevaid aruandeid, nagu äriaruanded ja projektiülevaade.

andmete aruandlus toote maskeerimine

3. Andmete maskeerimise lahendus

Levinud andmete maskeerimisskeemid hõlmavad järgmist: kehtetuks tunnistamine, juhuslik väärtus, andmete asendamine, sümmeetriline krüptimine, keskmine väärtus, nihe ja ümardamine jne.

Kehtetuks tunnistamine: kehtetuks tunnistamine viitab tundlike andmete krüptimisele, kärpimisele või peitmisele. See skeem asendab tavaliselt tegelikud andmed spetsiaalsete sümbolitega (nt *). Toiming on lihtne, kuid kasutajad ei saa teada algandmete vormingut, mis võib mõjutada järgnevaid andmerakendusi.

Juhuslik väärtus: juhuslik väärtus viitab tundlike andmete juhuslikule asendamisele (numbrid asendavad numbreid, tähed tähti ja märgid tähemärke). See maskeerimismeetod tagab teatud määral tundlike andmete vormingu ja hõlbustab hilisemat andmete rakendamist. Mõne tähendusrikka sõna, näiteks inimeste ja kohtade nimede jaoks võib vaja minna maskeerivaid sõnastikke.

Andmete asendamine: andmete asendamine sarnaneb null- ja juhuslike väärtuste maskeerimisega, välja arvatud see, et erimärkide või juhuslike väärtuste kasutamise asemel asendatakse maskeerimisandmed konkreetse väärtusega.

Sümmeetriline krüptimine: Sümmeetriline krüptimine on spetsiaalne pööratav maskeerimismeetod. See krüpteerib tundlikke andmeid krüpteerimisvõtmete ja algoritmide abil. Šifreeritud tekstivorming on kooskõlas loogiliste reeglite algandmetega.

Keskmine: Keskmist skeemi kasutatakse sageli statistilistes stsenaariumides. Arvandmete puhul arvutame esmalt nende keskmise ja seejärel jaotame desensibiliseeritud väärtused juhuslikult keskmise ümber, hoides seega andmete summa konstantsena.

Nihe ja ümardamine: see meetod muudab digitaalseid andmeid juhusliku nihkega. Nihke ümardamine tagab vahemiku ligikaudse autentsuse, säilitades samas andmete turvalisuse, mis on varasematest skeemidest lähedasem tegelikele andmetele ning omab suurt tähtsust suurandmete analüüsi stsenaariumis.

ML-NPB-5660-数据脱敏

Soovitatav mudel"ML-NPB-5660" Andmete maskeerimise jaoks

4. Tavaliselt kasutatavad andmete maskeerimise tehnikad

(1). Statistilised tehnikad

Andmete valim ja andmete koondamine

- Andmete valim: algse andmekogumi analüüs ja hindamine, valides andmekogumi esindusliku alamhulga, on oluline meetod deidentifitseerimismeetodite tõhususe parandamiseks.

- Andmete koondamine: statistiliste meetodite kogumina (nagu liitmine, loendamine, keskmistamine, maksimum ja miinimum), mida rakendatakse mikroandmete atribuutidele, esindab tulemus kõiki algse andmekogumi kirjeid.

(2). Krüptograafia

Krüptograafia on levinud meetod desensibiliseerimiseks või desensibiliseerimise tõhususe suurendamiseks. Erinevat tüüpi krüpteerimisalgoritmid võivad saavutada erinevaid desensibiliseerivaid efekte.

- Deterministlik krüptimine: mittejuhuslik sümmeetriline krüptimine. Tavaliselt töötleb see ID-andmeid ning saab vajadusel dekrüpteerida ja taastada šifriteksti algse ID-ga, kuid võti peab olema korralikult kaitstud.

- Pöördumatu krüptimine: andmete töötlemiseks kasutatakse räsifunktsiooni, mida tavaliselt kasutatakse ID-andmete puhul. Seda ei saa otse dekrüpteerida ja vastendussuhe tuleb salvestada. Lisaks võib räsifunktsiooni funktsiooni tõttu tekkida andmete kokkupõrge.

- Homomorfne krüptimine: kasutatakse šifreeritud teksti homomorfset algoritmi. Sellele on iseloomulik, et šifreeritud teksti toimimise tulemus on pärast dekrüpteerimist sama, mis lihtteksti toimimise tulemus. Seetõttu kasutatakse seda tavaliselt arvväljade töötlemiseks, kuid seda ei kasutata jõudluse huvides laialdaselt.

(3). Süsteemi tehnoloogia

Supressioontehnoloogia kustutab või varjab andmeüksused, mis ei vasta privaatsuskaitsele, kuid ei avalda neid.

- Maskeerimine: see viitab kõige tavalisemale desensibiliseerimismeetodile atribuudi väärtuse varjamiseks, näiteks vastase number, ID-kaart on tähistatud tärniga või aadress on kärbitud.

- Kohalik mahasurumine: viitab konkreetsete atribuutide väärtuste (veerude) kustutamise protsessile, ebaoluliste andmeväljade eemaldamisele;

- Kirjete sulgemine: viitab konkreetsete kirjete (ridade) kustutamise protsessile, ebaoluliste andmekirjete kustutamisele.

(4). Pseudonüüm Tehnoloogia

Pseudomanning on identifitseerimise eemaldamise tehnika, mis kasutab pseudonüümi otsese identifikaatori (või muu tundliku identifikaatori) asendamiseks. Pseudonüümitehnikad loovad otseste või tundlike identifikaatorite asemel iga üksiku teabeobjekti jaoks kordumatud identifikaatorid.

- See suudab iseseisvalt genereerida juhuslikke väärtusi, mis vastavad algsele ID-le, salvestavad kaardistamise tabeli ja kontrollivad rangelt juurdepääsu kaardistamise tabelile.

- Pseudonüümide loomiseks saate kasutada ka krüptimist, kuid peate dekrüpteerimisvõtit õigesti hoidma;

Seda tehnoloogiat kasutatakse laialdaselt suure hulga sõltumatute andmekasutajate puhul, näiteks OpenID avatud platvormi stsenaariumi korral, kus erinevad arendajad hangivad samale kasutajale erinevad OpenID-id.

(5). Üldistamise tehnikad

Üldistustehnika viitab identifitseerimise eemaldamise tehnikale, mis vähendab andmekogumis valitud atribuutide detailsust ning annab andmete üldisema ja abstraktsema kirjelduse. Üldistustehnoloogiat on lihtne rakendada ja see suudab kaitsta rekordtaseme andmete autentsust. Seda kasutatakse tavaliselt andmetoodetes või andmearuannetes.

- Ümardamine: hõlmab valitud atribuudi jaoks ümardamisbaasi valimist, näiteks üles- või allapoole suunatud kohtuekspertiisi, mille tulemuseks on 100, 500, 1K ja 10K

- Ülemise ja alumise kodeerimise tehnikad: asendage lävest kõrgemad (või madalamad) väärtused lävega, mis tähistab ülemist (või alumist) taset, mille tulemuseks on "üle X" või "alla X"

(6). Randomiseerimise tehnikad

Omamoodi deidentifitseerimistehnikana viitab randomiseerimistehnoloogia atribuudi väärtuse muutmisele randomiseerimise teel, nii et randomiseerimise järgne väärtus erineb algsest tegelikust väärtusest. See protsess vähendab ründaja võimet tuletada atribuudi väärtus teistest samas andmekirjes olevatest atribuudiväärtustest, kuid mõjutab saadud andmete autentsust, mis on tavaline tootmistesti andmete puhul.


Postitusaeg: 27. september 2022