1. Andmete maskeerimise kontseptsioon
Andmete maskeerimine on tuntud ka kui andmete maskeerimine. See on tehniline meetod tundlike andmete, näiteks mobiiltelefoninumbri, pangakaardi numbri ja muu teabe teisendamiseks, muutmiseks või katmiseks, kui oleme kehtestanud maskeerimisreeglid ja -poliitikad. Seda tehnikat kasutatakse peamiselt tundlike andmete otsese kasutamise vältimiseks ebausaldusväärsetes keskkondades.
Andmete maskeerimise põhimõte: andmete maskeerimine peaks säilitama algsed andmete omadused, ärireeglid ja andmete asjakohasuse, et tagada edasise arenduse, testimise ja andmeanalüüsi mõju vältimine maskeerimise teel. Tagada andmete järjepidevus ja kehtivus enne ja pärast maskeerimist.
2. Andmete maskeerimise klassifikatsioon
Andmete maskeerimist saab jagada staatiliseks andmete maskeerimiseks (SDM) ja dünaamiliseks andmete maskeerimiseks (DDM).
Staatiline andmete maskeerimine (SDM)Staatilise andmemaskeerimise jaoks on vaja luua uus mittetootmiskeskkonna andmebaas, et see tootmiskeskkonnast eraldada. Tundlikud andmed ekstraheeritakse tootmisandmebaasist ja salvestatakse seejärel mittetootmisandmebaasi. Sel viisil isoleeritakse desensibiliseeritud andmed tootmiskeskkonnast, mis vastab ärivajadustele ja tagab tootmisandmete turvalisuse.
Dünaamiline andmete maskeerimine (DDM)Seda kasutatakse üldiselt tootmiskeskkonnas tundlike andmete reaalajas desensibiliseerimiseks. Mõnikord on sama tundliku teabe lugemiseks erinevates olukordades vaja erinevaid maskeerimistasemeid. Näiteks võivad erinevad rollid ja õigused rakendada erinevaid maskeerimisskeeme.
Andmete aruandluse ja andmetoodete maskeerimise rakendus
Sellised stsenaariumid hõlmavad peamiselt sisemisi andmemonitooringu tooteid või stende, väliseid teenuseandmetooteid ja andmeanalüüsil põhinevaid aruandeid, näiteks äriaruandeid ja projektiülevaateid.
3. Andmete maskeerimise lahendus
Levinud andmete maskeerimise skeemide hulka kuuluvad: kehtetuks tunnistamine, juhuslik väärtus, andmete asendamine, sümmeetriline krüptimine, keskmine väärtus, nihe ja ümardamine jne.
Kehtetuks tunnistamineKehtetuks tunnistamine viitab tundlike andmete krüpteerimisele, kärpimisele või peitmisele. See skeem asendab tegelikud andmed tavaliselt erisümbolitega (näiteks *). Toiming on lihtne, kuid kasutajad ei saa teada algsete andmete vormingut, mis võib mõjutada järgnevaid andmerakendusi.
Juhuslik väärtusJuhuslik väärtus viitab tundlike andmete juhuslikule asendamisele (numbrid asendavad numbreid, tähed asendavad tähti ja märgid asendavad märke). See maskeerimismeetod tagab teatud määral tundlike andmete vormingu ja hõlbustab edasist andmete rakendamist. Mõnede tähendusrikaste sõnade, näiteks inimeste ja kohtade nimede jaoks võib vaja minna maskeerimissõnastikke.
Andmete asendamineAndmete asendamine sarnaneb null- ja juhuslike väärtuste maskeerimisega, välja arvatud see, et erimärkide või juhuslike väärtuste asemel asendatakse maskeerivad andmed kindla väärtusega.
Sümmeetriline krüptimineSümmeetriline krüptimine on spetsiaalne pöörduv maskeerimismeetod. See krüpteerib tundlikke andmeid krüpteerimisvõtmete ja algoritmide abil. Krüpteeritud teksti vorming on loogilistes reeglites kooskõlas algsete andmetega.
KeskmineKeskmise arvutamise skeemi kasutatakse sageli statistilistes stsenaariumides. Numbriliste andmete puhul arvutame kõigepealt nende keskmise ja seejärel jaotame desensibiliseeritud väärtused juhuslikult keskmise ümber, hoides seega andmete summa konstantsena.
Nihe ja ümardamineSee meetod muudab digitaalseid andmeid juhusliku nihke abil. Nihkega ümardamine tagab vahemiku ligikaudse autentsuse, säilitades samal ajal andmete turvalisuse, mis on tegelikele andmetele lähemal kui eelmised skeemid, ning sellel on suur tähtsus suurandmete analüüsi stsenaariumis.
Soovitatav mudel "ML-NPB-5660"andmete maskeerimise jaoks"
4. Tavaliselt kasutatavad andmete maskeerimise tehnikad
(1). Statistilised meetodid
Andmete valim ja andmete koondamine
- Andmete valim: algse andmekogumi analüüs ja hindamine andmekogumist representatiivse alamhulga valimise teel on oluline meetod anonümiseerimistehnikate tõhususe parandamiseks.
- Andmete agregeerimine: mikroandmete atribuutidele rakendatud statistiliste meetodite (nt summeerimine, loendamine, keskmistamine, maksimumi ja miinimumi arvutamine) kogumina on tulemus esinduslik kõigi algse andmekogumi kirjete suhtes.
(2). Krüptograafia
Krüptograafia on levinud meetod tundlikkuse vähendamiseks või tundlikkuse vähendamise efektiivsuse suurendamiseks. Erinevat tüüpi krüpteerimisalgoritmid võivad saavutada erinevaid tundlikkuse vähendamise efekte.
- Deterministlik krüptimine: mittejuhuslik sümmeetriline krüptimine. Tavaliselt töötleb see ID-andmeid ning vajadusel saab krüpteerida ja taastada algse ID-ni, kuid võtit tuleb korralikult kaitsta.
- Pöördumatu krüptimine: Räsifunktsiooni kasutatakse andmete töötlemiseks, mida tavaliselt kasutatakse ID-andmete puhul. Seda ei saa otse dekrüpteerida ja kaardistussuhe tuleb salvestada. Lisaks võib räsifunktsiooni omaduse tõttu tekkida andmete kokkupõrge.
- Homomorfne krüptimine: kasutatakse krüptitud teksti homomorfset algoritmi. Selle eripäraks on see, et krüptitud teksti toimimise tulemus on pärast dekrüpteerimist sama, mis lihtteksti toimimise tulemus. Seetõttu kasutatakse seda tavaliselt numbriliste väljade töötlemiseks, kuid jõudluse tõttu mitte laialdaselt.
(3). Süsteemitehnoloogia
See summutustehnoloogia kustutab või varjab andmeüksusi, mis ei vasta privaatsuskaitse nõuetele, kuid ei avalda neid.
- Maskeerimine: see viitab kõige levinumale desensibiliseerimismeetodile atribuudi väärtuse maskeerimiseks, näiteks vastase number, ID-kaart on tähistatud tärniga või aadress on kärbitud.
- Kohalik summutamine: viitab teatud atribuudiväärtuste (veergude) kustutamise protsessile, eemaldades mittevajalikud andmeväljad;
- Kirjete kustutamine: viitab konkreetsete kirjete (ridade) kustutamise protsessile, st mittevajalike andmekirjete kustutamisele.
(4). Pseudonüümide tehnoloogia
Pseudomaanimine on anonümiseerimise tehnika, mille puhul kasutatakse otsese identifikaatori (või muu tundliku identifikaatori) asendamiseks pseudonüümi. Pseudonüümitehnikad loovad iga üksiku andmesubjekti jaoks unikaalsed identifikaatorid otseste või tundlike identifikaatorite asemel.
- See suudab genereerida juhuslikke väärtusi sõltumatult, et need vastaksid algsele ID-le, salvestada kaardistustabeli ja rangelt kontrollida juurdepääsu kaardistustabelile.
- Krüpteerimist saab kasutada ka pseudonüümide loomiseks, kuid dekrüpteerimisvõtit tuleb korralikult hoida;
Seda tehnoloogiat kasutatakse laialdaselt suure hulga sõltumatute andmekasutajate puhul, näiteks OpenID avatud platvormi stsenaariumis, kus erinevad arendajad saavad sama kasutaja jaoks erinevad OpenID-d.
(5). Üldistamise tehnikad
Üldistamistehnika viitab anonümiseerimistehnikale, mis vähendab andmekogumis valitud atribuutide detailsust ja pakub andmete üldisemat ja abstraktsemat kirjeldust. Üldistamistehnoloogiat on lihtne rakendada ja see aitab kaitsta kirjetaseme andmete autentsust. Seda kasutatakse tavaliselt andmetoodetes või andmearuannetes.
- Ümardamine: hõlmab valitud atribuudi ümardamisbaasi valimist, näiteks üles- või allapoole suunatud kohtuekspertiisi, mille tulemuseks on 100, 500, 1000 ja 10000.
- Ülemise ja alumise taseme kodeerimistehnikad: lävendi kohal (või all) olevate väärtuste asendamine lävendiga, mis esindab ülemist (või alumist) taset, saades tulemuseks "üle X" või "alla X".
(6). Randomiseerimismeetodid
Omamoodi anonümiseerimistehnikana viitab randomiseerimistehnoloogia atribuudi väärtuse muutmisele randomiseerimise teel, nii et randomiseerimisjärgne väärtus erineb algsest tegelikust väärtusest. See protsess vähendab ründaja võimet tuletada atribuudi väärtust sama andmekirje teistest atribuutide väärtustest, kuid mõjutab saadud andmete autentsust, mis on tavaline tootmistestide andmete puhul.
Postituse aeg: 27. september 2022