1. andmete maskeerimise kontseptsioon
Andmete maskeerimist tuntakse ka kui andmete maskeerimist. See on tehniline meetod tundlike andmete teisendamiseks, muutmiseks või katmiseks, näiteks mobiiltelefoninumber, pangakaardi number ja muu teave, kui oleme andnud maskeerimise reegleid ja poliitikaid. Seda tehnikat kasutatakse peamiselt tundlike andmete otsese kasutamise vältimiseks ebausaldusväärses keskkonnas.
Andmete maskeerimise põhimõte: Andmete maskeerimine peaks säilitama algsed andmete omadused, ärireeglid ja andmete olulisus, et tagada, et maskeerimine ei mõjutaks järgnevat väljatöötamist, testimist ja andmete analüüsi. Tagada andmete järjepidevus ja kehtivus enne ja pärast maskeerimist.
2. andmete maskeerimise klassifikatsioon
Andmete maskeerimist võib jagada staatilisteks andmete maskeerimiseks (SDM) ja dünaamiliseks andmete maskeerimiseks (DDM).
Staatiline andmete maskeerimine (SDM): Staatiline andmete maskeerimine nõuab tootmiskeskkonnast eraldamiseks uue mittetootmise keskkonna andmebaasi loomist. Tundlikud andmed ekstraheeritakse tootmisandmebaasist ja salvestatakse seejärel mitteproduktsiooni andmebaasi. Sel viisil eraldatakse desensibiliseeritud andmed tootmiskeskkonnast, mis vastab ärivajadustele ja tagab tootmisandmete turvalisuse.
Dünaamiline andmete maskeerimine (DDM): Üldiselt kasutatakse seda tootmiskeskkonnas tundlike andmete desensibiliseerimiseks reaalajas. Mõnikord on erinevates olukordades sama tundlike andmete lugemiseks vaja erinevaid maskeerimistaset. Näiteks võivad erinevad rollid ja õigused rakendada erinevaid maskeerimisskeeme.
Andmete aruandlus ja andmete maskeerimise rakendus
Sellised stsenaariumid hõlmavad peamiselt sisemisi andmete jälgimist tooteid või stendi, väliseid teenuse andmetooteid ja andmeanalüüsil põhinevaid aruandeid, näiteks äriaruanded ja projektide ülevaade.
3. Andmete maskeerimise lahendus
Levinumad andmete maskeerimisskeemid hõlmavad: kehtetuks tunnistamist, juhuslikku väärtust, andmete asendamist, sümmeetrilist krüptimist, keskmist väärtust, nihke ja ümardamist jne.
Kehtetuks tunnistamine: Kehtetuks tunnistamine tähendab tundlike andmete krüptimist, kärpimist või peitmist. See skeem asendab tegelikke andmeid tavaliselt spetsiaalsete sümbolitega (näiteks *). Toiming on lihtne, kuid kasutajad ei saa teada algsete andmete vormingut, mis võib mõjutada järgnevaid andmerakendusi.
Juhuslik väärtus: Juhuslik väärtus viitab tundlike andmete juhuslikule asendamisele (numbrid asendavad numbrid, tähed asendavad tähed ja tähemärgid asendavad tähemärke). See maskeerimismeetod tagab tundlike andmete vormingu teatud määral ja hõlbustab järgnevat andmerakendust. Mõningate tähenduslike sõnade, näiteks inimeste ja kohtade nimede ja kohtade nimede jaoks võib vaja minna sõnaraamatute maskeerimist.
Andmete asendamine: Andmete asendamine sarnaneb null- ja juhuslike väärtuste maskeerimisega, välja arvatud see, et erimärkide või juhuslike väärtuste kasutamise asemel asendatakse maskeerimisandmed konkreetse väärtusega.
Sümmeetriline krüptimine: Sümmeetriline krüptimine on spetsiaalne pöörduv maskeerimismeetod. See krüpteerib tundlikke andmeid krüptimisvõtmete ja algoritmide kaudu. Ciphext -vorming on kooskõlas loogiliste reeglite algsete andmetega.
Keskmiselt: Keskmist skeemi kasutatakse sageli statistilistes stsenaariumides. Numbriliste andmete jaoks arvutame kõigepealt nende keskmise ja jaotame seejärel juhuslikult desensibiliseeritud väärtused keskmise ümber, hoides sellega andmesumma konstantsena.
Nihe ja ümardamine: See meetod muudab digitaalseid andmeid juhusliku nihke abil. Nihke ümardamine tagab vahemiku ligikaudse autentsuse, säilitades samal ajal andmete turvalisuse, mis on tegelikele andmetele lähemal kui eelmistel skeemidel, ja millel on suur tähtsus suurandmete analüüsi stsenaariumis.
Soovitusmudel "ML-NPB-5660"Andmete maskeerimise jaoks
4. Tavaliselt kasutatavad andmete maskeerimise tehnikad
(1). Statistiline tehnikad
Andmete proovivõtmine ja andmete koondamine
- Andmete proovivõtmine: algse andmekogumi analüüs ja hindamine, valides andmekogumi representatiivse alamhulga, on oluline meetod tuvastamise tehnikate tõhususe parandamiseks.
- Andmete koondamine: mikroData atribuutide jaoks rakendatud statistiliste tehnikate (näiteks summeerimine, loendamine, keskmistamine, maksimaalne ja minimaalne) kogumina esindab tulemus kõiki algse andmekogumi kirjeid.
(2). Krüptograafia
Krüptograafia on tavaline meetod desensibiliseerimise tõhususe desensibiliseerimiseks või suurendamiseks. Erinevat tüüpi krüptimisalgoritmid võivad saavutada erinevaid desensibiliseerimisefekte.
- Deterministlik krüptimine: mittejuhuslik sümmeetriline krüptimine. Tavaliselt töötleb see ID -andmeid ja võib krüpteerida ja taastada vajadusel algse ID -le, kuid võti tuleb korralikult kaitsta.
- Pöördumatu krüptimine: räsifunktsiooni kasutatakse andmete töötlemiseks, mida tavaliselt kasutatakse ID -andmete jaoks. Seda ei saa otse dekrüpteerida ja kaardistamise suhe tuleb päästa. Lisaks võib räsifunktsiooni tunnuse tõttu tekkida andmete kokkupõrge.
- Homomorfne krüptimine: kasutatakse šiferteksti homomorfset algoritmi. Selle omadus on see, et šiferteksti töö tulemus on sama, mis pärast dekrüptimist tavalise teksti toimimisel. Seetõttu kasutatakse seda tavaliselt numbriliste väljade töötlemiseks, kuid seda ei kasutata laialdaselt jõudluse huvides.
(3). Süsteemitehnoloogia
Suppressioonitehnoloogia kustutab või kaitseb andmeüksusi, mis ei vasta privaatsuse kaitsele, kuid ei avalda neid.
- Maskeerimine: see viitab atribuudi väärtuse maskeerimiseks kõige tavalisemale desensibiliseerimismeetodile, näiteks vastase numbrile, ID -kaart tähistatakse tärniga või aadress on kärbitud.
- kohalik mahasurumine: viitab konkreetsete atribuudi väärtuste (veerude) kustutamise protsessile, eemaldage ebaolulised andmeväljad;
- Registreerimise allasurumine: viitab konkreetsete kirjete (read) kustutamise protsessile, kustutades ebaolulised andmekirjed.
(4). Pseudonüümi tehnoloogia
Pseudomaning on tuvastamise tehnika, mis kasutab pseudonüümi otsese identifikaatori (või muu tundliku identifikaatori) asendamiseks. Pseudonüümi tehnikad loovad otsese või tundlike identifikaatorite asemel iga individuaalse teabe subjekti jaoks ainulaadsed identifikaatorid.
- See võib genereerida juhuslikke väärtusi iseseisvalt, et vastata algsele ID -le, salvestada kaardistamistabeli ja kontrollida rangelt juurdepääsu kaardistamistabelile.
- Pseudonüümide tootmiseks võite kasutada ka krüptimist, kuid peate dekrüptimisvõtme korralikult hoidma;
Seda tehnoloogiat kasutatakse laialdaselt suure hulga sõltumatute andmekasutajate puhul, näiteks OpenId Avatud platvormi stsenaariumis, kus erinevad arendajad saavad sama kasutaja jaoks erinevaid OpenID -sid.
(5). Üldistamise tehnikad
Üldinetehnika viitab tuvastamise tehnikale, mis vähendab andmekogumis valitud atribuutide detailsust ja kirjeldab andmete üldisemat ja abstraktsemat kirjeldust. Üldinetehnoloogiat on lihtne rakendada ja see võib kaitsta rekorditaseme andmete autentsust. Seda kasutatakse tavaliselt andmetoodetes või andmearuannetes.
- ümardamine: hõlmab valitud atribuudi ümardamisbaasi valimist, näiteks üles- või allapoole kohtuekspertiisi, tulemusi 100, 500, 1K ja 10K
- Ülemine ja alumine kodeerimistehnikad: asendage lävi ülaltoodud (või allpool) väärtused, mis tähistavad ülemist (või alumist) taset, andes tulemuse "üle x" või "alla x"
(6). Randomiseerimise tehnikad
Omamoodi deidentifitseerimise tehnikana viitab randomiseerimise tehnoloogia atribuudi väärtuse muutmisele randomiseerimise kaudu, nii et pärast randomiseerimist erineb väärtus algsest reaalsest väärtusest. See protsess vähendab ründaja võimet tuletada atribuudi väärtust muudest atribuudi väärtustest samades andmekirjas, kuid mõjutab saadud andmete autentsust, mis on tavaline tootmistesti andmetega.
Postiaeg: 27-2022