เทคโนโลยีการปิดบังข้อมูลและโซลูชันในเครือข่ายนายหน้าแพ็คเก็ตคืออะไร?

1. แนวคิดของการปิดบังข้อมูล

การปิดบังข้อมูลเป็นที่รู้จักกันในชื่อการปิดบังข้อมูล มันเป็นวิธีการทางเทคนิคในการแปลงแก้ไขหรือครอบคลุมข้อมูลที่ละเอียดอ่อนเช่นหมายเลขโทรศัพท์มือถือหมายเลขบัตรธนาคารและข้อมูลอื่น ๆ เมื่อเราได้ให้กฎและนโยบายการปิดบัง เทคนิคนี้ใช้เป็นหลักในการป้องกันข้อมูลที่ละเอียดอ่อนจากการใช้โดยตรงในสภาพแวดล้อมที่ไม่น่าเชื่อถือ

หลักการการปิดบังข้อมูล: การปิดบังข้อมูลควรรักษาลักษณะข้อมูลดั้งเดิมกฎเกณฑ์ทางธุรกิจและความเกี่ยวข้องของข้อมูลเพื่อให้แน่ใจว่าการพัฒนาการทดสอบและการวิเคราะห์ข้อมูลจะไม่ได้รับผลกระทบจากการปิดบัง ตรวจสอบความสอดคล้องของข้อมูลและความถูกต้องก่อนและหลังการปิดบัง

2. การจัดประเภทการปิดบังข้อมูล

การปิดบังข้อมูลสามารถแบ่งออกเป็นการปิดบังข้อมูลแบบสแตติก (SDM) และการปิดบังข้อมูลแบบไดนามิก (DDM)

การปิดบังข้อมูลแบบคงที่ (SDM): การปิดบังข้อมูลแบบคงที่ต้องมีการจัดตั้งฐานข้อมูลสภาพแวดล้อมที่ไม่ได้ผลิตใหม่เพื่อแยกออกจากสภาพแวดล้อมการผลิต ข้อมูลที่ละเอียดอ่อนถูกดึงออกมาจากฐานข้อมูลการผลิตแล้วเก็บไว้ในฐานข้อมูลที่ไม่ใช่การผลิต ด้วยวิธีนี้ข้อมูล desensitized ถูกแยกออกจากสภาพแวดล้อมการผลิตซึ่งตรงกับความต้องการทางธุรกิจและสร้างความมั่นใจในความปลอดภัยของข้อมูลการผลิต

SDM

การปิดบังข้อมูลแบบไดนามิก (DDM): โดยทั่วไปจะใช้ในสภาพแวดล้อมการผลิตเพื่อ desensitize ข้อมูลที่ละเอียดอ่อนแบบเรียลไทม์ บางครั้งจำเป็นต้องมีการปิดบังระดับที่แตกต่างกันในการอ่านข้อมูลที่ละเอียดอ่อนเดียวกันในสถานการณ์ที่แตกต่างกัน ตัวอย่างเช่นบทบาทและสิทธิ์ที่แตกต่างกันอาจใช้แผนการปิดบังที่แตกต่างกัน

DDM

การรายงานข้อมูลและผลิตภัณฑ์ข้อมูลการปิดบัง

สถานการณ์ดังกล่าวส่วนใหญ่รวมถึงผลิตภัณฑ์ตรวจสอบข้อมูลภายในหรือป้ายโฆษณาผลิตภัณฑ์ข้อมูลภายนอกและรายงานจากการวิเคราะห์ข้อมูลเช่นรายงานทางธุรกิจและการตรวจสอบโครงการ

การรายงานข้อมูลการปิดบังผลิตภัณฑ์

3. โซลูชันการปิดบังข้อมูล

รูปแบบการปิดบังข้อมูลทั่วไปรวมถึง: การทำให้เป็นโมฆะ, ค่าสุ่ม, การเปลี่ยนข้อมูล, การเข้ารหัสแบบสมมาตร, ค่าเฉลี่ย, ชดเชยและการปัดเศษ ฯลฯ

การทำให้เป็นโมฆะ: การทำให้เป็นโมฆะหมายถึงการเข้ารหัสการตัดทอนหรือการซ่อนข้อมูลที่ละเอียดอ่อน โครงการนี้มักจะแทนที่ข้อมูลจริงด้วยสัญลักษณ์พิเศษ (เช่น *) การดำเนินการนั้นง่าย แต่ผู้ใช้ไม่สามารถรู้รูปแบบของข้อมูลต้นฉบับซึ่งอาจส่งผลกระทบต่อแอปพลิเคชันข้อมูลที่ตามมา

ค่าสุ่ม: ค่าสุ่มหมายถึงการแทนที่ข้อมูลที่ละเอียดอ่อนแบบสุ่ม (ตัวเลขแทนที่ตัวเลขตัวอักษรแทนที่ตัวอักษรและอักขระแทนที่อักขระ) วิธีการปิดบังนี้จะช่วยให้มั่นใจว่ารูปแบบของข้อมูลที่ละเอียดอ่อนในระดับหนึ่งและอำนวยความสะดวกในการใช้งานข้อมูลที่ตามมา อาจจำเป็นต้องใช้พจนานุกรมการปิดบังสำหรับคำที่มีความหมายบางอย่างเช่นชื่อของผู้คนและสถานที่

การเปลี่ยนข้อมูล: การแทนที่ข้อมูลคล้ายกับการปิดบังของค่า NULL และแบบสุ่มยกเว้นว่าแทนที่จะใช้อักขระพิเศษหรือค่าสุ่มข้อมูลการปิดบังจะถูกแทนที่ด้วยค่าที่เฉพาะเจาะจง

การเข้ารหัสแบบสมมาตร: การเข้ารหัสแบบสมมาตรเป็นวิธีการปิดบังแบบย้อนกลับได้พิเศษ มันเข้ารหัสข้อมูลที่ละเอียดอ่อนผ่านปุ่มเข้ารหัสและอัลกอริทึม รูปแบบ ciphertext สอดคล้องกับข้อมูลต้นฉบับในกฎเชิงตรรกะ

เฉลี่ย: รูปแบบเฉลี่ยมักใช้ในสถานการณ์ทางสถิติ สำหรับข้อมูลเชิงตัวเลขเราจะคำนวณค่าเฉลี่ยของพวกเขาก่อนจากนั้นจะกระจายค่า desensitized รอบค่าเฉลี่ยดังนั้นการรักษาผลรวมของค่าคงที่ของข้อมูล

ชดเชยและปัดเศษ: วิธีนี้เปลี่ยนข้อมูลดิจิตอลโดยการเปลี่ยนแปลงแบบสุ่ม การปัดเศษออฟเซ็ตช่วยให้มั่นใจได้ถึงความถูกต้องโดยประมาณของช่วงในขณะที่รักษาความปลอดภัยของข้อมูลซึ่งใกล้เคียงกับข้อมูลจริงมากกว่าแผนการก่อนหน้านี้และมีความสำคัญอย่างยิ่งในสถานการณ์ของการวิเคราะห์ข้อมูลขนาดใหญ่

ML-NPB-5660- 数据脱敏

รุ่นแนะนำ "ML-NPB-5660"สำหรับการปิดบังข้อมูล

4. เทคนิคการปิดบังข้อมูลที่ใช้กันทั่วไป

(1). เทคนิคทางสถิติ

การสุ่มตัวอย่างข้อมูลและการรวมข้อมูล

- การสุ่มตัวอย่างข้อมูล: การวิเคราะห์และการประเมินผลของชุดข้อมูลต้นฉบับโดยเลือกชุดย่อยตัวแทนของชุดข้อมูลเป็นวิธีที่สำคัญในการปรับปรุงประสิทธิภาพของเทคนิคการระบุตัวตน

- การรวมข้อมูล: ในการรวบรวมเทคนิคทางสถิติ (เช่นการรวมการนับการเฉลี่ยสูงสุดและต่ำสุด) ใช้กับแอตทริบิวต์ใน microdata ผลลัพธ์เป็นตัวแทนของบันทึกทั้งหมดในชุดข้อมูลต้นฉบับ

(2). การเข้ารหัสลับ

การเข้ารหัสเป็นวิธีทั่วไปในการ desensitize หรือเพิ่มประสิทธิภาพของการ desensitization อัลกอริทึมการเข้ารหัสประเภทต่าง ๆ สามารถบรรลุผล desensitization ที่แตกต่างกัน

- การเข้ารหัสที่กำหนดขึ้น: การเข้ารหัสแบบสมมาตรแบบไม่สุ่ม มันมักจะประมวลผลข้อมูล ID และสามารถถอดรหัสและกู้คืน ciphertext ไปยัง ID ดั้งเดิมเมื่อจำเป็น แต่คีย์จำเป็นต้องได้รับการปกป้องอย่างเหมาะสม

- การเข้ารหัสที่กลับไม่ได้: ฟังก์ชั่นแฮชใช้ในการประมวลผลข้อมูลซึ่งมักจะใช้สำหรับข้อมูล ID ไม่สามารถถอดรหัสได้โดยตรงและต้องบันทึกความสัมพันธ์การทำแผนที่ นอกจากนี้เนื่องจากคุณลักษณะของฟังก์ชันแฮชอาจเกิดการชนกันของข้อมูล

- การเข้ารหัส homomorphic: ใช้อัลกอริทึม homomorphic ciphertext คุณลักษณะของมันคือผลลัพธ์ของการดำเนินการ ciphertext นั้นเหมือนกับการดำเนินการธรรมดาหลังจากถอดรหัส ดังนั้นจึงมักใช้ในการประมวลผลฟิลด์ตัวเลข แต่ไม่ได้ใช้กันอย่างแพร่หลายเพื่อเหตุผลด้านประสิทธิภาพ

(3). เทคโนโลยีระบบ

เทคโนโลยีการปราบปรามลบหรือป้องกันรายการข้อมูลที่ไม่ตรงตามการป้องกันความเป็นส่วนตัว แต่ไม่ได้เผยแพร่

- การปิดบัง: มันหมายถึงวิธีการ desensitization ที่พบบ่อยที่สุดในการปกปิดค่าแอตทริบิวต์เช่นหมายเลขฝ่ายตรงข้ามบัตรประจำตัวประชาชนจะถูกทำเครื่องหมายด้วยเครื่องหมายดอกจันหรือที่อยู่ถูกตัดทอน

- การปราบปรามในพื้นที่: หมายถึงกระบวนการลบค่าแอตทริบิวต์เฉพาะ (คอลัมน์), ลบเขตข้อมูลที่ไม่จำเป็น;

- บันทึกการปราบปราม: หมายถึงกระบวนการลบระเบียนเฉพาะ (แถว), การลบบันทึกข้อมูลที่ไม่จำเป็น

(4). เทคโนโลยีนามแฝง

Pseudomanning เป็นเทคนิคการยกเลิกการระบุที่ใช้นามแฝงเพื่อแทนที่ตัวระบุโดยตรง (หรือตัวระบุที่ละเอียดอ่อนอื่น ๆ ) เทคนิค Pseudonym สร้างตัวระบุที่ไม่ซ้ำกันสำหรับข้อมูลแต่ละตัวข้อมูลแต่ละรายการแทนที่จะเป็นตัวระบุโดยตรงหรือละเอียดอ่อน

- สามารถสร้างค่าสุ่มได้อย่างอิสระเพื่อให้สอดคล้องกับ ID ดั้งเดิมบันทึกตารางการแมปและควบคุมการเข้าถึงตารางการแมปอย่างเคร่งครัด

- คุณยังสามารถใช้การเข้ารหัสเพื่อผลิตนามแฝง แต่จำเป็นต้องเก็บรหัสถอดรหัสไว้อย่างถูกต้อง

เทคโนโลยีนี้ใช้กันอย่างแพร่หลายในกรณีของผู้ใช้ข้อมูลอิสระจำนวนมากเช่น OpenID ในสถานการณ์จำลองแพลตฟอร์มแบบเปิดซึ่งนักพัฒนาที่แตกต่างกันได้รับ openID ที่แตกต่างกันสำหรับผู้ใช้รายเดียวกัน

(5). เทคนิคการวางนัยทั่วไป

เทคนิคการวางนัยทั่วไปหมายถึงเทคนิคการระบุตัวตนที่ช่วยลดความละเอียดของแอตทริบิวต์ที่เลือกในชุดข้อมูลและให้คำอธิบายทั่วไปและเป็นนามธรรมมากขึ้นของข้อมูล เทคโนโลยีการวางนัยทั่วไปนั้นใช้งานง่ายและสามารถปกป้องความถูกต้องของข้อมูลระดับบันทึก มักใช้ในผลิตภัณฑ์ข้อมูลหรือรายงานข้อมูล

- การปัดเศษ: เกี่ยวข้องกับการเลือกฐานการปัดเศษสำหรับแอตทริบิวต์ที่เลือกเช่นนิติวิทยาศาสตร์ขึ้นหรือลง, ให้ผลลัพธ์ 100, 500, 1k และ 10k

- เทคนิคการเข้ารหัสด้านบนและด้านล่าง: แทนที่ค่าด้านบน (หรือต่ำกว่า) เกณฑ์ด้วยเกณฑ์ที่แสดงถึงระดับสูงสุด (หรือล่าง) ซึ่งให้ผลลัพธ์ของ "เหนือ x" หรือ "ต่ำกว่า x"

(6). เทคนิคการสุ่ม

ในฐานะที่เป็นเทคนิคการยกเลิกการระบุเทคโนโลยีการสุ่มหมายถึงการปรับเปลี่ยนค่าของแอตทริบิวต์ผ่านการสุ่มเพื่อให้ค่าหลังการสุ่มแตกต่างจากค่าจริงดั้งเดิม กระบวนการนี้จะช่วยลดความสามารถของผู้โจมตีในการได้รับค่าแอตทริบิวต์จากค่าแอตทริบิวต์อื่น ๆ ในบันทึกข้อมูลเดียวกัน แต่มีผลต่อความถูกต้องของข้อมูลที่เกิดขึ้นซึ่งเป็นเรื่องธรรมดากับข้อมูลการทดสอบการผลิต


เวลาโพสต์: ก.ย. -27-2022