การกำจัดข้อมูลซ้ำซ้อนเป็นเทคโนโลยีการจัดเก็บข้อมูลที่นิยมใช้กันอย่างแพร่หลาย ซึ่งช่วยเพิ่มประสิทธิภาพความจุในการจัดเก็บข้อมูล โดยจะกำจัดข้อมูลซ้ำซ้อนโดยการลบข้อมูลซ้ำซ้อนออกจากชุดข้อมูล ทำให้เหลือเพียงสำเนาเดียว ดังที่แสดงในภาพด้านล่าง เทคโนโลยีนี้สามารถลดความต้องการพื้นที่จัดเก็บข้อมูลทางกายภาพลงได้อย่างมาก เพื่อตอบสนองความต้องการพื้นที่จัดเก็บข้อมูลที่เพิ่มขึ้น เทคโนโลยีการกำจัดข้อมูลซ้ำซ้อนสามารถนำมาซึ่งประโยชน์ในทางปฏิบัติมากมาย โดยส่วนใหญ่แล้วจะรวมถึงด้านต่อไปนี้:
(1) | ตอบสนองข้อกำหนด ROI (ผลตอบแทนจากการลงทุน) / TCO (ต้นทุนรวมของการเป็นเจ้าของ) |
(2) | การเติบโตอย่างรวดเร็วของข้อมูลสามารถควบคุมได้อย่างมีประสิทธิภาพ |
(3) | เพิ่มพื้นที่จัดเก็บที่มีประสิทธิภาพและปรับปรุงประสิทธิภาพในการจัดเก็บ; |
(4) | ประหยัดต้นทุนการจัดเก็บและต้นทุนการจัดการรวม; |
(5) | บันทึกแบนด์วิดท์เครือข่ายในการส่งข้อมูล; |
(6) | ประหยัดค่าใช้จ่ายในการดำเนินงานและการบำรุงรักษา เช่น พื้นที่ แหล่งจ่ายไฟ และการทำความเย็น |
เทคโนโลยี Dedupe ถูกนำมาใช้อย่างแพร่หลายในระบบสำรองข้อมูลและจัดเก็บข้อมูลถาวร เนื่องจากมีข้อมูลซ้ำซ้อนจำนวนมากหลังจากการสำรองข้อมูลหลายครั้ง ซึ่งเหมาะสมอย่างยิ่งกับเทคโนโลยีนี้ อันที่จริง เทคโนโลยี Dedupe สามารถใช้งานได้ในหลายสถานการณ์ ทั้งข้อมูลออนไลน์ ข้อมูลแบบ Near-line และระบบจัดเก็บข้อมูลแบบออฟไลน์ สามารถนำไปใช้งานในระบบไฟล์ ตัวจัดการวอลุ่ม ระบบ NAS และแบบ Sans ได้ นอกจากนี้ Dedupe ยังสามารถใช้กู้คืนข้อมูลหลังภัยพิบัติ การรับส่งข้อมูล และการซิงโครไนซ์ข้อมูล เนื่องจากเทคโนโลยีการบีบอัดข้อมูลสามารถนำมาใช้กับการจัดแพคเกจข้อมูลได้ เทคโนโลยี Dedupe ช่วยให้แอปพลิเคชันต่างๆ ลดพื้นที่จัดเก็บข้อมูล ประหยัดแบนด์วิดท์เครือข่าย ปรับปรุงประสิทธิภาพพื้นที่จัดเก็บข้อมูล ลดระยะเวลาการสำรองข้อมูล และประหยัดต้นทุน
การกำจัดข้อมูลซ้ำซ้อนมีสองมิติหลัก: อัตราส่วนการกำจัดข้อมูลซ้ำซ้อนและประสิทธิภาพ ประสิทธิภาพของการกำจัดข้อมูลซ้ำซ้อนขึ้นอยู่กับเทคโนโลยีการใช้งานเฉพาะ ในขณะที่อัตราการกำจัดข้อมูลซ้ำซ้อนจะถูกกำหนดโดยคุณลักษณะของข้อมูลนั้นเองและรูปแบบแอปพลิเคชัน ดังที่แสดงในตารางด้านล่าง ปัจจุบันผู้จำหน่ายระบบจัดเก็บข้อมูลรายงานอัตราการกำจัดข้อมูลซ้ำซ้อนตั้งแต่ 20:1 ถึง 500:1
อัตราการขจัดข้อมูลซ้ำซ้อนสูง | อัตราการขจัดข้อมูลซ้ำซ้อนต่ำ |
ข้อมูลที่ผู้ใช้สร้างขึ้น | ข้อมูลจากธรรมชาติ |
อัตราการเปลี่ยนแปลงข้อมูลต่ำ | อัตราการเปลี่ยนแปลงข้อมูลสูง |
ข้อมูลอ้างอิง ข้อมูลที่ไม่ได้ใช้งาน | ข้อมูลที่ใช้งานอยู่ |
แอปพลิเคชันที่มีอัตราการเปลี่ยนแปลงข้อมูลต่ำ | แอปพลิเคชันที่มีอัตราการเปลี่ยนแปลงข้อมูลสูง |
สำรองข้อมูลทั้งหมด | การสำรองข้อมูลแบบเพิ่มหน่วย |
การจัดเก็บข้อมูลระยะยาว | การจัดเก็บข้อมูลระยะสั้น |
แอปพลิเคชั่นข้อมูลหลากหลาย | แอปพลิเคชันข้อมูลมีขอบเขตขนาดเล็ก |
การประมวลผลข้อมูลทางธุรกิจอย่างต่อเนื่อง | การประมวลผลข้อมูลทางธุรกิจทั่วไป |
การแบ่งส่วนข้อมูลขนาดเล็ก | การแบ่งส่วนข้อมูลขนาดใหญ่ |
การแบ่งส่วนข้อมูลแบบยาว | การแบ่งส่วนข้อมูลความยาวคงที่ |
เนื้อหาข้อมูลที่รับรู้ | เนื้อหาข้อมูลไม่ทราบ |
การขจัดข้อมูลซ้ำซ้อนตามเวลา | การกำจัดข้อมูลซ้ำซ้อนในเชิงพื้นที่ |
จุดการนำข้อมูลซ้ำไปใช้
มีปัจจัยต่างๆ มากมายที่ควรพิจารณาเมื่อพัฒนาหรือใช้เทคโนโลยี Dedupe เนื่องจากปัจจัยเหล่านี้ส่งผลโดยตรงต่อประสิทธิภาพและประสิทธิผลของเทคโนโลยี
(1) | อะไร | ข้อมูลใดบ้างที่ถูกลดน้ำหนัก? |
(2) | เมื่อไร | เมื่อไรน้ำหนักจะลดคะ? |
(3) | ที่ไหน | การกำจัดน้ำหนักอยู่ไหน? |
(4) | ยังไง | จะลดน้ำหนักอย่างไร? |
เทคโนโลยีคีย์ Dedupe
กระบวนการกำจัดข้อมูลซ้ำซ้อนของระบบจัดเก็บข้อมูลโดยทั่วไปมีดังนี้: ขั้นแรกไฟล์ข้อมูลจะถูกแบ่งออกเป็นชุดข้อมูลสำหรับแต่ละบล็อกของข้อมูลเพื่อคำนวณลายนิ้วมือ จากนั้นตามคำค้นหาแฮชลายนิ้วมือ การจับคู่จะระบุข้อมูลสำหรับบล็อกข้อมูลที่ซ้ำกัน เก็บเฉพาะหมายเลขดัชนีบล็อกข้อมูลเท่านั้น มิฉะนั้นจะหมายความว่าบล็อกข้อมูลนั้นเป็นชิ้นเดียวของบล็อกข้อมูลใหม่ จัดเก็บบล็อกข้อมูลและสร้างข้อมูลเมตาที่เกี่ยวข้อง ดังนั้น ไฟล์ทางกายภาพในระบบจัดเก็บข้อมูลจึงสอดคล้องกับการแสดงเชิงตรรกะของชุดข้อมูลเมตา FP เมื่ออ่านไฟล์ ให้อ่านไฟล์เชิงตรรกะก่อน จากนั้นตามลำดับ FP นำบล็อกข้อมูลที่สอดคล้องกันออกจากระบบจัดเก็บข้อมูล และกู้คืนสำเนาของไฟล์ทางกายภาพ จากกระบวนการข้างต้น จะเห็นได้ว่าเทคโนโลยีหลักของการกำจัดข้อมูลซ้ำซ้อนประกอบด้วยการแบ่งส่วนบล็อกข้อมูลไฟล์ การคำนวณลายนิ้วมือบล็อกข้อมูล และการดึงข้อมูลบล็อกข้อมูลเป็นหลัก
(1) การแบ่งส่วนบล็อกข้อมูลไฟล์
(2) การคำนวณลายนิ้วมือบล็อกข้อมูล
(3) การดึงข้อมูลแบบบล็อก
หากต้องการค้นหาโมเดลที่แนะนำเหล่านี้เพื่อเริ่มการทำ Network Packet Deduplication ของคุณ ให้ทำดังนี้:
Mylinking™ โบรกเกอร์แพ็กเก็ตเครือข่าย (NPB) ML-NPB-640048*10GE SFP+ บวก 4*40GE/100GE QSFP28 สูงสุด 880Gbps
Mylinking™ โบรกเกอร์แพ็กเก็ตเครือข่าย (NPB) ML-NPB-56606*40GE/100GE QSFP28 บวก 48*10GE/25GE SFP28 สูงสุด 1.8Tbps
Mylinking™ โบรกเกอร์แพ็กเก็ตเครือข่าย (NPB) ML-NPB-506048*10GE SFP+ บวก 2*40GE QSFP สูงสุด 560Gbps
Mylinking™ โบรกเกอร์แพ็กเก็ตเครือข่าย (NPB) ML-NPB-486048*10GE SFP+, สูงสุด 480Gbps, ฟังก์ชันพลัส
Mylinking™ โบรกเกอร์แพ็กเก็ตเครือข่าย (NPB) ML-NPB-481048*10GE SFP+ สูงสุด 480Gbps
Mylinking™ โบรกเกอร์แพ็กเก็ตเครือข่าย (NPB) ML-NPB-2410P24*10GE SFP+, สูงสุด 240Gbps, ฟังก์ชัน DPI
Mylinking™ โบรกเกอร์แพ็กเก็ตเครือข่าย (NPB) ML-NPB-6400
48*10GE SFP+ บวก 4*40GE/100GE QSFP28 สูงสุด 880Gbps
เวลาโพสต์: 18 ต.ค. 2565