Deduplicarea datelor este o tehnologie de stocare populară și populară care optimizează capacitatea de stocare. Elimină datele redundante prin eliminarea datelor duplicate din setul de date, lăsând o singură copie. După cum se arată în figura de mai jos. Această tehnologie poate reduce considerabil nevoia de spațiu de stocare fizică pentru a satisface cererea tot mai mare de stocare a datelor. Tehnologia deduplicare poate aduce multe beneficii practice, inclusiv în principal următoarele aspecte:
(1) | Îndeplinește cerințele privind ROI (Rentabilitatea Investiției)/TCO (Costul Total de Proprietate); |
(2) | Creșterea rapidă a datelor poate fi controlată eficient; |
(3) | Creșterea spațiului de depozitare eficient și îmbunătățirea eficienței depozitării; |
(4) | Economisiți costul total de depozitare și costul de gestionare; |
(5) | Economisiți lățimea de bandă a rețelei pentru transmisia de date; |
(6) | Economisiți costuri de operare și întreținere, cum ar fi spațiul, alimentarea cu energie electrică și răcirea. |
Tehnologia Dedupe este utilizată pe scară largă în sistemele de backup și arhivare a datelor, deoarece există o mulțime de date duplicate după mai multe backup-uri ale datelor, ceea ce este foarte potrivit pentru această tehnologie. De fapt, tehnologia dedupe poate fi utilizată în multe situații, inclusiv date online, date near-line și sisteme de stocare a datelor offline. Poate fi implementată în sisteme de fișiere, manageri de volume, NAS și sans. Dedupe poate fi utilizat și pentru recuperarea în caz de dezastru, transmiterea și sincronizarea datelor, deoarece tehnologia de compresie a datelor poate fi utilizată pentru ambalarea datelor. Tehnologia Dedupe poate ajuta multe aplicații să reducă stocarea datelor, să economisească lățime de bandă a rețelei, să îmbunătățească eficiența stocării, să reducă fereastra de backup și să economisească costuri.
Deduplicarea are două dimensiuni principale: ratele de deduplicare și performanța. Performanța deduplicației depinde de tehnologia specifică de implementare, în timp ce rata de deduplicare este determinată de caracteristicile datelor în sine și de modelele aplicației, așa cum se arată în tabelul de mai jos. Furnizorii de stocare raportează în prezent rate de deduplicare cuprinse între 20:1 și 500:1.
Rată ridicată de deduplicare | Rată scăzută de deduplicare |
Date create de utilizator | Date din lumea naturală |
Rată redusă de modificare a datelor | Rata mare de modificare a datelor |
Date de referință, date inactive | Date active |
Aplicație cu rată redusă de modificare a datelor | Aplicație cu rată mare de modificare a datelor |
Copiere de rezervă completă a datelor | Copiere de rezervă incrementală a datelor |
Stocarea pe termen lung a datelor | Stocarea datelor pe termen scurt |
Gamă largă de aplicații de date | Gamă mică de aplicații de date |
Prelucrarea continuă a datelor de afaceri | Prelucrarea datelor generale de afaceri |
Segmentarea datelor mici | Segmentarea Big Data |
Extindeți segmentarea datelor | Segmentarea datelor cu lungime fixă |
Conținutul datelor perceput | Conținutul datelor este necunoscut |
Deduplicarea datelor temporale | Deduplicarea datelor spațiale |
Puncte de implementare a deduplicațiilor
La dezvoltarea sau aplicarea tehnologiei Dedupe ar trebui luați în considerare diverși factori, deoarece acești factori afectează în mod direct performanța și eficacitatea acesteia.
(1) | Ce | Ce date sunt deponderate? |
(2) | Când | Când va fi eliminată greutatea? |
(3) | Unde | Unde este eliminarea în greutate? |
(4) | Cum | Cum să reduci greutatea? |
Tehnologie cheie de deduplicare
Procesul de deduplicare al unui sistem de stocare este, în general, următorul: mai întâi, fișierul de date este împărțit într-un set de date, pentru fiecare bloc de date se calculează amprenta digitală, iar apoi, pe baza cuvintelor cheie de căutare hash ale amprentei digitale, potrivirea indică datele pentru blocurile de date duplicate, stochând doar numărul index al blocului de date, altfel înseamnă că blocul de date este singura parte a unui bloc nou, stocând blocul de date și creând metainformații relevante. Astfel, un fișier fizic din sistemul de stocare corespunde unei reprezentări logice a unui set de metadate FP. La citirea fișierului, se citește mai întâi fișierul logic, apoi, conform secvenței FP, se extrage blocul de date corespunzător din sistemul de stocare și se restaurează copia fișierului fizic. Din procesul de mai sus se poate observa că tehnologiile cheie ale deduplicării includ în principal segmentarea blocurilor de date ale fișierelor, calcularea amprentei digitale a blocurilor de date și recuperarea blocurilor de date.
(1) Segmentarea blocurilor de date ale fișierelor
(2) Calculul amprentei digitale a blocului de date
(3) Recuperarea blocurilor de date
Pentru a găsi aceste modele recomandate pentru a începe deduplicarea pachetelor de rețea:
Mylinking™ Broker de pachete de rețea (NPB) ML-NPB-640048*10GE SFP+ plus 4*40GE/100GE QSFP28, Max 880Gbps
Mylinking™ Broker de pachete de rețea (NPB) ML-NPB-56606*40GE/100GE QSFP28 plus 48*10GE/25GE SFP28, Max. 1.8 Tbps
Mylinking™ Broker de pachete de rețea (NPB) ML-NPB-506048*10GE SFP+ plus 2*40GE QSFP, Max 560Gbps
Mylinking™ Broker de pachete de rețea (NPB) ML-NPB-486048*10GE SFP+, Max 480Gbps, Funcție Plus
Mylinking™ Broker de pachete de rețea (NPB) ML-NPB-481048*10GE SFP+, maxim 480 Gbps
Mylinking™ Broker de pachete de rețea (NPB) ML-NPB-2410P24*10GE SFP+, Max 240Gbps, Funcție DPI
Mylinking™ Broker de pachete de rețea (NPB) ML-NPB-6400
48*10GE SFP+ plus 4*40GE/100GE QSFP28, Max 880Gbps
Data publicării: 18 oct. 2022