New Techniques for Ensuring the Long Term Integrity of
Digital Archives
Sangchul Song
Department of Electrical and Computer Engineering
Institute for Advanced Computer Studies
University of Maryland
College Park, MD 20742, USA
scsong@umd.edu
Joseph JaJa
Department of Electrical and Computer Engineering
Institute for Advanced Computer Studies
University of Maryland
College Park, MD 20742, USA
joseph@umiacs.umd.edu
ABSTRACT
A large portion of the government, business, cultural, and
scientific digital data being created today needs to be archived
and preserved for future use of periods ranging from a few years
to decades and sometimes centuries. A fundamental requirement
of a long term archive is to ensure the integrity of its holdings. In
this paper, we develop a new methodology to address the integrity
of long term archives using rigorous cryptographic techniques.
Our approach involves the generation of a small-size integrity
token for each digital object to be archived, and some
cryptographic summary information based on all the objects
handled within a dynamic time period. We present a framework
that enables the continuous auditing of the holdings of the archive
depending on the policy set by the archive. Moreover, an
independent auditor will be able to verify the integrity of every
version of an archived digital object as well as link the current
version to the original form of the object when it was ingested
into the archive. We built a prototype system that is completely
independent of the archive’s underlying architecture, and tested it
on large scale data. We include in this paper some preliminary
results on the validation and performance of our prototype.
Categories and Subject Descriptors
H.3.7 [Information Storage and Retrieval]: Digital Libraries;
H.3.6 [Information Storage and Retrieval]: Library
Automation; H.3.4 [Information Storage and Retrieval]:
Systems and Software
General Terms
Algorithms, Reliability, Design, Security.
Keywords
Digital archives, data integrity, linked hashing, integrity audits.
1. INTRODUCTION
A large portion of the scientific, business, cultural, and
government digital information being created today needs to be
maintained and preserved for future use of periods ranging from a
few years to decades and sometimes centuries. Since the mid
nineties, the issue of long-term preservation of digital information
has received considerable attention by major archiving
communities, library organizations, government agencies,
scientific communities, and individual researchers. These studies
have identified major challenges regarding institutional and
business models, technology infrastructure, and social and legal
frameworks, which need to be addressed to achieve long-term
reliable access to digital information. One of the most challenging
problems identified through these studies is how to ensure the
integrity of the archive’s holdings throughout the lifetime of the
archive. Digital information is in general very fragile due to many
risks ranging from hardware and software failures to major
technology changes rendering current software and hardware
unusable, to the ever growing computer and networking security
risks. Note also that most of an archive’s holdings may be
accessed very infrequently, and hence several cycles of
technology evolution may occur in between accesses to digital
objects. In addition, there is also the possibility of human
mishandling of the archive holdings (such as operational errors)
as well as the possibility of natural hazards and disasters such as
fire and floods. Most of these problems may cause unnoticeable
changes to the archive, which may last for a long time before they
are detected.
Two additional factors should also be taken into account when
considering long-term digital archives. First, a number of
transformations can occur to a digital object during its lifetime.
For example, format obsolescence can lead to a migrative
transformation to a new format. Second, cryptographic techniques
that many current integrity checking mechanisms depend on are
likely to become less immune to potential attacks over time, and
hence they will need to be replaced by stronger techniques.
Therefore, these two problems need to be also addressed in any
approach to ensure the integrity of a long term archive.
A number of integrity checking techniques, such as those
described in [9], [15], [16], [17] and [19], have been described in
the literature. However, all these techniques fall far short of the
requirements of a long term digital archive. Other techniques have
been developed specifically for digital archive, including those
that appeared in [1], [4], [5], [8], [10], [13], [14], but none seems
to offer a solid approach that is applicable to the different
emerging architectures for digital archives (including centralized,
peer to peer, and distributed archives) and that is capable to
continually monitor and verify the integrity of the data in a cost
effective way.
The main focus of this paper is to develop a cost effective
methodology for ensuring the long-term integrity of digital
archives. More specifically, we introduce efficient cryptographic
techniques and related procedures to continually ensure the
integrity of the various objects held in the archive. In fact, our
The Proceedings of the 8th Annual International Digital Government Research Conference
57
methodology allows a third-party independent auditor to verify
the integrity of every version of an archived digital object as well
as link the current version to the original form of the object when
it was ingested into the archive.
Results (
Thai) 3:
[Copy]Copied!
เทคนิคใหม่สำหรับการประกันระยะยาวความซื่อสัตย์ของหอจดหมายเหตุดิจิตอล sangchul
เพลง
ภาควิชาวิศวกรรมไฟฟ้าและคอมพิวเตอร์วิศวกรรมคอมพิวเตอร์สถาบันเพื่อการศึกษาขั้นสูง
มหาวิทยาลัยแมรี่แลนด์ คอลเลจพาร์ค , MD 20742 USA
scsong @ UMD . edu
โจเซฟ จาจา ภาควิชาวิศวกรรมไฟฟ้าและคอมพิวเตอร์วิศวกรรมคอมพิวเตอร์ศึกษา
สถาบันขั้นสูง มหาวิทยาลัย แมริแลนด์
College Park , MD 20742 USA
โจเซฟ @ umiacs . UMD . edu นามธรรม
ส่วนใหญ่ของรัฐบาล ธุรกิจ วัฒนธรรม และวิทยาศาสตร์
ข้อมูลดิจิตอลถูกสร้างขึ้นในวันนี้ต้องการจะเก็บไว้
และเก็บรักษาไว้สำหรับใช้ในอนาคตของรอบระยะเวลาตั้งแต่ไม่กี่ปี
เพื่อทศวรรษและบางครั้งหลายศตวรรษ ความต้องการขั้นพื้นฐาน
ของระยะยาวเก็บเพื่อตรวจสอบความสมบูรณ์ของการถือครอง . ใน
กระดาษนี้เราพัฒนาวิธีการใหม่เพื่อแก้ไขความสมบูรณ์
จดหมายเหตุระยะยาวโดยใช้เทคนิคการเข้ารหัสลับที่เข้มงวด
วิธีการของเราเกี่ยวข้องกับรุ่นของขนาดเล็กสมบูรณ์
สำหรับแต่ละวัตถุแบบดิจิตอลจะถูกเก็บไว้ และบางปีสรุปข้อมูลตาม
จัดการวัตถุทั้งหมดภายในระยะเวลาที่แบบไดนามิก เราเสนอกรอบ
ที่ช่วยให้การตรวจสอบอย่างต่อเนื่องของผู้ถือครองของถาวร
ขึ้นอยู่กับนโยบายที่กำหนดโดยเก็บ ยิ่งกว่านั้น ,
ผู้สอบบัญชีอิสระจะสามารถตรวจสอบความสมบูรณ์ของทุกรุ่นของวัตถุแบบดิจิตอล
ที่เก็บถาวรเช่นเดียวกับการเชื่อมโยงรุ่นปัจจุบัน
กับรูปแบบเดิมของวัตถุ เมื่อมันกิน
เข้าไปเก็บ เราสร้างระบบต้นแบบที่สมบูรณ์
อิสระของเอกสารอ้างอิงสถาปัตยกรรม และทดสอบ
เมื่อข้อมูลมีขนาดใหญ่ เรารวมไว้ในบทความนี้บางผลเบื้องต้น
เมื่อตรวจสอบและประสิทธิภาพของต้นแบบของเรา และประเภทวิชาใน h.3.7
[ สารสนเทศ ] : ห้องสมุดดิจิตอล ;
h.3.6 [ สารสนเทศ ] : ห้องสมุดอัตโนมัติ
; การจัดเก็บและสืบค้นข้อมูล h.3.4 [
]ระบบซอฟต์แวร์
และเงื่อนไขทั่วไปของความน่าเชื่อถือ ออกแบบระบบรักษาความปลอดภัย
คำสำคัญ
ดิจิตอลจดหมายเหตุ , ความสมบูรณ์ของข้อมูลที่เชื่อมโยงบริการตรวจสอบความสมบูรณ์ .
1 บทนำ
ส่วนใหญ่ของวิทยาศาสตร์ , ธุรกิจ , วัฒนธรรม และรัฐบาลข้อมูลดิจิทัลที่ถูกสร้างขึ้นในวันนี้
ต้องการที่จะรักษาและเก็บรักษาไว้เพื่อใช้ในอนาคตของช่วงเวลาตั้งแต่
ปี สองสามทศวรรษ และบางครั้งหลายศตวรรษ ตั้งแต่ nineties กลาง
ปัญหาของการเก็บรักษาระยะยาวของข้อมูลดิจิตอลที่ได้รับความสนใจมาก โดยหลักการจัดเก็บ
ชุมชน , องค์กร , หน่วยงานราชการห้องสมุด
ชุมชนวิทยาศาสตร์และนักวิจัยแต่ละคน การศึกษาเหล่านี้ได้ระบุความท้าทายเกี่ยวกับสถาบันหลัก
และโมเดลธุรกิจโครงสร้างพื้นฐานด้านเทคโนโลยี และ โครงสร้างทางสังคม และทางกฎหมาย
ซึ่งต้องได้รับการแก้ไขเพื่อให้บรรลุการเข้าถึงความน่าเชื่อถือระยะยาว
ข้อมูลดิจิตอล หนึ่งในความท้าทายมากที่สุดปัญหา
ระบุผ่านการศึกษาเหล่านี้เป็นวิธีที่ให้ความสมบูรณ์ของเอกสาร
) ตลอดอายุการเก็บ ข้อมูลดิจิตอลในทั่วไปที่เปราะบางมากเนื่องจากหลาย
ความเสี่ยงตั้งแต่ฮาร์ดแวร์ ซอฟต์แวร์ และการเปลี่ยนแปลงเทคโนโลยีการแสดงผลความล้มเหลวหลัก
ปัจจุบันซอฟต์แวร์และฮาร์ดแวร์
ใช้ไม่ได้กับที่เคยเติบโตและความเสี่ยง
คอมพิวเตอร์ระบบเครือข่าย ยังทราบว่าส่วนใหญ่ของการจัดเก็บและอาจจะเข้าถึงมาก
ไม่บ่อย และด้วยเหตุนี้หลายรอบ
วิวัฒนาการทางเทคโนโลยีที่อาจเกิดขึ้นในระหว่างการเข้าถึงวัตถุดิจิตอล
นอกจากนี้นอกจากนี้ยังมีความเป็นไปได้ของมนุษย์
mishandling ของถาวร HOLDINGS ( เช่นข้อผิดพลาดปฏิบัติการ )
เช่นเดียวกับความเป็นไปได้ของภัยธรรมชาติและภัยพิบัติเช่น
ไฟไหม้และน้ำท่วม ส่วนใหญ่ของปัญหาเหล่านี้อาจก่อให้เกิดการเปลี่ยนแปลง unnoticeable
เพื่อเก็บถาวร ซึ่งอาจจะสุดท้ายเป็นเวลานานก่อนที่พวกเขาจะพบ
.
สองปัจจัยเพิ่มเติม นอกจากนี้ควรพิจารณาเมื่อ
พิจารณาหอจดหมายเหตุดิจิตอลระยะยาว แรก , จํานวนของ
งสามารถเกิดขึ้นได้กับวัตถุดิจิตอลในช่วงชีวิตของมัน
ตัวอย่างเช่นรูปแบบล้าสมัย สามารถนำไปสู่การเปลี่ยนแปลง migrative
กับรูปแบบใหม่ 2 เทคนิคการเข้ารหัสลับที่หลายกระแสความสมบูรณ์ของการตรวจสอบกลไก
พึ่งมีแนวโน้มที่จะกลายเป็นภูมิคุ้มกันน้อยกว่าการโจมตีที่อาจเกิดขึ้นตลอดเวลา และ
ด้วยเหตุนี้พวกเขาจะต้องถูกแทนที่ด้วยเทคนิคที่แข็งแกร่ง .
ดังนั้นเหล่านี้สองปัญหาที่ต้อง addressed ในใด ๆนอกจากนี้
วิธีการตรวจสอบความสมบูรณ์ของข้อมูลที่เก็บในระยะยาว การตรวจสอบจำนวนของเทคนิค เช่น
ที่อธิบายไว้ใน [ 9 ] , [ 15 ] [ 16 ] , [ 17 ] [ 19 ] ,
ได้ถูกอธิบายไว้ในวรรณกรรม อย่างไรก็ตามเทคนิคเหล่านี้อยู่ห่างไกลจาก
ความต้องการของระยะยาวดิจิตอลเก็บ เทคนิคอื่น ๆได้ถูกพัฒนาขึ้นโดยเฉพาะสำหรับเก็บ
ดิจิตอล รวมทั้งที่ปรากฏใน [ 1 ] , [ 4 ] , [ 5 ] , [ 8 ] , [ 10 ] [ 13 ] [ 14 ] แต่ดูเหมือนว่า
เพื่อเสนอวิธีการที่แข็งที่ใช้ได้กับแตกต่างกัน
ใหม่สถาปัตยกรรมสำหรับหอจดหมายเหตุดิจิตอล ( รวมทั้งเป็นศูนย์
เพื่อนเพื่อเพื่อน และแจกจ่ายเอกสารที่มีความสามารถ
)ตรวจสอบอย่างต่อเนื่อง และตรวจสอบความสมบูรณ์ของข้อมูลในวิธีที่มีประสิทธิภาพค่าใช้จ่าย
.
จุดสนใจหลักของบทความนี้คือเพื่อพัฒนาเป็นค่าใช้จ่ายที่มีประสิทธิภาพวิธีการเพื่อให้มั่นใจความสมบูรณ์ในระยะยาว
ของหอจดหมายเหตุดิจิตอล . มากขึ้นโดยเฉพาะ เราแนะนำเทคนิคการเข้ารหัสที่มีประสิทธิภาพและขั้นตอนที่เกี่ยวข้องอย่างต่อเนื่อง
รับประกันความสมบูรณ์ของวัตถุต่าง ๆที่จัดขึ้นในการเก็บ ในความเป็นจริงของเรา
การดำเนินการของการประชุมนานาชาติประจำปีครั้งที่ 8 ดิจิตอล
วิธีการวิจัยภาครัฐ 57 ให้บุคคลที่สามอิสระเพื่อตรวจสอบความสมบูรณ์ของผู้สอบบัญชี
ทุกรุ่นดิจิตอลที่เก็บถาวรวัตถุเช่นกัน
เป็นลิงค์รุ่นปัจจุบันกับรูปแบบเดิมของวัตถุเมื่อ
มันกลืนกินเข้าไปเก็บ
Being translated, please wait..
