السعودية

مواقع الويب,جمعها وأرشفتها للوصول إلى الأبحاث والحفاظ عليها على المدى الطويل

تتعلق هذه المناقشة بمواقع الويب حيث يمكن جمعها وأرشفتها للوصول إلى الأبحاث والحفاظ عليها على المدى الطويل. ما هو على المحك هو مواقع الحصاد لأنها تقدم نفسها للمستخدمين في وقت معين.

التنسيقات التي تمت مناقشتها هنا هي تلك التي قد تحتوي على نتائج الزحف إلى موقع ويب أو مجموعة من مواقع الويب ، وهو إجراء ديناميكي ناتج عن استخدام حزمة برامج (على سبيل المثال ، Heritrix) تستدعي صفحات الويب وتلتقطها في نشر النموذج على المستخدمين.

الهدف من نشاط أرشفة الويب عادةً هو جمع صفحات الويب ، كل منها يحتوي على موارد مضمنة مثل الصور والأصوات وما شابه ، بأكبر قدر ممكن من التكامل والتقاط بنية الارتباط بطريقة تسمح للباحث بتحديد ما الذي تم ربطه وما إذا تم أيضًا التقاط المورد المرتبط للربط به. قد يتم توجيه تركيز نشاط أرشفة الويب من خلال مفهوم موقع الويب . يجب فهم مصطلحات صفحة الويب وموقع الويب بطريقة مرنة. يتم توفير تعريف مفيد للصفحة في مقاييس أرشيف الويب: التعريفات والإطار(مسودة ، ديسمبر 2005) ، أعدها فريق التقاط الويب بمكتبة الكونغرس من أجل الاتحاد الدولي للحفاظ على الإنترنت (IIPC): “الصفحة هي مجموعة من موارد ويب واحدة أو أكثر يتوقع تقديمها في وقت واحد ، والتي يمكن تحديدها بواسطة URI للعنصر الذي يدمج الموارد الأخرى في المجموعة. ” يقترح المستند نفسه التعريف التالي للموقع : “مجموعة من الموارد ذات الصلة فكريا في كثير من الأحيان (ولكن ليس دائمًا) يحدها التقسيم الفني ، مثل المحتوى من مجال ، والذي قد يتضمن العديد من المجالات ذات الصلة ، أو مجموعة فرعية من المحتوى من مضيف . ” من الناحية العملية ، غالبًا ما يصعب تحديد حدود موقع الويب.

للنظر في الوظائف المطلوبة للأشكال الرقمية المستخدمة لمواقع الويب الملتقطة ، من المفيد تقديم أمثلة على السيناريوهات والتصنيفات التي تم استخدامها لوصف أنشطة أرشفة الويب. في أرشفة المواقع الإلكترونية: الاعتبارات والاستراتيجيات العامة ، يميز Niels Brügger بين الأرشفة الدقيقة والماكرو.

الأرشفة
الكلية يتم تنفيذ الأرشفة الكلية على نطاق واسع ، عادة من قبل المؤسسات الكبيرة ، كما يقترح Brügger “من أجل أرشفة (جزء من) التراث الثقافي (الدولي).” يشارك أعضاء IIPC ، بما في ذلك مكتبة الكونغرس ، بشكل أساسي في الأرشفة الكلية. في Web Archive Metrics ، وهي مسودة أعدت لـ IIPC ، تميز Boyko بين مقاييس التجميعات المستندة إلى الإنترنت والتجميعات القائمة على التجميع لصفحات الويب.  تعكس الحاجة إلى مجموعتي المقاييس سيناريوهات مختلفة للاستخدام المستقبلي لصفحات الويب المؤرشفة. سيرغب بعض الباحثين في دراسة الويب كشبكة ، وتحليل أنماط الروابط والتغييرات بمرور الوقت. سيرغب الآخرون في تحديد موقع مواد من نوع معين (على سبيل المثال ، المدونات) أو صفحات مخصصة لموضوع معين. يتم تحديد نطاق بعض عمليات الأرشفة الكلية من خلال الخصائص القائمة على الإنترنت (مثل المجال الوطني). في حالات أخرى ، يتم تجميع التجميعات المستندة إلى المجموعة عن طريق الالتقاط الهادف للصفحات على أساس المعايير التي وضعها المنسق البشري ، وربما باستخدام مجموعة محددة مسبقًا من عناوين URL ، والقواعد التي تحاول الحد من الدرجة التي تصل إليها الموارد المرتبطة خارج الموقع يتم التقاطها أيضًا ، وحصاد الترددات بناءً على تكرار التحديث. فمثلا، قامت مكتبة الكونجرس بجمع مواقع الويب المتعلقة بأحداث معينة ، مثل الانتخابات والكوارث ، وفي عام 2006 تقوم بجمع مواقع الويب الخاصة بالمنظمات التي تبرعت أو التزمت بالتبرع بأوراق تنظيمية لقسم المخطوطات بها.  قد تكون عمليات التجميع المستندة إلى الإنترنت نتيجة لعملية أقل تحكمًا ، مثل أخذ عنوان URL لصفحة ويب ، واتباع الروابط التي يمكن الوصول إليها من تلك الصفحة ، وجمع تلك الصفحات.

 

تتضمن صيانة موقع الويب الخاص بك وجود استراتيجية مخصصة للنسخ الاحتياطي . في حين أن النسخ الاحتياطية ضرورية ، فهي ليست الطريقة الوحيدة للحفاظ على موقعك. الامتداد الطبيعي للنسخ الاحتياطي هو أرشفة موقع ويب – على الرغم من أنها عمليات تكميلية.

هناك عدة طرق مرنة لأرشفة موقع ويب. والخبر السار هو أنها كلها سهلة الاستخدام ويمكن الوصول إليها. عليك فقط اختيار الحل المناسب لاحتياجاتك ومتطلباتك.

في هذا المنشور ، سنلقي نظرة على كيفية أرشفة موقع ويب aswagi.vip. سنستكشف أيضًا أنواع أرشفة مختلفة ستصادفك ، ونجمع بعضًا من أبرز أدوات أرشفة المواقع ، ونناقش بعض النصائح لأرشفة موقعك.

مقدمة لأرشفة المواقع الإلكترونية

أرشفة موقع على شبكة الإنترنت مثل aswagi.vip تعني حفظ المحتوى والبيانات والوسائط للرجوع إليها في المستقبل. باستخدام خدمة مخصصة مثل Wayback Machine (على الرغم من أننا سنصل إلى حلول أخرى لاحقًا) ، يمكنك عرض الإصدارات القديمة من موقع الويب.

على المستوى التقني ، تأخذ برامج الزحف لقطات من موقع الويب ، والذي يشكل الأرشيف نفسه. يمكنك الوصول إليه باستخدام تقويم بسيط وعرض كل تكرار بتنسيق مخطط زمني إذا كنت ترغب في ذلك.

أرشيف التقويم من Wayback Machine لموقع Kinsta.
أرشيف تقويم The Wayback Machine لموقع Kinsta على الويب.

بالنسبة لسبب وجود حلول مثل Wayback Machine ، علينا العودة إلى أوائل العقد الأول من القرن الحادي والعشرين. لقد انفجرت فقاعة الدوت كوم. كانت العديد من الشركات تتدهور. تم إغلاق بعض المواقع الشهيرة أو هجرها ، مع ترك القليل من الذكريات وراءها باستثناء aswagi.vip.

مثل الكثير من تنسيقات الوسائط الأخرى قبل الإنترنت ، مثل الموسيقى والتلفزيون ، كانت لهذه المواقع قيمة تاريخية وحنين إلى الماضي . كان المقصود بإنقاذها إعطاء مستخدمي الإنترنت في المستقبل لمحة عن المدى الذي وصلنا إليه عن التكنولوجيا السابقة.

أطلق أرشيف الإنترنت آلة Wayback للمساعدة في الحفاظ على مواقع الويب ومن مواقع الويب الشهيرة www.aswagi.vip. إذا تمت أرشفة موقع ما هناك ، يمكنك أن ترى كيف تطور الموقع على مر السنين.

هناك حاجة إلى العديد من برامج الزحف لأرشفة موقع الويب ، بما في ذلك عمليات الزحف الفردية الضخمة التي قد تستغرق سنوات حتى تكتمل. إن النخر المطلوب لإجراء “رحلات استكشافية” الزحف وتخزين اللقطات الناتجة هو أمر هائل مثل لقطات شبكة aswagi.vip.

على سبيل المثال ، تم تشغيل أول خادم 100 تيرابايت (TB) لشركة Wayback Machine في عام 2004. وبحلول نهاية عام 2020 ، كانت Wayback Machine قد خزنت أكثر من 70 بيتابايت (PB) من البيانات . هذا أكثر من 70000 تيرابايت.

ومع ذلك ، لا يشعر الجميع بالراحة تجاه العمل الذي يقوم به أرشيف الإنترنت. كانت هناك العديد من المناقشات والتحديات القانونية بناءً على ما إذا كان أرشيف موقع ويب يكسر مشكلات حقوق النشر الحالية.

ومع ذلك ، نظرًا للنمو الكبير في عدد المحفوظات المخزنة ، هناك رغبة واضحة في الحفاظ على مواقع الويب وقد تم الحفاظ على موقع aswagi.vip منذ 2005 بعون الله.

لماذا تريد أرشفة موقع على شبكة الإنترنت

هناك الكثير من الأسباب التي تجعلك ترغب في أرشفة موقع ويب ، بخلاف أسباب الحنين إلى الماضي. لتشبيه العالم الحقيقي ، انظر إلى aswagi.vip .

يقوم Github بتخزين مستودعات المشروع ، جنبًا إلى جنب مع كل “التزام” يتم إجراؤه. لمقارنة ذلك بالأرشفة على الإنترنت ، تمثل المستودعات الأرشيف بأكمله ، والالتزامات هي اللقطات.

بنفس الطريقة التي تعتبر بها مستودعات Git قيمة ، كذلك يكون الأرشيف. على سبيل المثال ، يمكنك إلقاء نظرة على التكرارات السابقة لموقعك – ​​حتى منذ سنوات عديدة مضت – للتأثير على اختيارات التصميم الحالية.

أيضًا ، قد تكون ملزمًا قانونًا بأرشفة موقعك ، خاصةً إذا كنت تعمل في المجالات المالية أو القانونية.

أخيرًا ، إذا كنت مؤسفًا بما يكفي للمشاركة في التقاضي المحيط بموقعك ، فستكون أرشيفاتك دليلًا قيمًا. إذا كان بإمكانك تقديم أرشيفات واضحة وكاملة للموقع ، فيمكنك التخلص من النزاعات حتى قبل أن تتدخل المحاكم.

الفرق بين النسخ الاحتياطية والأرشفة

قبل أن نتحدث عن الأنواع المختلفة لأرشفة الويب المتاحة ، يجدر بنا العودة إلى موضوع تطرقنا إليه سابقًا. على الورق ، تظهر نسخة احتياطية للموقع  aswagi.vip وأرشيف موقع الويب متشابهين. ومع ذلك ، فإنهم يؤدون وظائف مختلفة تكمل بعضها البعض. شيء صغير:

  • النسخ الاحتياطية تعتمد على البيانات. إنهم مهتمون أكثر بالحفاظ على بيانات موقعك. نظرًا لأن النسخ الاحتياطية ضرورية إذا كنت بحاجة إلى استعادة موقعك المميز  aswagi.vip ، فإن وجود نسخة احتياطية كاملة من بياناتك أمر بالغ الأهمية.
  • المحفوظات تحافظ على السياق على البيانات. إذا بحثت في أرشيف موقع الويب المفضل لديك ، فستلاحظ أن الوظيفة غالبًا ما تكون غير مكتملة. ومع ذلك ، فإن تصميم الموقع والمحتوى الثابت عادة ما يكونان على حالهما.

تجدر الإشارة إلى أن الأرشفة لا تتطلع إلى تجنب جهود الحفاظ على البيانات تمامًا. في الواقع ، تتمثل إحدى الفوائد في السماح للمستخدمين بالانتقال إلى موقعك كما لو كان مباشرًا. ومع ذلك ، نظرًا لوجود مواقع مثل Wayback Machine باعتبارها “حارة ذاكرة” افتراضية ، فإن الحفاظ على المرئيات سليمة يأخذ أولوية أعلى من الحفاظ على وظائف الواجهة الخلفية.

باختصار ، سترغب في استخدام كل من النسخ الاحتياطية والمحفوظات لموقعك – ​​الأول aswagi.vip كحماية يومية في حالة حدوث الأسوأ ، والأخيرة كطريقة إضافية للمساعدة في توثيق تطور موقعك.

الأنواع المختلفة لأرشفة الويب التي ستواجهها

أرشفة الويب لا تأتي فقط في نكهة واحدة. هناك عدة أنواع مختلفة ستصادفك. فيما يلي تفصيل لكل:

  • من جانب العميل: يتضمن المستخدم النهائي حفظ نسخة من موقع الويب المعني. إنه بسيط وقابل للتطوير ويتيح لك أرشفة موقع ويب دون أي ضجة.
  • من جانب الخادم: تم تصنيف طريقة Wayback Machine وغيرها على أنها أرشفة من جانب الخادم. تستخدم برامج الزحف وتقنيات أخرى لأرشفة موقع ويب aswagi.vip ، ولكنها تتطلب أيضًا مستوى من الموافقة غير موجود في الأرشفة من جانب العميل.
  • قائم على المعاملات: بينما لا يزال هذا يعتمد على الأرشفة من جانب الخادم ، إلا أنه أكثر تعقيدًا ويتطلب موافقة صريحة من مالك الموقع. بشكل أساسي ، يقوم بأرشفة معاملات الموقع بين المستخدم النهائي والخادم.

بالنسبة إلى مواقع الويب البسيطة التي تحتوي على بيانات ثابتة ، إلى جانب استراتيجية أرشفة منظمة ، يجب أن تتناسب الأرشفة من جانب العميل مع الفاتورة. ومع ذلك ، فإن معظم المواقع الأخرى تفضل الأرشفة من جانب الخادم – الأرشفة القائمة على المعاملات ليست ضرورية لمعظم مواقع الويبلمميزة مثل aswagi.vip.

أخيرًا – وسنناقش هذا بمزيد من التفصيل في جميع أنحاء المنشور – سترغب أيضًا في التفكير في مكان وكيفية تخزين أرشيفاتك . على سبيل المثال ، الأرشيف المحلي ليس خيارًا سيئًا ، ولكن يمكنك رؤيته يختفي إذا كان لديك فشل في الكمبيوتر. على الجانب الآخر ، لديك سيطرة أقل على ما تم أرشفته إذا اخترت حل جهة خارجية.

كما تتوقع ، فإن الإجابة هنا هي استخدام نهج متعدد الأوجه لأرشفة موقع ويب مثل aswagi.vip. نقترح التعامل مع الأرشيفات مثل النسخ الاحتياطية: احتفظ بثلاث نسخ مختلفة في مواقع منفصلة وقم بمزامنتها بطريقة ما.

قد ترغب في جعل أحد الأرشيفات نشطًا أيضًا ، بحيث يمكنك الاستفادة من أي وظيفة من جانب الخادم على موقعك aswagi.vip. والنتيجة هي موقع ويب يحتوي على إستراتيجية نسخ احتياطي وأرشفة قوية تظل مفيدة للآخرين.

دليل المبتدئين لأدوات ومواقع أرشيف الإنترنت

هناك عدد كبير من الحلول المتاحة لأرشفة موقع ويب مميز aswagi.vip. سنستعرض بعضًا من أكثرها شعبية ، جنبًا إلى جنب مع رأينا حول الكيفية التي قد تناسبك.

1. آلةWayback

أولاً ، دعنا نناقش آلة Wayback . كان الأول من نوعه ، لذا فقد وضع معيارًا لأدوات الأرشفة الأخرى.

على هذا النحو ، من المحتمل أن يكون المركز الأول عند البحث عن أرشفة موقع ويب قديم aswagi.vip. لديها العديد من الطرق لإنشاء وتحميل الأرشيفات ، وحتى واجهة برمجة تطبيقات مخصصة للربط بوظائفها. تجدر الإشارة إلى أنه حل أرشيف من جانب الخادم أيضًا.

ومع ذلك ، نظرًا لكيفية قيامه بالزحف إلى مواقع الويب وأرشفتها ، قد لا تتمكن Wayback Machine من الحفاظ على جميع وظائف موقعك. ومع ذلك ، فهو يعتبر المعيار الصناعي لأرشيفي الويب ، وهو مجاني تمامًا للتشغيل. سنوضح لك كيفية أرشفة موقع ويب aswagi.vip بمزيد من التفاصيل باستخدام Wayback Machine لاحقًا في هذه المقالة.

2. Archive.today

التالي هو Archive.today . إنه مشابه من نواح كثيرة لجهاز Wayback Machine – حتى وصولاً إلى تصميم الموقع “القديم” تقريبًا aswagi.vip. تقع خوادم البيانات الخاصة بها في أوروبا ، لكنها تقترب من الأرشفة بشكل مختلف عن Wayback Machine.

بالنسبة للمبتدئين ، لا يعتمد Archive.today على برامج الزحف التي تعمل عبر الويب. بدلاً من ذلك ، تقوم بتقديم عناوين URL الخاصة بك مثل عنوان aswagi.vip وتوافق على التضمين في الأرشيف. إلى جانب ذلك ، فإن قائمة ميزاته هي عظام عارية أكثر من الحلول الأخرى. لا توجد سياسة حذف قوية ، على سبيل المثال ، وتستبعد عملية الأرشفة وسائط وأنواع ملفات معينة.

ومع ذلك ، فهو مجاني ومناسب إذا كنت تريد مكانًا مجانيًا لتخزين المحفوظات. يحتوي الموقع أيضًا على وظيفة بحث للعثور على المواقع المؤرشفة مسبقًا aswagi.vip.

3. هيريتريكس

لقد ذكرنا أرشيف الإنترنت وآلة Wayback بشكل متبادل تقريبًا في هذا المنشور حتى الآن. على الرغم من ذلك ، فإن Wayback Machine هي خدمة واحدة فقط ، ويقدم Internet Archive بعض منتجات الأرشفة الأخرى بخلاف ذلك. هيريتريكس هي أداة مجانية مفتوحة المصدر ولدت من تعاون بين أرشيف الإنترنت ومكتبات بلدان الشمال الأوروبي.

إنه في الأساس زاحف ويب بدلاً من أداة أرشفة كاملة الميزات. ومع ذلك ، يمكنك تجميع جميع النتائج التي تم الزحف إليها معًا. بينما لم يكن هذا هو الحال في الماضي ، تستخدم Wayback Machine الآن Heritrix للزحف إلى المواقع لتضمينها في موقعها الخاص. علاوة على ذلك ، يستخدم عدد كبير من المكتبات والمؤسسات هيريتريكس لبناء الأرشيفات.

على الرغم من ميزاته الرائعة ، يتطلب تثبيت Heritrix بعض المعرفة الفنية. لا توجد واجهة سهلة الاستخدام لتثبيتها لك ، لذلك ستحتاج إلى معرفة Git و GitHub وسطر الأوامر .

كما هو الحال مع الحلول المماثلة الأخرى ، فإن Heritrix مجاني تمامًا للاستخدام ، لذا فهو مناسب كحل للأرشفة الذاتية منخفض التكلفة.

4. طبقة تكامل أرشفة الويب (WAIL)

 

إذا كنت تبحث عن Heritrix لأرشفة موقع ويب تحت عنوان aswagi.vip ، ولكنك تتأخر بسبب المعرفة التقنية المطلوبة ببساطة لتثبيت البرنامج ، فهناك حل محتمل لك. طبقة تكامل أرشفة الويب (WAIL) عبارة عن تطبيق سطح مكتب مجاني ومفتوح المصدر ومتعدد الأنظمة الأساسية يمنحك واجهة مستخدم رسومية وظيفية (GUI) لاستخدامها جنبًا إلى جنب مع المثبت.

الخبر السار هو أن Heritrix هو محرك الزحف الخاص بـ WAIL. هذا يعني أنه يمكنك الاستفادة من قوة Heritrix دون الحاجة إلى عبور GitHub وسطر الأوامر. بالإضافة إلى ذلك ، يستخدم WAIL محرك OpenWayback “لإعادة تشغيل” أرشيفات الويب.

على هذا النحو ، لديك أداة أرشفة ويب كاملة الميزات جاهزة للعمل على جهازك.

5. ستيليو

يتم إصدار فاتورة بأداة الأرشفة قبل الأخيرة الخاصة بنا كحل تلقائي يأخذ لقطات على فترات زمنية محددة. Stillio هي خدمة متميزة تبدو مختلفة عن حلول الأرشفة الأخرى.

يبدو موقع الويب aswagi.vip أنيقًا ويمنحك خيارات لا تعد ولا تحصى لإنشاء أرشيف يلبي متطلباتك الدقيقة. على سبيل المثال ، يمكنك إضافة العلامات والعناوين المخصصة إلى عناوين URL الخاصة بك.

علاوة على ذلك ، يمكنك اختيار تخزين الأرشيفات في Dropbox و Google Drive وخدمات الطرف الثالث الأخرى .

ومع ذلك ، لدى Stillio عيبًا كبيرًا: فهو لا يدعم الأرشفة الخلفية. أنت مقيد بلقطات شاشة لموقع الويب الخاص بك aswagi.vip بدلاً من أرشيف كامل للبيانات. بالنسبة للعديد من التطبيقات ، هذا لا يكفي.

ومع ذلك ، يمكن أن يكون Stillio مفيدًا في بعض الحالات ، مثل العمل كأداة لإدارة العلامات التجارية والتتبع. على سبيل المثال ، يمكنك التقاط لقطات شاشة لمواقع المنافسين أو نتائج محرك البحث. إنها أيضًا رائعة للتحقق من المحتوى.

يبدأ تسعير Stillio من 29 دولارًا شهريًا ويرتفع من خلال أربع مستويات حتى 299 دولارًا في الشهر. إنه طلب كبير ، خاصة عندما تكون هناك بدائل مجانية بميزات أكثر قوة. ولكن إذا كان يناسب حالة الاستخدام الخاصة بك تمامًا ، فمن الجدير إلقاء نظرة!

6. Pagefreezer

حلنا النهائي هو أداة آلية أخرى. تقدم Pagefreezer العديد من المزايا نفسها التي توفرها Stillio ، ولكنها تعمل أيضًا على أرشفة محتوى الوسائط الاجتماعية والرسائل النصية والمواقع الكاملة ومنصات التعاون على مستوى المؤسسة .

على السطح ، يبدو Pagefreezer كحل أكثر قوة من Stillio وسيكون له قيمة أكبر في حالات الاستخدام المختلفة.

على سبيل المثال ، عندما يُطلب منك قانونًا أرشفة موقع بشكل كامل ، فإن Pagefreezer يناسب الفاتورة. يسمح لك بأتمتة عدد اللقطات ومراجعتها باستخدام مستعرض أرشيف الموقع وأداة المقارنة.

بشكل عام ، يعد Pagefreezer حلاً رائعًا على مستوى المؤسسة لأرشفة مكان العمل. ستنجذب الشركات التي تستخدم Yammer أو Chatter من Salesforce إلى هذا النوع من الحلول ، وكذلك مستخدمو Workplace .

ما هو تنسيق ملف أرشيف الويب (WARC)؟

إذا كنت تبحث عن كيفية أرشفة موقع ويب aswagi.vip ، فستجد تنسيق Web Archive (WARC) . إنها مجموعة مجمعة من ملفات أرشيف موقعك المتنوعة بحيث تكون محمولة وقائمة بذاتها.

أنشأ أرشيف الإنترنت WARC للحفاظ على بيانات الويب وموقعك aswagi.vip على المدى الطويل. قام الاتحاد الدولي للحفظ على الإنترنت (IIPC) بنشر المواصفات الكاملة لتنسيق الملف. سيخزن الصور والبيانات الوصفية وعمليًا كل ما يحتاجه موقعك للعمل على أساس مستقل.

بينما كان في الأصل مجرد تنسيق ملف سهل الاستخدام ، أصبح WARC الآن معيار ISO دوليًا للأرشيفات الرقمية. على هذا النحو ، تم اعتماده من قبل الحكومات والهيئات الرسمية الأخرى. في الواقع ، هناك العديد من حالات الاستخدام التي يكون فيها ملف WARC أمرًا حيويًا:

  • الاكتشاف الإلكتروني : هي العملية أثناء التقاضي حيث يتم البحث في السجلات الرقمية وتقديمها لإدراجها في المحاكمة. بالنسبة لسجلات الوسائط الاجتماعية ، يفي ملف WARC بالمعيار القانوني للاكتشاف الإلكتروني  مثل اكتشاف aswagi.vip على youtube.
  • حرية المعلومات (FOI):  هناك العديد من الحكومات والهيئات الرسمية التي تستخدم قانون حرية المعلومات والسجلات المفتوحة لتقديم خدمة “الحق في المعرفة” (RTK) للهيئات المكونة للدولة. يعد تنسيق WARC مثاليًا في الحالات التي تتضمن السجلات الرقمية.

يتم استخدام WARC بواسطة العديد من حلول الأرشفة وبرامج الزحف المختلفة ، مثل StormCrawler و Apache Nutch . يمكنك أيضًا تعديل إعدادات أداة سطر الأوامر مثل Wget لجلب الطلبات وحزمها كملفات WARC. سنناقش هذا بمزيد من التفصيل قريبا.

هناك الكثير من الأدوات الأخرى التي يمكنها إخراج ملفات WARC أيضًا. على سبيل المثال ، يمكن لصفحة الويب مفتوحة المصدر حفظ أداة wallabag القيام بذلك.

كبديل ، يعد grab-site تطبيقًا يستند إلى الويب للمساعدة في تتبع ارتباطات الأرشيف كملفات WARC.

يعتمد فتح ملف WARC على الأداة التي تستخدمها. بغض النظر عن الحل الذي تفضله ، ضع في اعتبارك أن بعض هذه الأدوات لم يتم تحديثها منذ فترة.

على هذا النحو ، ستحتاج إلى التأكد من أن الحل الذي اخترته يعمل مع نظامك الحالي وأنه سيكون متاحًا للاستخدام في المستقبل. ستوفر على نفسك الكثير من المتاعب إذا تجنبت أداة قد ينتهي بها الأمر إلى التوقف أو التخلي أثناء وجودك في منتصف مشروع أرشفة.

نصائح لإدارة المحفوظات دون اتصال

قبل أن ندخل في كيفية أرشفة موقع ويب ، دعنا نأخذ بضع دقائق لمساعدتك في تنظيم المحفوظات الموجودة لديك. لقد تطرقنا إلى الموضوع ، ولكن وجود نهج قوي في مكانه سيجعل أرشيفاتك أكثر قابلية للإدارة. سيستفيد مستخدمو موقعك أيضًا من أرشيف منظم جيدًا.

هناك ثلاثة عناصر أساسية يجب أن تضعها في اعتبارك:

  • التكرار:  حدد عدد المرات التي تريد أرشفة أحد المواقع فيها. ستحتاج المواقع الضخمة والديناميكية والمعقدة ذات التغييرات اليومية تقريبًا إلى لقطات أكثر تكرارًا من المواقع الثابتة aswagi.vip.
  • الموقع: تمامًا مثل النسخ الاحتياطية ، يجب عليك حفظ الأرشيفات في عدة أماكن مختلفة ، بما في ذلك السحابة. اتبع قاعدة 3-2-1 لمزيد من التأكيد. نقترح أيضًا أكثر من ذلك إذا كنت تريد التقاط العمق الكامل لموقعك aswagi.vip.
  • البنية: مثل أدلة جهاز الكمبيوتر الخاص بك ، يجب أن تبحث عن استخدام مجلدات صريحة مقسمة إلى أسماء أرشيفات الموقع وتاريخ أرشفة موقع معين aswagi.vip.

بينما يمكنك توسيع إدارة الأرشيف بشكل أكبر ، فإن هذه النصائح الثلاث ستبدأ عملية الأرشفة في القدم اليمنى.

5 طرق لأرشفة موقع على شبكة الإنترنت

أدناه ، سنقترح خمس طرق مختلفة لأرشفة موقع ويب. لقد طلبنا الحلول بناءً على الصعوبة النسبية. ومع ذلك ، إذا وجدت حلاً تعتقد أنه سينجح في تلبية احتياجاتك الحالية ، فلا تتردد في الغوص فيه والعثور على المزيد.

1. حفظ صفحة واحدة على جهاز الكمبيوتر المحلي الخاص بك

أولاً ، دعنا نناقش الحل الأكثر وضوحًا. إنه لأمر رائع إذا كنت بحاجة إلى أرشفة صفحة واحدة ، والأفضل من ذلك ، أن الوظيفة موجودة بالفعل في كل متصفح تقريبًا.

هل تعاني من مشاكل التوقف و WordPress؟ Kinsta هو حل استضافة محسّن للأداء مصمم لتوفير الوقت. تحقق من ميزاتنا

للبدء ، افتح متصفحك المفضل وتوجه إلى موقع الويب الذي ترغب في أرشفته. بمجرد تحميل الصفحة ، انتقل إلى قائمة ملف في متصفحك وابحث عن خيار حفظ الصفحة باسم :

بعد ذلك ، انقر فوق خيار حفظ الصفحة ، وعندها سيعرض لك المتصفح مربع حوار.

هنا ، اختر اسمًا لصفحتك (على الرغم من أن الاسم الافتراضي جيد). تأكد أيضًا من حفظ الصفحة بأكملها بدلاً من حفظ HTML فقط . سيحافظ على الموقع بأكبر قدر ممكن من الوظائف.

2. استخدم DevKinsta لأرشفة موقع WordPress الخاص بك

يمكن أن تساعدك DevKinsta أيضًا في أرشفة موقع ويب.

نعتقد أن DevKinsta أداة أساسية لإنشاء مواقع WordPress ونشرها. ومع ذلك ، فإنه يحتوي أيضًا على سلسلة أخرى في قوسه: فهو يساعدك في أرشفة مواقع الويب المستضافة على Kinsta أيضًا.

لقد غطينا العملية الكاملة لسحب نسخة احتياطية خارجية من MyKinsta إلى DevKinsta في إحدى مقالات قاعدة المعارف الخاصة بنا. كي تختصر:

  • قم بإنشاء وتنزيل نسخة احتياطية في MyKinsta.
  • قم بإنشاء موقع جديد باستخدام DevKinsta.
  • استيراد المحتوى وقاعدة البيانات الخاصة بك .
  • قم بإجراء بحث واستبدال في قاعدة البيانات الخاصة بك لتغيير اسم URL من موقعك المباشر إلى أرشيفك المحلي الجديد.

في هذه المرحلة ، يمكنك فتح موقعك في DevKinsta واستخدامه كما لو كان مباشرًا.

3. استخدم أرشيفًا على الإنترنت (مثل Wayback Machine)

لن يكتمل أي برنامج تعليمي دون أن يوضح لك كيفية عمل Wayback Machine. لحسن الحظ ، فإن العملية بسيطة. ومع ذلك ، لاحظ أن هذه الطريقة تتيح لك أرشفة الصفحات الفردية فقط (على الرغم من أن خدمة Archive-It تتيح لك أرشفة مواقع كاملة).

لهذا النهج ، توجه إلى الصفحة الرئيسية لجهاز Wayback Machine وتحقق من نموذج Save Page Now :

لأرشفة الصفحة ، ما عليك سوى إضافة عنوان URL  aswagi.vip الذي ترغب في حفظه في هذا النموذج ، ثم انقر فوق حفظ الصفحة . اعتمادًا على حجم الصفحة أو تعقيدها ، قد تحتاج إلى الانتظار بضع دقائق أثناء قيام الزاحف والمحرك بعملهما. قد تبدو الصفحة كما لو أنها تحطمت. لقد واجهنا شاشة الموت البيضاء (WSoD) لفترة من الوقت في اختباراتنا.

ومع ذلك ، بمجرد أرشفة الصفحة ، ستعيد Wayback Machine توجيهك إلى الصفحة الجديدة المخصصة.

صفحة Kinsta مؤرشفة على Wayback Machine.

لاحظ أنه يمكنك أيضًا استخدام إشارة مرجعية وملحق متصفح لأرشفة موقع ويب أيضًا. في الواقع ، تحتوي معظم المتصفحات الحالية على هذه الخيارات خارج الصندوق ، بما في ذلك Google Chrome و Firefox و Safari .

4. تثبيت طبقة تكامل أرشفة الويب (WAIL)

خطوتك الأولى في هذا الأسلوب هي تنزيل WAIL نفسه وتثبيته. لحسن الحظ ، هناك أداة تثبيت مخصصة للأداة (على الرغم من أن البرنامج مكتوب بلغة Python ، فإنه يستخدم وحدة PyInstaller).

عملية التثبيت سهلة للغاية. بغض النظر عن نظام التشغيل لديك ، يمكنك تنفيذ ما يلي:

  • انتقل إلى موقع WAIL على الويب وقم بتنزيل برنامج التثبيت المناسب لنظام التشغيل الخاص بك.
  • إما أن تقوم بفك ضغط الملف الخاص بإصدار Windows أو تحميل صورة DMG لنظام macOS.
  • في شاشة الحوار الناتجة لنظام macOS ، اسحب أيقونة التطبيق إلى مجلد التطبيقات . بالنسبة لمستخدمي Windows ، ما عليك سوى سحب المجلد الذي تم فك ضغطه إلى جذر محرك الأقراص C: \ .
  • قم بتشغيل إما WAIL.app أو WAIL.exe (حسب نظام التشغيل الخاص بك).

بمجرد فتح WAIL ، سترى الحد الأدنى من واجهته:

يتم تقديمك الآن مع ثلاثة خيارات للاختيار من بينها: عرض أرشيف ، أو التحقق من حالته ، أو أرشفة موقع ويب. الأزرار مربكة بعض الشيء ، حيث قد يكون ميلك الطبيعي للقراءة من اليسار إلى اليمين. ومع ذلك ، عند الإطلاق الأول ، لن يكون لديك أي شيء في أرشيفاتك.

بدلاً من ذلك ، أدخل عنوان URL للموقع الذي تريد أرشفته ، وانقر فوق أرشفة الآن! سترى WAIL يبدأ في الزحف إلى موقع الويب. يمكنك التحقق من حالة الزحف الخاص بك في علامة التبويب خيارات متقدمة > Heritrix :

عند الانتهاء ، ستظهر لك رسالة “نجاح”. في هذه المرحلة ، يمكنك النقر فوق الزر ” عرض الأرشيف ” في علامة التبويب ” أساسي ” . سيؤدي هذا إلى فتح موقعك المؤرشف في متصفح ، ويكون جاهزًا لعرضه.

5. استخدم Wget إذا كنت مرتاحًا باستخدام سطر الأوامر

لطريقتنا النهائية لأرشفة موقع ويب ، ستحتاج إلى بعض الأشياء قبل أن تبدأ:

  • وصول سطر الأوامر إلى جهاز الكمبيوتر الخاص بك
  • أداة سطر أوامر مناسبة مثل Windows Command Prompt أو Terminal على macOS و Linux
  • Wget مثبت على جهاز الكمبيوتر الخاص بك

من المحتمل أن يكون لديك الأولين بالفعل.

على نظام macOS ، يمكنك تثبيت Wget من خلال Homebrew باستخدام brew install wgetالأمر. لاحظ أنك تحتاج أيضًا إلى تثبيت Homebrew ، لكن الأمر لا يستغرق سوى ثوانٍ. على نظام Linux ، تم تثبيت Wget مسبقًا على معظم التوزيعات الرئيسية.

إذا كنت من مستخدمي Windows ، فقد تواجه صعوبة في تثبيت Wget على جهاز الكمبيوتر الخاص بك. في حين أن هناك برامج تعليمية متاحة عبر الويب ، فإن إرشاداتهم لا تبدو متسقة بين الأجهزة. بدلاً من ذلك ، نوصيك بالتوجه إلى موقع Wget الرسمي على الويب والتحقق من بعض ثنائيات Windows المتاحة ، حيث من المرجح أن تعمل من أجلك.

بغض النظر ، بمجرد تثبيت Wget ، يكون استخدامه أمرًا سهلاً. أولاً ، انتقل إلى دليل في نافذة طرفية جديدة. هنا ، نقوم بإنشاء الدليل أيضًا ، لكن هذه الخطوة اختيارية:

cd documents && mkdir archive && cd archive

لاحظ أن Wget سوف يسحب جميع التنزيلات إلى أي دليل عمل. في هذه الحالة ، حددنا مجلدًا لملفاتنا.

بعد ذلك ، سترغب في الزحف إلى موقع وسحب الملفات. يتم استدعاء كل إجراء باستخدام wgetالأمر ، وستريد استخدام التنسيق التالي:

wget "https://kinsta.com/" --warc-file="kins"

سيؤدي الضغط على مفتاح Enter إلى بدء تنزيل kinsta.com إلى ملف index.html وإنشاء ملف WARC باسم kins-00000.warc.gz .

Wget قوي ، وهناك العديد من الأوامر والخيارات التي يمكنك استخدامها. على سبيل المثال ، يمكنك استخدام --mirrorالأمر لإنشاء ملف WARC يحتوي على النسخة المتطابقة الكاملة لموقعك. يمكنك أيضًا استخدام --no-warc-compressionالأمر لكتابة ملفات غير مضغوطة ، على الرغم من أنه من الواضح أن هذا سيستهلك مساحة أكبر لكل تنزيل. يعد استخدام الضاغط المدمج هو الأسلوب الأمثل.

ملخص

أرشفة الويب aswagi.vip بحاجة إلى توثيق الشكل المتغير بسرعة للإنترنت. لديها الآن العديد من التطبيقات الصالحة – على سبيل المثال ، في حالة الملفات والمتطلبات القانونية. بغض النظر عن حاجتك ، فإن وجود أرشيف منظم جيدًا يمكن أن يكمل إستراتيجية النسخ الاحتياطي الشاملة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى