شاید برایتان سوال شده باشد که یک صفحه از وب، ماه قبل یا سال قبل چه شکلی بوده و چه متن و تیتری در آن وجود داشته است. در واقع یکی از نیازهای طراحان وب و متخصصین سئو، چک کردن ظاهر و محتوای سایتها در گذشته است. برای این منظور میتوانید از سایت archive.org/web استفاده کنید. در این سایت سرویسی آنلاین به اسم Wayback Machine ارایه میشود که بکاپی از محتوای سایتها نگهداری میکند. البته نمیتوانید همهی روزها را چک کنید چرا که ربات این سرویس هر چند روز یا چند ماه یک مرتبه به سایت موردنظر شما سر میزند و نسخهای از آن ذخیره میکند.
در این مقاله به شیوهی چک کردن محتوا و ظاهر سایتها در گذشته و به کمک Wayback Machine میپردازیم.
آیا همهی نسخهها و حالتهای سایت در گذشته قابل بررسی است؟
ربات سرویس آنلاین Wayback Machine بسته به اینکه میزان مطالب و بازدید سایتها چقدر است، هر چند روز، چند هفته و یا هر چند ماه یک مرتبه به سایت سر میزند و چندین صفحه را باز کرده و ذخیره میکند. اگر برایتان سوال شده که تیتر صفحهای خاص در گذشته چه بوده یا در مقاله و حتی در بخش نظرات مقاله چه محتوایی نوشته شده بود، میتوانید از این سرویس آنلاین استفاده کنید.
اگر خوششانس باشید شاید بکاپی از همان روزی که میخواهید، موجود باشد. در غیر این صورت میتوانید روزهای قبلی یا بعدی را بررسی کنید.
توجه کنید که برخی از صفحات سایتها به صورت خصوصی منتشر میشود و با رمز عبور یا ورود به حساب کاربری، قابلرویت است. برخی دیگر توسط فایل تنظیمات رباتها مسدود میشود و برخی دیگر فقط در صورتی باز میشود که مراجعهکننده از شهر یا کشور خاصی برای باز کردن سایت اقدام کرده باشد. به عبارت دیگر صفحه برای هر IP Address دلخواهی باز نمیشود.
بنابراین ربات سرویس Wayback Machine همهی صفحات را بررسی نمیکند!
آموزش استفاده از archive.org/web
ابتدا سایت Internet Archive را در یکی از مرورگرهای اینترنت باز کنید. در کادر ابتدای صفحه، آدرس سایت موردنظر را وارد کنید. سپس روی دکمهی Browse History کلیک کنید.
پس از لحظاتی اسکن و بررسی، صفحهای حاوی تقویم ظاهر میشود. دقت کنید که در بالای صفحه، نموداری از تعداد مراجعات ربات این سرویس در سالهای مختلف موجود است. لذا اگر بخواهید تقویم سالهای قبل را چک کنید، میبایست ابتدا روی سال موردنظر کلیک کنید.
اکنون سراغ تقویم پایین صفحه بروید. در تقویم برخی از روزها رنگی است و در واقع سه حالت وجود دارد:
- روزهای بدون رنگ که در این روزها ربات مراجعهای نکرده و چیزی ذخیره نکرده است.
- روزهایی با رنگ آبی که در این روزها ربات با موفقیت برخی از صفحات سایت را دریافت کرده و ذخیره کرده است.
- در روزهایی که با رنگ سبز مشخص شده، ربات این سرویس به سایت مراجعه کرده اما به صفحه و آدرس دیگری هدایت شده است. به عبارت دیگر کد وضعیت HTTP، یکی از کدهای سری ۳۰۰ بوده است.
اگر با کد وضعیت HTTP آشنایی ندارید، مقالهی زیر را مطالعه کنید:
با توجه به توضیحات فوق، برای چک کردن ظاهر و محتوای صفحات سایت در گذشته میبایست روی یکی از نقاط آبی کلیک کنید.
چرا برخی از نقاط بزرگ و برخی کوچک است؟
در روزهایی که به شکل دایرهی بزرگتر نمایش داده شده، ربات چند مرتبه به سایت مراجعه کرده و بکاپی از آن تهیه کرده است. البته این مراجعههای متعدد به این معنی نیست که سایت در روز موردبحث، بروزرسانیهای بیشتری داشته است.
زمانی که موس روی برخی از دایرههای آبی بزرگ قرار میگیرد، منویی ظاهر میشود و میتوانید روی یکی از بکاپها کلیک کنید.
اکنون نسخهی آرشیو شدهی سایت در دسترس شما قرار میگیرد و میتوانید صفحاتی از سایت را چک کنید. البته در هر بکاپ، همهی صفحات سایت موجود نیست. صفحات معروف نظیر صفحهی اصلی، صفحهی دستههای مطالب یا صفحهی برچسبها و کلمات کلیدی، صفحات خاصی مثل تماس با ما و غیره از جمله صفحاتی است که شاید در اغلب بکاپهای سایت موجود باشد اما همهی صفحات مطالب و اخبار که شاید تعدادشان بسیار زیاد باشد، در بکاپها ذخیره نمیشود.
به جز این سایت و سرویس آنلاین، سایتهای دیگری برای چک کردن محتویات و ظاهر سایتها در گذشته وجود دارد. به عنوان مثال میتوانید دو سایت oldweb.today و Library of Congress را چک کنید.
howtogeekسیارهی آیتی