Internet Archive今日達(dá)成了一項(xiàng)里程碑式成就,其網(wǎng)站歷史信息查詢服務(wù)工具Wayback Machine收錄了4千億網(wǎng)頁(yè)索引。數(shù)據(jù)涵蓋了從1996年至今的幾乎所有網(wǎng)站的歷史網(wǎng)頁(yè)記錄。
以下是Internet Archive總結(jié)的Wayback Machine的歷史和里程碑:
2001年 - Wayback Machine項(xiàng)目啟動(dòng)
2006年 - Arichive-It啟動(dòng),允許創(chuàng)建訂閱該服務(wù)的庫(kù)以收集網(wǎng)絡(luò)內(nèi)容
2009年3月25日 - Internet Archive和Sun微系統(tǒng)公司共同啟動(dòng)了一個(gè)數(shù)據(jù)中心,存儲(chǔ)整個(gè)互聯(lián)網(wǎng)的文檔及為Wayback Machine提供服務(wù)。該數(shù)據(jù)中心有3PB容量,每秒處理500個(gè)請(qǐng)求。
2011年6月15日 - 加入HTTP Archive,增加記錄網(wǎng)站性能數(shù)據(jù)的功能。
2012年5月28日 - Wayback Machine在中國(guó)被封鎖數(shù)年后再次上線。
2012年10月26日 - 被記錄網(wǎng)站抓取數(shù)據(jù)達(dá)到了80TB,該抓取數(shù)據(jù)在2011年面向研究者開放。
2013年10月 - Wayback Machine新功能“保存頁(yè)面”開放,可以在頁(yè)面被記錄后一小時(shí)再查看最新的內(nèi)容;聯(lián)邦政府關(guān)閉期間也可以通過(guò)該工具訪問(wèn)政府站點(diǎn)。