HTTrack,一個相當(dāng)容易使用的脫機閱覽軟件,能將網(wǎng)站傳送到計算機目錄里,并且會將所有相關(guān)鏈結(jié)重新組織,以方便更順利的脫機瀏覽。
HTTrack是一個免費并易于使用的線下瀏覽器工具,它能夠讓你從互聯(lián)網(wǎng)上下載整個網(wǎng)站進行線下瀏覽。瀏覽線下站點和線上并沒有什么不同。HTTrack同樣可以進行線下線上站點同步,支持?jǐn)帱c續(xù)傳。HTTrack是一個可全面配置并包括全面的幫助系統(tǒng)的工具。
HTTrack是一個網(wǎng)站鏡像工具,本來是用來抓取網(wǎng)站做離線瀏覽用的。但是我發(fā)現(xiàn)它的爬蟲特性和搜索引擎爬蟲非常的像,逐漸應(yīng)用到了自己的SEO工作中。其實這兩種看似不同的爬蟲做的都是同樣的工作,就是復(fù)制網(wǎng)站并存儲下來(搜索引擎的網(wǎng)頁快照就是被存儲下來的內(nèi)容)。
網(wǎng)站鏡像,通過復(fù)制整個網(wǎng)站或部分網(wǎng)頁內(nèi)容并分配以不同域名和服務(wù)器,以此欺騙搜索引擎對同一站點或同一頁面進行多次索引的行為。這既是為什么有的網(wǎng)站注明禁止未授權(quán)不得做網(wǎng)站鏡像的原因了,兩個網(wǎng)站的內(nèi)容完全一樣,相似度過高必然會導(dǎo)致自己的網(wǎng)站受到影響。