搜索引擎(三)

字號:

通常是通過簡單地填寫在線表格就能把你的網(wǎng)站信息提交給(搜索引擎)。例如,在Yahoo網(wǎng)站上,你可以在 www.yahoo.com/docs/info/include.htm1上找到提交信息。由于人工干預(yù)對處理、驗證和評價提交請求是必要的,所以在網(wǎng)站在基于目錄的搜索服務(wù)中捕捉到一處之前,可 望有些延遲。
    另一方面,搜索引擎完全實現(xiàn)了編撰過程的自動化,徹底消除了人工干預(yù)。
    一個叫做蜘蛛或爬蟲的軟件機器人自動地在整個Web上取出站點,閱讀頁面和跟隨相關(guān)的鏈接。通過設(shè)計,蜘蛛可以周期性地返回到站點,檢查新的頁面和修改已有頁面。
    蜘蛛爬行得到的結(jié)果記錄在搜索引擎的索引或目錄中。已知了因特網(wǎng)上可資利用的信息的價值,對索引擴張到非常大的規(guī)模是不會感到驚訝的。例如,AltaVista的索引最近已增至3.5億頁而名列前茅。這個數(shù)字看來好像非常大,但總體估計它僅代表了Web上不足35%的頁面。
    由于已編索引的信息的深度與廣度(非常大),所以通常在“蜘蛛爬行過”站點的時間與出現(xiàn)在搜索索引中的時間之間有一個延遲,有時多達(dá)幾周。只有這兩步的過程完成之后,站點才能供搜索查詢使用。
    最后,每個搜索引擎的心臟是一種算法,它將關(guān)鍵字查詢與索引中的信息匹配起來,并按算法認(rèn)為最有關(guān)聯(lián)的順序把結(jié)果列出。
    由于每種搜索引擎的蜘蛛、產(chǎn)生的索引和搜索算法都是不一樣的,所以在不同搜索引擎上的搜索結(jié)果和排列次序是不同的。這就解釋了為什么當(dāng)相同的關(guān)鍵字搜索準(zhǔn)則輸入進(jìn)去時,HotBot中排在最前面的10個站點不會出現(xiàn)在 AltaVista中最前面的站點中。
    此外,很多(但不是所有的)搜索實用程序也引用元標(biāo)記(文檔中用來描述其內(nèi)容的、看不見的HTML標(biāo)記),作為控制內(nèi)容如何編索引的方法。因此,在整個站點中正確使用元標(biāo)記也能提高(此站點)在搜索引擎中的排列名次。