8.6 網(wǎng)絡(luò)搜索技術(shù)
<1>全文搜索引擎組成
搜索器、索引器、檢索器、用戶接口
<2>google、百度各自技術(shù)特點
物理層的前同步碼(即物理幀前導(dǎo)符+物理幀界定符)8字節(jié)由硬件自動生成。除去這8個字節(jié),將其余字段的長度加起來,可以得到以太網(wǎng)幀的長度為1 518字節(jié),最小長度則為64字節(jié);加上8字節(jié)的前同步碼,即可得到最小幀長度為576位。這樣長度的幀能夠保證所有沖突都可以檢測到。這是因為IEEE 802.3標(biāo)準(zhǔn)中,兩個站點的最遠(yuǎn)距離小于2 500 m,由4個中繼器連接而成,其沖突窗口為2倍電纜傳播延遲加上4個中繼器的雙向延遲之和,合計為51.2μs。就10 Mbps以太網(wǎng)而言,這個時間段內(nèi)等于發(fā)送64字節(jié)(即512位)的數(shù)據(jù)。
使用CSMA/CD作為一種訪問控制方式,意味著最短數(shù)據(jù)幀長度與網(wǎng)絡(luò)上最長傳輸延遲時間間隔有著密切的關(guān)系。要保證在發(fā)送過程中出現(xiàn)沖突時,沖突域內(nèi)的所有結(jié)點都應(yīng)該知道發(fā)生了沖突,以便采取適當(dāng)?shù)拇胧_@就需要最短數(shù)據(jù)幀長度必須大于網(wǎng)絡(luò)上的最長傳輸延遲時間間隔,再加上阻塞附加時間和同步延遲時間等。這就是IEEE 802.3標(biāo)準(zhǔn)中最短幀長度為64字節(jié)的由來。