如何針對(duì)搜索來設(shè)計(jì)網(wǎng)站的結(jié)構(gòu)

18:07 　來源: 中虎營(yíng)銷舉報(bào)

分享至

如果我們從搜索引擎蜘蛛的角度去看待一個(gè)網(wǎng)站，在抓取、索引和排名時(shí)會(huì)遇到哪些問題呢？解決了這些問題的網(wǎng)站設(shè)計(jì)就是搜索引擎友好的。

1. 搜索引擎蜘蛛能不能找到網(wǎng)頁(yè)

要讓搜索引擎發(fā)現(xiàn)網(wǎng)站首頁(yè)，就必須要有外部鏈接到首頁(yè)，找到首頁(yè)后，蜘蛛沿著內(nèi)部鏈接找到更深的內(nèi)容頁(yè)，所以要求網(wǎng)站要有良好的結(jié)構(gòu)，符合邏輯，并且所有頁(yè)面可以通過可爬行的普通HTML鏈接達(dá)到。JavaScript鏈接、Flash中的鏈接等搜索引擎蜘蛛一般不能跟蹤爬行，就會(huì)造成收錄問題。

網(wǎng)站所有頁(yè)面離首頁(yè)點(diǎn)擊距離不能太遠(yuǎn)，最好在四五次點(diǎn)擊之內(nèi)。要被搜索引擎收錄，頁(yè)面需要有最基本的權(quán)重，良好的網(wǎng)站鏈接結(jié)構(gòu)可以適當(dāng)傳遞權(quán)重，使盡量多的頁(yè)面達(dá)到收錄門檻。

2. 找到網(wǎng)頁(yè)后能不能抓取頁(yè)面內(nèi)容

被發(fā)現(xiàn)的URL必須是可以被抓取的。數(shù)據(jù)庫(kù)動(dòng)態(tài)生成、帶有過多參數(shù)的URL、Session ID、整個(gè)頁(yè)面是Flash、框架結(jié)構(gòu)（frame）、可疑的轉(zhuǎn)向、大量復(fù)制內(nèi)容等都可能使搜索引擎敬而遠(yuǎn)之。

某些文件站長(zhǎng)可能不希望被收錄，除了不鏈接到這些文件，更保險(xiǎn)的方法是使用robots文件或meta robots標(biāo)簽禁止收錄。

3. 抓取頁(yè)面后怎樣提煉有用信息

關(guān)鍵詞在頁(yè)面重要的合理分布、重要標(biāo)簽的撰寫、HTML代碼精簡(jiǎn)、起碼的兼容性等可以幫助搜索引擎理解頁(yè)面內(nèi)容，提取有用信息

只有搜索引擎能順利找到所有頁(yè)面，抓取這些頁(yè)面并提取出其中真正有相關(guān)性的內(nèi)容，網(wǎng)站才可以被視為是搜索引擎友好的。