我們?cè)趦?yōu)化網(wǎng)站的時(shí)候都會(huì)遇到頁(yè)面的相識(shí)度,頁(yè)面的相識(shí)度指的是網(wǎng)站頁(yè)面與頁(yè)面的相識(shí)度。搜索引擎在抓取頁(yè)面的時(shí)候,通常都會(huì)對(duì)頁(yè)面就行比較,如果一個(gè)頁(yè)面的相識(shí)度達(dá)到80%以上搜索引擎就會(huì)認(rèn)為是垃圾內(nèi)容,就不會(huì)給予收錄,在70%到80%之間的搜索引擎會(huì)收錄,但是給予的權(quán)重不高;
搜索引擎在判斷價(jià)相識(shí)度高度的同時(shí)會(huì)采用兩種算法,一種叫做MD5的算法,如果摘要太過(guò)于相識(shí)就會(huì)認(rèn)為是抄襲;另外一種就是關(guān)鍵詞的出現(xiàn)程度,搜索引擎在判斷頁(yè)面內(nèi)容是否是高價(jià)值的時(shí)候會(huì)吧你網(wǎng)站上面所出現(xiàn)的文字進(jìn)行組合,組合成可以匹配的關(guān)鍵詞,在用這些關(guān)鍵詞去搜索引擎的數(shù)據(jù)庫(kù)里面進(jìn)行匹配,如果大部分的關(guān)鍵詞都在同一另個(gè)網(wǎng)站頁(yè)面上的時(shí)候,就證明你的這個(gè)頁(yè)面是垃圾頁(yè)面。
網(wǎng)站頁(yè)面的布局都是導(dǎo)航、頁(yè)面的邊欄、底部跟主要區(qū)域,不同的就是樣式、代碼跟內(nèi)容,所以我們最主要的就是解決這三個(gè)個(gè)問(wèn)題,不懂代碼的只要解決內(nèi)容就可以了。
頁(yè)面的相識(shí)度也可以不是在同一個(gè)網(wǎng)站上面的頁(yè)面。很多人建網(wǎng)站都是用一些開(kāi)源的程序,然后在尋找一個(gè)適合自己行業(yè)的模板,但是這些模板都是有很多人在用了的,我們?cè)谌ビ镁蜁?huì)產(chǎn)生跟其網(wǎng)站上面的相識(shí)度,仿別人網(wǎng)站上面的模板來(lái)用,即使你使用不同的開(kāi)源程序或者不用語(yǔ)言編寫出來(lái)的程序都會(huì)產(chǎn)生頁(yè)面的相識(shí)度過(guò)高。
網(wǎng)站上面的樣板文字是大多數(shù)企業(yè)網(wǎng)站都會(huì)有的,這些樣板文字的產(chǎn)生大多數(shù)都是站長(zhǎng)在做網(wǎng)站的時(shí)候都喜歡在在網(wǎng)站的邊欄上面放上一些全站使用的文章或者文字,比如說(shuō)公司簡(jiǎn)介、聯(lián)系我們…等一些無(wú)關(guān)緊要的,對(duì)于這些無(wú)關(guān)緊要的我們可以把它做成一張圖片,添加上去就可以了。
采集的文章無(wú)論是從MD5算法,還是關(guān)鍵詞匹配,都是在同一個(gè)網(wǎng)站上面,想要相識(shí)度不高,怎么會(huì)可能呢?
至于跟別人網(wǎng)站上面的相識(shí)度我們只要內(nèi)容,跟他們不一樣就可以了
有問(wèn)題不可怕,知道了問(wèn)題的產(chǎn)生我們改正就可以了,避免下次反同樣的錯(cuò)誤,建議大家盡量努力寫原創(chuàng)的文章,原創(chuàng)的文章不僅僅搜索引擎喜歡,而且還能夠降低網(wǎng)站頁(yè)面與外部頁(yè)面的相識(shí)度。