搜索引擎不(bù)抓取頁面 服務器(qì)端的(de)五個(gè)問(σφεwèn)題

發布來(lái)源:武漢瑞傑時代網絡科技有限公司

發布時(shí)間(jiān):2024.12.04

  1、錯(cuò)誤的(de)封禁

  在百度的(de)robots.txt的("  ★de)更新上(shàng),如(rú)果多±∞(duō)次點擊“檢測并更新”就(jiù)會(huα≈ì)出現(xiàn)時(shí)常可(kě)以更新,但(dàn)是(s≠↕♥¥hì)又(yòu)時(shí)常無法更新的(de)問(wèn)題•≤。如(rú)此一(yī)來(lái):不(bù)應‌ ↓¥當被收錄的(de)東(dōng)西(xī),在robots ‌.txt上(shàng)禁止的(de)被收錄了(le),又(yòu)删₽≠¶₹除就(jiù)很(hěn)正常了(le)。那(n∏☆∞à)麽它的(de)問(wèn)題是(shì)什(shén♦₹₽♦)麽呢(ne)?并非服務器(qì)負載過度,而是(shì)因為₽​(wèi)防火(huǒ)牆錯(cuò)誤的(≥♦$de)将部分(fēn)Baiduspider列入了(le)黑(h₽'"<ēi)名單。

網站(zhàn)設計(jì)  


  2、服務器(qì)異常

  常規的(de)服務器(qì)就(jiù)不(bù)說(shuō)€&≥←了(le),大(dà)家(jiā)都(dōu±​)知(zhī)道(dào)的(de),北(běi)上(shàng)廣的(de)&‌φ 一(yī)般都(dōu)不(bù)錯(cuò)。不(b>σ<↓ù)過有(yǒu)一(yī)些(xiē)特殊服務器(q≈Ωε£ì),想必絕大(dà)多(duō)數(shù)的(de)站(zhàn)長(cΩ≥→háng)都(dōu)不(bù)知(zhī)道(dào)吧≤'(ba)?例如(rú)西(xī)部數(shù)碼的(de)“港台服務器(qì)←‍”就(jiù)很(hěn)有(yǒu)趣,真的(de)是(shì)港台的(de‌∑•‌)嗎(ma)?本身(shēn)機(jī)房(fáng β)在國(guó)內(nèi),還(hái)算(♦₹"÷suàn)什(shén)麽港台?為(wèi)了(le)逃↔σλ避備案而用(yòng)一(yī)個(gè)港台的(d₩± ∞e)IP,數(shù)據全部在國(guó§₹)內(nèi)。

  這(zhè)樣有(yǒu)什(shén)麽不(bù)<♣©好(hǎo)呢(ne)?我們會(huì)發現(xià∞×n):站(zhàn)點的(de)服務器(qì)是(sεα∞→hì)經過CDN的(de),哪怕是(shì"↑)你(nǐ)上(shàng)傳的(de)一(yī)張圖片,ε≈↔都(dōu)會(huì)顯示為(wèi)“302狀态碼”,訪問(wèn™♦δ‌)速度是(shì)提升上(shàng)去(qù)了(le),可(kě€$)是(shì)這(zhè)樣利于SEO嗎(ma)?

  3、獲取不(bù)到(dào)真實IP

  規模較大(dà)的(de)網站(zhàn),一(£®yī)般都(dōu)會(huì)使用(yòng₹×)CDN加速,但(dàn)是(shì)有(yǒu)些(xiē)↕✘站(zhàn)點不(bù)僅僅對(duì)“設備”使用(yònπ​≈g)了(le)CDN加速,而且還(hái)對(duì)Spider使用(yò↓"£ng)了(le)加速功能(néng)。後的(d €e)結果是(shì)什(shén)麽呢(ne)?如(rú)果CDN節點↑α不(bù)穩定,那(nà)麽對(duì)網站(zhàn)♦•γspider來(lái)講,這(zhè)個(≤‍‍₩gè)問(wèn)題将是(shì)緻命的← (de)。

  很(hěn)多(duō)大(dà)型站(zhàn)點≠×開(kāi)放(fàng)CDN的(de)原因就(jiù)是✔✘₩(shì)容易被攻擊,這(zhè)個(gè)時(shí)候如(rú)果不(bù¶☆Ω€)做(zuò)“蜘蛛回源”就(jiù)可(kě)★γ‌✘想而知(zhī)了(le)。你(nǐ)的(de)站(z↕∞♦↑hàn)點做(zuò)了(le)CDN了(le&$)嗎(ma)?請(qǐng)登錄百度站(zhàn)長(chán♣★≈↔g)平台查看(kàn)一(yī)下(xià)s&≤pider是(shì)否可(kě)以抓取真實δ ∞←IP地(dì)址吧(ba)!

  4、頻(pín)繁的(de)50X類錯(cuò)誤

  這(zhè)樣的(de)鏈接其中一(yī¶✔)個(gè)共同的(de)特點是(shì):當打開(kāi)後,全部都(dō>∑λu)是(shì)正常的(de),那(nà)麽Spider為(wèi)什(sεα↓hén)麽會(huì)報(bào)錯(cuò)提醒呢(€¶♣♣ne)?隻是(shì)因為(wèi)在爬蟲發起抓取的(de)那(nà)一→γβ(yī)刻,httpcode返回了(le)5XX",你(nǐ)的(de∏♥≈&)站(zhàn)點是(shì)否頻(pín)繁有(yǒ "u)這(zhè)樣的(de)問(wèn)題呢(ne)?有(yǒu)的(β©de)話(huà)需要(yào)立即安排技(jì)術(shù),♠✘‌→或者通(tōng)報(bào)IDC服務商做(z×₩'Ωuò)解決了(le)!


網站(zhàn)設計(jì)


  5、錯(cuò)誤的(de)抓取比例

  任何網站(zhàn)都(dōu)做(zuò)不(bù)↓→到(dào)100%不(bù)出問(wèn)題,但(dà®∞n)是(shì)萬事(shì)有(yǒu)一(yī)個(g‌✔¶è)度:我們認為(wèi),這(zhè)個(gè)比例不(bù∏→≥)超過5%,對(duì)網站(zhàn)基本上(shàng)是(¥©shì)無影(yǐng)響的(de),且這(zhè)樣的(de)錯(cuò€®≠)誤不(bù)應當每天都(dōu)出現(xiàn)。常見(jiàn)的(de)•✘↑抓取錯(cuò)誤一(yī)般都(dōu)是(shì)連接超時(δ©₽¶shí):"抓取請(qǐng)求連接建立後,下(xià)載頁面速度過♥"₩慢(màn),導緻超時(shí),可(kě)能(nén₽÷↔g)原因服務器(qì)過載,帶寬不(bù)足"這(zλ∞ $hè)種情況:

  A:盡量在不(bù)影(yǐng)響圖片質量的(d&‍e)情況下(xià),對(duì)圖片進行(xíng§ ‍)壓縮,上(shàng)傳的(de)時(shí)候就(jiù)進行 ₩π(xíng)了(le)壓縮。
  B:減少(shǎo)如(rú)JS腳本文(π>©wén)件(jiàn)類型的(de)使用(yòng)≥>☆↓,或者進行(xíng)合并
  C:頁面大(dà)小(xiǎo)進行(xíng)控制(zhì₩¥₹),尤其是(shì)一(yī)些(xiē)浏覽量、抓₹Ω₩取量較高(gāo)的(de)頁面,不(bù)建議(yì)超過2MB。
  D:增加網站(zhàn)的(de)帶寬,提升下(xiφφ™↔à)載速度,或者更換服務器(qì)。

  今天三好(hǎo)網絡關于網站(zhàn)✔♣收錄服務器(qì)端問(wèn)題就(jiù)分(fēn)享到(dàγ  o)這(zhè)裡(lǐ),更多(duō)網站(zhàn)建設、優化(huà)β♣£↓等問(wèn)題可(kě)咨詢三好(hǎo)網絡技(jì)術(shù)團隊δ✔¥。
TAG:
相(xiàng)關資訊
多(duō)一(yī)份參考,總有(yǒu)益處
聯系三好(hǎo)網絡,免費(fèi)獲得(de)專屬定制(≤₽÷zhì)《策劃方案》及網站(zhàn)建設、網站(‍​™®zhàn)設計(jì)、網站(zhàn)制(zhì)作(zuò)報(bào)價‍∏★
網站(zhàn)建設

咨詢相(xiàng)關問(wèn)題或預約面'₽∏談,可(kě)以通(tōng)過以下(xià)方式與我們聯系

業(yè)務熱(rè)線13387655359大(dà)客戶專線13543255359

提交需求提交需求

提交需求
熱(rè)線
微(wēi)信掃碼咨詢
電(diàn)話(huà)咨詢
微(wēi)信
業(yè)務熱(rè)線
提交需求
官方微(wēi)信
準備好(hǎo)開(kāi)始了(le)嗎(ma),
那(nà)就(jiù)與我們取得(de)聯系吧(ba)
13387655359
有(yǒu)更多(duō)服務咨詢,請(qǐng)¶γγ聯系我們
請(qǐng)填寫您的(de)需求
您希望我們為(wèi)您提供什(shén)麽>πφ服務呢(ne)
您的(de)預算(suàn)