国产在线无遮挡免费观看,91视频一区,国产丝袜无码一区二区三区

有一種力量其實(shí)一直在滲入大量的網(wǎng)站和頁(yè)面，我們通常看不到它們，而且它們通常也很蠻橫，大部分人甚至不知道它的存在，大家不要誤會(huì)，其實(shí)我說得是搜索引擎爬蟲和機(jī)器人。每天，上百個(gè)這樣的爬蟲會(huì)出來對(duì)網(wǎng)站進(jìn)行快速的搜索。不管是不是google打算對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行索引，還是spam機(jī)器人打算收集大量的 email地址，通常它們這樣的尋找是漫無目的的。作為網(wǎng)站擁有者，我們可以通過一個(gè)叫做robots.txt的文件來控制哪些動(dòng)作是機(jī)器人可以做的。

　　創(chuàng)建robots.txt文件

　　好，現(xiàn)在我們開始行動(dòng)。創(chuàng)建一個(gè)叫robots.txt的文本文件，請(qǐng)確保它的文件名是正確的。該文件必須上傳到在您的網(wǎng)站的根目錄下，而不是二級(jí)目錄下(例如，應(yīng)該是http://www.mysite.com，而不是http: //www.mysite.com/stuff)，只有滿足以上兩點(diǎn)，即文件名正確和路徑正確，搜索引擎才會(huì)根據(jù)該文件中的規(guī)則工作，否則 robots.txt僅僅只是個(gè)常規(guī)文件而已，沒有任何作用。

　　現(xiàn)在，你已經(jīng)知道如果這個(gè)文件該如何命名，以及應(yīng)該把它上傳在何處，接下來你會(huì)學(xué)習(xí)在這個(gè)文件中鍵入命令，搜索引擎會(huì)遵循一個(gè)叫做“機(jī)器人排除協(xié)議”(Robots Exclusion Protocol)的協(xié)議。其實(shí)，它的格式很簡(jiǎn)單，并且能夠滿足大多數(shù)的控制需要。首先是一行USERAGENT用來識(shí)別爬蟲類型，緊跟著的是一行或者多行DISALLOW，這些行是用來限制爬蟲訪問網(wǎng)站的一些部分的。

　　1) robots.txt基本設(shè)置

　　User-agent: *

　　Disallow: /根據(jù)以上的聲明，所有的爬蟲(這里用*表示出來)均不允許對(duì)您的網(wǎng)站的任何部分進(jìn)行索引，這里的/表示所有頁(yè)面。通常情況下這不是我們需要的，但這里僅僅是讓大家有個(gè)概念而已。

　　2) 現(xiàn)在讓我們做一些小小的改動(dòng)。盡管每個(gè)站長(zhǎng)都喜歡Google，但是你可能不希望Google的鏡像機(jī)器人挖掘你的網(wǎng)站，也不希望它把你的網(wǎng)站的鏡像放在網(wǎng)上，實(shí)現(xiàn)在線搜索，如果僅僅是為了節(jié)省你的網(wǎng)站所在的服務(wù)器的帶寬，下面的聲明可以做到這一點(diǎn)

　　User-agent: Googlebot-Image

　　Disallow: /3) 以下代碼不允許任何一個(gè)搜索引擎和機(jī)器人挖掘目錄和頁(yè)面信息

　　User-agent: *

　　Disallow: /cgi-bin/

　　Disallow: /privatedir/

　　Disallow: /tutorials/blank.htm4) 你還可以對(duì)多個(gè)機(jī)器人設(shè)置不同的目標(biāo)，看看下面的代碼

　　User-agent: *

　　Disallow: /

　　User-agent: Googlebot

　　Disallow: /cgi-bin/

　　Disallow: /privatedir/這個(gè)設(shè)置很有趣，這里我們禁止了所有的搜索引擎對(duì)于我們的網(wǎng)站的挖掘操作，除了google，在這里Google被允許訪問除了/cgi-bin/和/privatedir/以外的所有站點(diǎn)。這里說明，規(guī)則是可以定制的，但不是繼承而來的。

　　3) 有另外一種使用Disallow的方法:即允許訪問網(wǎng)站所有內(nèi)容，其實(shí)只要冒號(hào)后不輸入任何東西就可以了

　　User-agent: *

　　Disallow: /

　　User-agent: ia_archiver

　　Disallow:在這里，除了alex以外的所有爬蟲都不允許搜索我們的網(wǎng)站

　　4) 最后，一些爬蟲現(xiàn)在支持Allow規(guī)則，最著名的就是Google。正如這個(gè)規(guī)則的名字所說，"Allow:"允許你精確的控制那些文件或者文件夾是可以被訪問的。然而，這個(gè)文件目前還不是robots.txt協(xié)議的組成部分，所以我建議只有在必須使用時(shí)才使用它，因?yàn)橐恍┎粔蚵斆鞯呐老x可能認(rèn)為它是錯(cuò)誤的。

　　下面的內(nèi)容來自于Google's的FAQs for webmasters，如果你希望除了Google以外的爬蟲都不挖掘你的網(wǎng)站，那么以下的代碼是做好的選擇

　　User-agent: *

　　Disallow: /

　　User-agent: Googlebot

　　Allow: /

上一篇：重慶教育學(xué)院大學(xué)英語(yǔ)網(wǎng)站建設(shè)成功

下一篇：網(wǎng)站運(yùn)營(yíng)的四大基礎(chǔ)輔助系統(tǒng)

標(biāo)簽：

日韩一区二区三区免费视频_日日摸夜夜添夜夜添高潮喷水_日韩欧美亚洲国产精品字幕久久久_日韩肥胖老妇aV

搜索引擎指南robots.txt文件

相關(guān)閱讀

匯總搜索引擎網(wǎng)站的免費(fèi)提…

網(wǎng)站建設(shè)分為幾個(gè)步驟？

網(wǎng)站能干什么？

谷歌關(guān)閉三個(gè)工程辦公室全…

重慶網(wǎng)站制作對(duì)企業(yè)的幫助…

建設(shè)一個(gè)網(wǎng)站需要多久

最新發(fā)布

重慶網(wǎng)站制作對(duì)企業(yè)的幫助…

傳統(tǒng)行業(yè)如何把握ai人工智…

AI人工智能對(duì)網(wǎng)站建設(shè)行業(yè)…

簽約重慶韶恒科技有限公司…

福萊雅暖通設(shè)備有限公司官…

祝賀重慶視吉通信工程有限…

建設(shè)一個(gè)網(wǎng)站需要多久

簽約重慶立平物聯(lián)網(wǎng)科技公…

定制型網(wǎng)站到底有哪些好處…

如何讓你的網(wǎng)頁(yè)設(shè)計(jì)更漂亮…

網(wǎng)站如何通過設(shè)計(jì)來保持網(wǎng)…

簽約圖源建筑設(shè)計(jì)公司官方…

服務(wù)

案例

方案

聯(lián)系

聯(lián)系我們