危险漫步博客
新鲜的“黑客思维”就是从全新的角度看待黑客技术,从更高的层面去思考;专注于黑客精神及技术交流分享的独立博客。
文章2289 浏览18787881

Seo风尚 我们的圈里圈外

优酷和土豆合并了,QQ深情地望着360说了一句:“我开始相信爱情了”;苹果看了一眼安卓却说道:“我,再也不相信爱情了”!由此句YY话我们可得一个结论:对待同一件事情站在不同的角度去省视,得到答案是千差万别的,它们的相同点是都在阐述同一个事物,也就是我们经常提到的的同一个事物的两个方面。

对于SEO中就常存这样的歧义,我想,这也是它焕发光彩之处吧!为什么这样说,且听危险漫步为你娓娓道来——那些,不得不说的“秘密”,那些圈里圈外的SEO。

SEO,我们经常听到,但也经常被忽视。究其原因我以为:大多数人眼中,SEO虽然得到了普及和认同,但侧重点我们的第一印象“貌似”永远是面向站长乃至网络推广营销团队才需要具备的技能。其实非也,对于学习网络技术的我们,每天都会和SEO打一打擦边球。

歧义/擦边球一:Robots文件。在我们入侵一个网站的过程中总会遇到网站根目下存在robots.txt文件,此时有些朋友就会把它定义为该网站存在robots漏洞,当然知其所以然的朋友们一定不会这样认为,我们都晓得robots.txt是一个协议,而并非一个命令,更没有什么漏洞之说(这是比较绝对的说法)。robots.txt是搜索引擎访问网站时要查看的第一个文件,它的作用是告诉搜索引擎在服务器上什么网站可以爬行,什么网站则禁止抓取。也就是robots.txt在seo中是作为一种屏蔽网站有效收录的手段出现的,而在我们所谓的黑客领域它或许可以称的上一个漏洞利用的条件,因为在其文本中会罗列一些网站程序的目录,更有甚者,某些厉害的站长将后台地址也一并加入了robots.txt文件中,这样做就更方便了入侵者!例如百度和腾讯微博,我们一看便知,首先先观察其共性,它们的robots.txt地址都在网站的根目录下,由此可得robots,txt的第一个特点就是强制性必须存放在网站根目录下:第二步我们再来看其书写的规格,这里以百度的做参照内容如下:

第一个映入眼帘的是“User-agent”即中文直译“用户代理”,它是一种浏览器的标识,在这里它的作用是“指定下面的规则适用于哪种搜索引擎类型”而搜索引擎是通过一种爬虫蜘蛛(spider)程序去自动搜索互联网的网页并获取相关信息的,爬虫蜘蛛又称搜索蜘蛛、robot、搜索机器人等,常见的搜索引擎Spider有“Google蜘蛛-Googlebot、百度蜘蛛-Baiduspider、alexa蜘蛛iaarchiver、Yahoo蜘蛛-Yahoo! slurp、bing蜘蛛-MSNbot”等等,除此之外我们还可以使用通配符“”来代表所有搜索引擎;allow中文直译为“让”以此类推disallow就是“不让”的意思,这里我们可以把它们理解为允许和不允许,即该协议不允许搜索引擎蜘蛛爬行乃至不爬行某些特定目录。

“User-agent: Baiduspider Disallow: /baidu”代表规定百度爬行蜘蛛,不允许爬行/baidu目录,“User-agent:  Disallo、v./shifen/ Disallow:/homepage/ Disallow:/cpro”规定所有搜索引擎爬行蜘蛛不允许爬行/shifcn/、/homepage/、/cpro/目录。当然上文所介绍的只是robots.txt基本的语法,预写robots.txt文件还需要了解很多相关方面的知识,这里我就不做赘述了,但是关于robots.txt我们还需要了解到的一个常识就是,无论我们的网站是否需要去特意屏蔽某些网站的收录,都应该在网站的根目下建立一个robots.txt文件,因为有的服务器的设置有问题,当robots.txt文件不存在的时候会返回200的错误代码和404的状态码。

歧义/擦边球二:Seo的三种方式。只听说过入侵的时候有黑箱测试和白箱测试,也听过说Ddos有压力测试,不过自从和SEO兄弟打交道以后它又给我引进了三个名词,即Seo的三种定位模式“SE0黑帽、SEO白帽、SEO灰帽”,当然初次接触到这些“世说新语”也并不是在SEO中,浪迹网络的网虫们早已经熟知红帽等一些安全网站,甚至在网络打黑的时候举不胜举的网站都挂上了“白帽”的旗号招摇过市,那为什么我要在SEO中提到这三种方式呢?各中原因是因为我觉得SEO中将这三个词得到了深化,诠释的也很淋漓尽致。

在SEO中没有强烈的道德因素和价值观念,它不会像入侵网站、‘破坏程序那样随时被磕绊在网络安全红线的边界上,被指着鼻子强烈骂没有正义感、没有道德现,妄自随意的破坏某些网站,因为它所针对的就是站长自己的网站,说破坏如站长使用的是黑帽手段,那么其结果就是网站被降权,最后的失利者也是自己本身,当然也不排除某些站长为了提高网站的排名和权重使用黑帽手段去残害同类网站,如给同类网站大量投植广告等,这些手段就已经触及到了道德的因素,触摸到了法律的红线。

说了这么多,我想大家对SEO已经有了一个象形的理解,那么什么叫SEO呢? SEO中的三种方式定义又为什么呢?下文我们就来学习下。

SEO(Search Engine Opjmization),汉译为搜索引擎优化,是较为流行的网络营销方式及NNT,主要目的是增加特定关键字的曝光率以增加网站的能见度,进而增加销售的机会:分为站外SE0和站内SEO两种。SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。SEO白帽是一种公正的手法,是使用符合主流搜索引擎发行方针规定的seo优化方法。一直被业内认为是最佳的seo手法,它是在避免一切风险也避兔了与搜索引擎发行方针发生任何的冲突,它也是seoer从业者的最高职业道德标准。

SEO黑帽是一种不为搜索引擎所支持的违规行为,因为黑帽SEO挑战了行业道德底线,因此为被广大白帽SEO而所不齿。所谓SEO灰帽即是指介于白帽与黑帽之间的中间地带,相对于白帽而言,会采取一些取巧的方式来操作,这些行为因为不算违规,但同样也不遵守则,是为灰色地带。  

歧义/擦边球三:C类IP地址。C类IP地址是在SEO中经常提到的一个说法,因为它事关一个网站的权重问题,其实他和我们入侵中提到的C段有着异曲同工之妙,过去,很多大型网站都死在了Oday和C段下,当然我曾经也站在门外傻傻的瞧着C段这个名词,不明所以的从摇头到点头,心里傻傻的对自己发问:“什么叫C段,为什么它这么强悍?”当然这也不是我自嘲,我们都有从懵懂到知晓的这么一个过程。

我们都知道一个IP地址分为4段,如192.168.1.1这个IP地址中’,其中它的第三段就是被我们大家所详知的C段,C类网站数目比较多,它适用于规模较小的局域网络,在一个四段的IP地址中前面三段指代的是网络号码,第四段则指代本机号码。我们常用的C段旁注查询工具,它可以把网址转换成IP的形式208.98.29.1--208.95.29.255,并列出了同段下可能出现的主机,其次顺顺藤摸瓜到主机中的web网站,这是我们入侵中的c类。

在SEO行业中的C类,是这样认为的,具有同一个C类IP地址的网站或连接应该尽量避免做友情站点等操作,因为大量的连接和友好往来很容易被误认为是站群或者连接农场。

到目前为止我们也并不知道seo是否属于网络安全技术的范畴,但是我们却不容否认,每天接触网络安全技术的我们无时无刻也在接纳着SEO的相关知识,这可能也就是所谓的“触类旁通”吧!