《7天精通SEO》 --- 第1章:基础篇

庆勇
庆勇
庆勇
659
文章
0
评论
2017-06-1418:06:48 评论 55 7489字
  • “任何一门学科,基础知识都是非常重要的,只有在掌握了大量的基础知识之后,才会在实践中游刃有余。”

1.1 什么是 SEO

  • 简单地说,SEO就是从搜索引擎上获得流量的技术。
  • “目前SEO技术被很多目光短浅的人,用一些SEO作弊的不正当手段,牺牲用户体验,一味地迎合搜索引擎的缺陷来提高排名,这种SEO优化方法是不可取的,最终也会受到用户的唾弃。”
  • 网站优化分为站内优化和站外优化两部分。站内优化指的是站长能控制网站本身所有细节的调整,如网站结构、页面HTML代码、服务器设置、文章优化等。站外优化指的是外部链接建设及行业社群的参与互动,这些活动不在网站本身进行的。
  • “获得和提高目标关键词的自然排名是SEO效果的表现之一,但最终目的是获得搜索流量,没有流量的排名是没有意义的。SEO追求的是目标流量,能最终带来盈利的流量。”
  • ”网站的最终目的是完成流量转化,记住要做科学的SEO,切不可为SEO而SEO。“

1.2 SEO的作用

  • SEO在今天已经是一个非常热门的行业,尤其是电子商务的兴起,对SEO的需求也越来越大。
  • “每个经营性网站需要大流量的支撑才有转化的可能,搜索流量显得异常重要。”
  • SEO优化的主要作用:

1、通搜索引擎引来足够的流量,进一步扩大品牌的知名度,使其得到小投入大回报。

2、力图让搜索引擎给网站带来大的流量,使网站的业绩指标攀升,吸引投资者或者收购等。

3、吸引在搜索引擎上搜索某一需求的精准客户,使他们了解并购买搜索的目标产品。

4、依靠搜索引擎流量,换取广告商的青睐使其投放一定程度的广告。

5、希望获得来自搜索引擎的大流量,向浏览者推介某一产品,而不是当场购买。如生产型品牌企业网站、交友网站、会员模式站点等。

1.3 常用搜索引擎简介

  • 百度:“全球最大的中文搜索引擎、最大的中文网站。” “在中国要做SEO首先要研究的就是百度。”让人们最便捷地获取信息,找到所求”
  • Google:“Google的使命是整合全球信息,使人人皆可访问并从中受益。它拥有全世界最先进的搜索技术。“ 推荐大家多去关注谷歌的站长管理员指南,所谓“知己知彼,百战不殆”。
  • 搜搜:  已经与搜狗合并。
  • 搜狗: 搜狗是搜狐旗下的搜索引擎。

1.4 搜索引擎工作原理

1.4.1 爬行抓取

搜集工作也是要按照一定的规律来进行的,基本上有如下两种特征:

  • 批量搜集:对互联网上只要是存在链接的网页都收集一遍,耗时在几周左右。缺点在于增加了额外的带宽消耗,时效性也不高。
  • 增量搜集:是批量搜集的一个技术升级,完美的弥补了批量收集的缺点。在原有的基础上搜集新增加的网页,变更上次收集之后有改变的页面,删除收集重复和不存在的网页。
  • 主动提交网站:自己主动向搜索引擎提交网站,等到一定的时间就会来爬取。不过现在主动提交后再来爬行的速度越来越慢了,最理想的办法还是顺着自然链接来收集比较好。
  • 1、搜索引擎蜘蛛介绍:《各种搜索引擎蜘蛛介绍》----(点击查看)
  • 2、链接布局:《搜索引擎蜘蛛爬行链接两种策略》----(点击查看)
  • 3、避免网页重复收集:造成重复收集的原因在于蜘蛛并没有记录访问过的页面URL,另一方面还有可能在于一个页面有多个域名指向所导致。因此搜索引擎在这方面增加了一个额外的技术,分别定义两个不同类型的表,即”已访问表“和”未访问表“,依靠这个技术就很简单地解决了重复收集的难题。蜘蛛抓取到一个链接之后,从这两个表中判断这个链接是否已经被访问过,如果没有访问过,抓取回来添加到未访问表中去。
  • 4、收集重要的网页: 判断一个页面的重要程度可从这四点来检验,基本上能肯定下来这个页面的重要度。目录深度大的页面也并非不重要。1、网页目录越小越好。利于用户体验,节省蜘蛛爬行时间。2、高质量相关链接导入。从外部导入和自身相关度大的链接,可以增加页面权重。3、信息的新鲜度。一个有价值的网站每天都会更新,用户天天来看,蜘蛛也会天天来光顾。4、网页内容的原创性。原创性越好的网页重要性越高。

1.4.2 预处理

  • 通过前面的爬行抓取流程,已经把网页全都抓取回来了,接下来的工作就是对这部分数据进行一个索引工作,其中包括了很多个处理流程。和爬行一样,预处理也是在后台提前完成的。
  1. 关键词提取:搜索引擎完全能识别的依旧是以文字内容为主的。蜘蛛在爬取一个页面的同时也把大量的HTML代码抓取下来,如JavaScript/css/div标签等,这些对排名都毫无意义。首先的工作是要将HTML标签、程序去除,提取用于排名的文字。
  2. 去除停用词:同一个词可能在一篇网页中出现多次,如”得、的、地、啊、阿、呀、却、再、从而“之类的无用词,反复的出现就没什么价值了,我们称这类词为停用词。这类词也需要去除掉。
  3. 分词技术:分词是中文搜索引擎特有的技术支持。中文信息和英文信息的差别在于:英文单词与单词之间用的是空格分隔的,这对中文就行不通了,搜索引擎必须将整个句子切割成小单元词,如”我的兄弟姐妹“拆分出来的形态是”我“、”的“、”兄第”、“姐妹”。分词技术的效率直接影响到整个系统的效率。分词的方法基本上有两种:基于字符串匹配的分词方法和基于统计的分词方法。
  4. 消除噪声:网页上有各种形形色色的广告文字、广告图片、登录框、版权信息等,为了某些目的不得不放上去,这些对搜索引擎来说不是有用的东西,可以直接去掉。
  5. 分析网页建立倒排文件:正向索引:经过前面几步的工作之后就开始提取关键词了,把页面转换为一个关键词组合,同时记录每一个关键词在页面上的出现频率、出现次数、格式、位置,这样每一个页面都可以记录为一串关键词组合,其中每个关键词的词频、格式、位置等权重信息也都记录在案。倒排索引:正向索引还不能直接用于排名。假如用户搜索关键词3,如果只用正向索引,排名程序需要扫描所有的索引中的文件,找出包含关键词3的文件,再进行相关计算。这样一来计算无法实时返回排名结果。所以搜索引擎会将正向索引数据库重新构造为倒排索引,倒排索引以关键词为索引。
  6. 链接关系计算:链接关系计算是预处理中重要的一步。主流搜索引擎排名因素都包含网页之间的链接流信息。事先必须计算出页面上有哪些链接指向哪些其他页面,每个页面有哪些导入链接,链接使用了什么锚文本等种种的链接计算。Google PR值是这种链接关系计算的重要代表之一。
  7. 特殊文件处理:可以抓取和索引以文字为基础的多种文件类型。对Flash、视频、PPT、XLS、图片等非文字内容不能执行脚本和程序。搜索引擎目前还无法获取flash文件和图片中的文字信息。图片一般推荐使用ALT标签图片文字信息。

1.4.3 服务

  • 经过前面的爬行抓取和预处理之后已经存储了一定的数据,并且已经记录了重要关键词的集合,即正向索引和倒排索引中的关键词集合,每个关键词赋予特殊的编码形成了一个倒排文件。输入一个关键词就能马上从相关文档编号中找到所需信息了。
  • 例如用户输入某个关键词如”减肥“,查找的出发点还是比较模糊的,究竟是要找寻减肥方法,还是减肥教练等,这是大部分用户的一个习惯。搜索引擎处理方法是尽量把出现减肥二字的词都调用出来,可能包含几百页之多。排名靠前的,用户也就点击的越多。
  • 输出的结果采用列表即(搜索引擎结果页面(SERP))。文档摘要在(SERP)列表中起着重要的作用,一个丰富而有吸引力的描述更加能够引起用户的兴趣。那么搜索引擎是如何提取这些描述信息呢?一般从网页正文开头部分提取256个汉字,或者将每一个段落的第一个句子拼起来,一旦查询匹配就返回给用户。

1.5 SEO与网络营销

  • 网络营销是一种网上营销手段,以互联网为载体,制定详细的网络营销策划方案,预测和掌控每一环节,从而更有效地发挥策划的最大功效。SEO是隶属于网络营销范畴内的,只是它的一个细小的分支,但是SEO又是网络营销不可或缺的营销方式,它的低投入、高回报让诸多营销人士心动不已。

1.5.1 网络营销的前景

  • 互联网巨大的消费群体,只要你对自己的产品定位把握好,客户是迟早的事。SEO从2006年开始慢慢地在国内流行起来,是一个低廉而且非常有效果的推广手法,非常适合中小型站长。同时对于企业来说,既降低了推广成本,也使得推广效果大大地提高。SEO和网络营销是相辅相成的,如何正确有效地把这两点结合起来,正是我们日常工作不断在寻找的。
  • SEO已经衍生出另外一种更加有效的推广方法,不再单单只做网页的优化,而是结合搜索引擎的一些特点与网络营销结合起来,包括全方位的优化,比如用户体验上的优化、活动促销方案的优化、转化率的优化等,称之为SEM (搜索引擎营销)。

1.5.2 网络营销的优势

网络营销之所以会成为互联网不可或缺的热门行业之一,是因为营销的本质决定了绝大多数公司或者团队都不能离开它。网络营销的优势如下:

  1. 能直接进行在线销售,减轻库存压力。
  2. 网络营销可以花少部分的资金发挥最大的功效,范围广、速度快、无时间限制、能快速得到回应等特点,有利于提高品牌的推广,成本方面的降低比较明显。
  3. 网络营销范围广,可进行任何一个国家的网络营销操作。
  4. 市场信息更加的透明。
  5. 能制定各种网络营销活动,吸引潜在客户。
  6. 网络营销能布局长尾关键词,让每一个潜在客户无处可逃。

1.5.3 网络营销的劣势

  • 由于互联网的制度还有待改善,目前的网络营销行业也存在许多不正当的竞争手段、比如欺诈、产品质量无法控制等。以下列举三点网络营销的劣势:
  1. 无法当面看到实物,通过图片和文字信息无法获取100%的信任。
  2. 市面上价格幅度比较大,常常打价格战。
  3. 支付问题上存在风险。

1.6 常见SEO术语

  1. 网站分类目录:网站分类目录是人为编辑的搜索结果,即将互联网上较为优秀的网站收集整理在一起,按照不同的分类或者主题放在相应的目录中,大多数目录依靠的是人为提交而不是蜘蛛。
  2. 关键词:(关键字、关键词、关键短语)是Web站点在搜索引擎结果页面(SERP)上排序所依据的词。根据站点受众的不同,可以选择一个词、多个词的组合或整个短语。
  3. 链接养殖场:在SEO术语中,链接养殖场是指一个充满链接的页面,这些链接其实没有实际作用,它们只作为链接存在,而没有任何实际的上下文。| 那些采用黑帽SEO方法的人利用链接养殖场,在一个页面中增加大量链接,希望能通过这种方式使Google误认为这个页面很有链接价值。一个好的页面链接养殖场,页面中充实的是和本页面最相关的链接页面。| 因为传统的链接养殖场会容易受到处罚,因此擅长黑帽SEO的人便将其利用到站群手法中,一般这种站群被曝光后,就离被处罚不远了。
  4. 有机列表:即搜索引擎结果页面(SERP)中的免费列表,SEOer通过对网站内部的结构优化、内容优化以及相关的外部操作来提升网页在搜索引擎结果页面(SERP)中的自然排名。
  5. PageRank:是Google搜索引擎用来衡量网页重要性的一种方法,也是Google用来判断一个网站好坏的重要标准之一。PageRank目前被大量用于SEOer的日常工作中,比如交换友情链接,分析竞争对手等。一般影响PageRank最大的因素在于该网页是否拥有大量的高质量外链,网站内链以及导出链接等因素也会影响PageRank的值。
  6. 付费列表(Paid listing):只有在付费后才能列入搜索引擎的服务。根据搜索引擎的不同,每次点击(PPC)、赞助商链接(sponsored link)或者在搜索目标关键词和短语时网站出现的位置也不尽相同。付费列表在搜索引擎中又被称之为付费推广。
  7. 排名(自然排名):排名是页面在目标关键词的搜索引擎结果页面(SERP)中列出的位置,这里说的排名一般是指自然排名,即不包含付费推广后的排名结果。SEO优化的目标是提高网页所包含目标关键词的自然排名。
  8. 排名算法:是搜索引擎用来对其索引中的列表进行评估和排名的规则。排名算法决定哪些结果是与特定查询相关的。大多数搜索引擎决定关键词排名的因素都超过100种以上,但最为重要的一些算法在各大搜索引擎都是通用的。例如:网页标题是否包含目标关键词、关键词密度是否合理、内容质量以及外链质量是否很好等。| 正因为是涉及到排名的算法,所以并没有任何一个SEOer能够全部知道这些搜索引擎的排名规则,即使是现有的一些算法,也是广大的SEOer的经验总结,在一定的时期具有一定的参考性。
  9. 搜索引擎营销(SEM):这个术语可以与SEO互换使用,但SEM常常是指通过付费或者广告向搜索引擎展示站点,同时应用SEO优化技术。应用频率最高的是网页标题设计、描述设计以及整站规划等,大多数用户希望在付费推广的时候,同时也能在搜索引擎的自然搜索结果中拥有一个不错的展现效果。
  10. 搜索引擎优化(SEO):根据对搜索引擎的算法规则来优化内容,从而使页面能够被搜索引擎信任,并获得较好的自然排名。| 对于任何一家网站来说,要想在网站推广中取得成功,搜索引擎优化是最为关键的一项任务。同时,随着搜索引擎不断变换它们的排名算法规则,每次算法上的改变都可能会让一些排名很好的网站在一夜之间名落孙山。失去排名的直接后果就是失去了网站固有的可观访问量。所以每次搜索引擎算法的改变,都会在网站之中引起不小的骚动和焦虑。因此,搜索引擎优化也成了一个越来越复杂的任务。
  11. 搜索引擎结果页面(SERP):是为特定搜索显示的列表或结果。SERP有时候定义为搜索引擎结果的安排(placement)。在SEO领域中,在SERP中取得良好的表现就是一切。
  12. 垃圾技术:是一种欺诈性的SEO技巧,它尝试欺骗蜘蛛(Spider),并利用排名算法中的漏洞来影响针对目标关键词的排名。垃圾技术可以表现为多种形式,但是“垃圾技术”最简单的定义是Web站点用来伪装自己并影响自然排名的任何技术。根据是否采用垃圾技术,在SEO术语上可分白帽SEO和黑帽SEO。
  13. 黑帽SEO:用垃圾技术欺骗搜索引擎,一般叫做SEO作弊。黑帽SEO以伪装、欺诈和窃取的方式骗取在搜索引擎结果页面(SERP)中的高排名,比如群发留言增加外链、关键词叠加、域名轰炸、转向新窗口链接等。| 随着搜索引擎的发展,黑帽SEO的做法越来越容易被搜索引擎所识别,从而受到严重的惩罚。虽然黑帽SEO见效快,但一般不能持续多久,因为它有违搜索引擎以用户为中心的初衷。
  14. 白帽SEO:以正当的SEO优化方式优化站点,使它更好地为用户服务并吸引爬行器的注意。在白帽SEO中,能够带来好的用户体验的任何东西也都被视为对SEO有益。通常好的SEOer会对网站的各个细节进行优化和设计,来展现出一个良好的被用户所喜欢的网站,因为也会被搜索引擎所喜爱。
  15. 蜘蛛(爬行器):也称为蜘蛛程序(Spider)。网络蜘蛛是一个自动提取网页的程序,是搜索引擎的重要组成部分。作为蜘蛛来讲,就是尽可能多和快地给搜索引擎输送网页,实现强大的数据支持。| 蜘蛛在Web上漫游,寻找要添加进搜索引擎索引中的列表。蜘蛛有时也称为爬行器或者机器人。针对有机列表优化页面也就是为了吸引蜘蛛的注意。 | 网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其他链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。
  16. 网站权重:指网站与网站在搜索引擎中的分级制“待遇”表现,是搜索引擎中的一个综合表现指标。例如同一篇文章,在很多网站上都会列出,此时对于搜索引擎来说它不能单独地去考虑把哪个网站的文章排在搜索的第一位或者是前几条,而是根据网站权重来排名,哪个网站权重高,搜索引擎就会把它放在搜索第一位或者前几条。| 网站权重不是排名,因为自然排名是以单页面为单位,而网站权重是一个整体的考量。| 网站权重决定了网站排名的说法有些片面,因为网站排名需要综合考虑很多因素,网站权重只占其中一部分,不代表全部。提升网站权重是一个长期积累的过程,其中包括优质的外部链接导入、稳定的高质量内容和结构清晰的网站结构等。

1.7 常用搜索引擎指令---(常用12个)

  1. site:  查询某个特定网站的收录情况,有返回数据表明网站已被收录,如果返回数据为空,表明未被收录。如果以前已被收录,现在来查没有数据则被搜索引擎从索引中删除,俗称“被K”。用法:site:qingyongseo.com
  2. link:查外链指令,查询网站的外部链接。准确率比较差。用法:link:qingyongseo.com
  3.  related: 查询相关网页指令,可以用它来查询和你的网站内容相关的网站,利用related指令可以很轻松找到和你最相关的对手(仅支持Google)用法:related:qingyongseo.com
  4. info:能查询网站的收录信息、快照情况、相似网页、站点链接、内部链接以及包含域名的网页。属于综合指令(仅支持Google)。用法:info:qingyongseo.com
  5. allintext/intex/指令:有效的查询某个特定关键词在特定网页文档上出现情况。发现最相关的网页和潜在链接对象。该指令只支持Google搜索引擎。用法: allintext: 减肥
  6. allinurl/inurl 指令:查找特定网页URL中包含特定URL关键词,该指令既可单独使用,又可与其他指令组合来查找特定网页的内容,该指令只支持Google搜索引擎。用法:site:www.sina.com.cn  inurl:nba
  7. allintitle/intitle指令:查找特定网页标题中和所输入的信息相同的文字。用于查找竞争对手还是挺不错的。该指令只支持Google搜索引擎。用法:allintitle:qingyongseo.com intitle:网络营销
  8. allinanchor/inanchor指令:可以理解为查找特定关键词的锚文本链接。有点像查找外链情况,所不同的是输入的是文本。该指令只支持Google搜索引擎。用法:allinanchor:qingyongseo.com inanchor:营销
  9. define指令:查找特定的关键词非常的有效。Google比百度查询结果相对精准,但百度的范围较广,实践中可根据自己的情况取舍。用法:define:SEO
  10. filetype指令:搜索指定后缀的文件,如pdf、doc等。用法:filetype:pdf
  11. intitle指令:用来查询特定论文或者文章标题中出现特定的关键词。用法:intitle:SEO技巧
  12. domain指令:可以查询到某一网站的百度相关域,即百度外链,该指令仅适用于百度搜索引擎,在Google中该指令相当于一个关键词。用法:domain:qingyongseo.com
weinxin
我的微信
微信扫一扫
庆勇
  • 本文由 发表于 2017-06-1418:06:48
  • 转载请务必保留本文链接:https://zengqingyong.com/148.html
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: