首页内链消除干扰的方法

  首页内链消除干扰的方法一般做SEO的朋友,大家应该明白一个网站的首页是比较容易获得排名,也是最具竞争力的。原因呢就是因为URL短,网站内部链接集中指向首页。

  对于一些大中型网站来说,如何让首页获得一个良好的排名,却是一件很头疼的问题,为什么呢?让我们来看一下首页的链接情况:

  常见的网站的首页内链:

  1.导航条:“回到首页”,“首页”,“Home”等等2.Logo:一个图片链接到首页3.页面中的Header/Footer中:“首页”,“Home”等等上面所说的一般都是常见网站内链链向首页的方法,大家发现什么问题没有?

  所有的链接几乎都不是用的关键词来指向得首页,如果把链接当成投票。特别在中大型网站中,内链占了大多数的情况下,有1000个人中,有200人投票给你说你是男人(外链),800个(内链)投票给你说你是女人。那你到底应该是男人还是女人呢?

  拥有如此多数量的内链,你也首页也不可能指望在“Home”,“回到首页”这样的无价值关键词上面获得排名吧???如何解决这个问题,常见的手法:

  1.把锚文本换成关键词———最简单,也是最有效的方法,可是有时候替换会造成页面破坏,怎么办?我们继续看下去2.nofollow掉这个链接———也很简单,nofollow属性可以避免关键词的传递,有效的阻止类似于“Home”,”回到首页”这样无意义的关键词价值的传递。

  3.使用JavaScript——–也没什么压力,搜索引擎都找不到它4.做成图片,或者本身就是图片,添加alt属性,其中植入关键词——–老方法了5.利用CSS隐藏链接,这边主要是运用在图片中,例如

  然后在css中#logo {background: url(“/logo.jpg”);text-indent:-2000px;height:100px;weight:150px;}

  把文字移动到2000px外去,相信应该没人能够看到了。同时用户看起来又是一个图片,这个小技巧可以很好解决图片链接的问题。

  有人肯定要问:这样做应该算是隐藏文字吧,会不会被当成作弊呢?曾经在08年的时候有人就这个问题向Google咨询,得到的答复是:在技术上不会当做作弊,但是如果你故意隐藏一大段文字在中间,那可就对不起了,还是会被当成作弊。

  怎么样,看完了之后是不是想对自己的网站做一个小手术了呢?欢迎好青年们在下方留言,我基本都会回答。

  没有相关文章。

随便写写的对SEO行业的看法

随便写写的对SEO行业的看法

最近看了不少同行的博客,质量高低参差不齐。有的人写的相当专业,有的人写的都是泛泛而谈。但对自己的定位,高手们总是说自己不是高手,菜鸟们总是吹嘘自己有多么多么厉害。

做SEO已经有一年半了,随着技术的深入,发现SEO是一个边缘学科,不是说它不重要,而是它涉及的面太光,在每个领域都是在边缘,但是却要涉及多个领域。很多SEOer会编程,会美工,会管理服务器,但很少有顶级的developer, designer, system-admin。甚至有些人对SEO技术都不怎么熟悉,只是擅长管理,管理着更多有才能的人,也能做好SEO。

看到一个新手言论,说所谓的SEO高手,就是外链高手,能短时间内制造出大量链接的。这种说法我自然是一笑而过,但是思维一转,一个新手对SEO行业的了解,也可以说接近大众对SEO这个行业的了解,所谓SEO,在大家眼里就是“发”。发帖,发博客,发链接的网络垃圾制造者。

SEO需要技术吗?我的回答可以说是100%需要,但是这个技术能发挥多大作用?不同网站不一样,看过Zac的书里面的那些案例分析,似乎他的那些方案里面,没有牵扯到多少技术方面的信息。无非就是改title,改url等等。但是事实上,这只是对于一个没有SEO的网站,这些修改就能有明显的效果了,但是对于一个已经优化过的网站,如何再提升?当你竞争对手也这么做了?你如何再提升?越到高端,技术要求也越高,页面加载速度快0.1秒,也许就是你的机会;页面信噪比比别人少10%,也许就是你的机会;相关页面聚合度高,也许就是你的机会;用户停留时间长,也许就是你的机会。

从上面看来,很多东西已经涉及了前端,数据库,用户体验方面多个领域,如果你还只是停留在入门,甚至是听说的地步上,那你的SEO技术只能运用到一个普通的,没有SEO的网站上。真正竞争激烈的领域,你会发现你的思路就被阻碍了,你感觉我标题,url,收录都解决了啊,怎么流量还是不多呢,你也提不出更多的建议,这就是你在技术方面的阻碍。

为何有些公司招聘一定要有学历的要求,如果说有实力的人都是没学历的,那大家都可以不用读书了。一般有高学历的人,接触的东西比较多,视野也比较开阔。(有些是个例。)也许刚开始他并不是非常突出,但是时间久了,这类人成为人才的可能性肯定也要高一些。

SEO也是一样,你接触的东西越多,你成为人才的可能性也越大,如果只是停留在几个改标题,改关键词,发外链上面,那你永远只能操作一些小项目,给你大项目你都不知道怎么去操作。SEO是可以控制的,但是不是只靠标题,关键词之类的来控制,必须是一个多方面,多个因素的结合,你才能慢慢把握搜索引擎的规律。

至于市面上的那些《2011年解析搜索引擎算法》,《最新搜索引擎解密》之类的文章,除了一群人在YY,让新人当时看了大呼神奇,回头想想,似乎都是老生常谈。

多学一些正统的东西,少看看A5,SEOWHY之类的SEO网站,那只是浪费时间。

用户体验与SEO的关系

用户体验与SEO的关系

用户体验一直是我比较弱势的方面,主要原因还是和工作经验和研究方向有关。很多人说,做SEO,其实就是做用户体验。根据我之前的经验来看,很多时候SEO和用户体验还是有一点矛盾的。但是最近在新一轮的产品需求讨论会上,我感叹,的确网站用户体验和SEO有时候确是高度契合的。

如果只看到这里,感觉我说了和没说一样。SEO和用户体验,又矛盾又契合。我直接谈一些例子,来看看两者是如何矛盾的。

1.网页分页的页号,是全部展现呢?还是只展现5个?

这是一个老问题了,展现太多吧,页面上乱七八糟,展现太少吧,收录又不得力。

2.部分内容用ajax加载好呢,还是不用?

我们 网页有一个很重要的部分,叫做”过滤器”,这块内容是帮助用户进行2次检索的,但是由于内容需要请求搜索引擎,加载慢于搜索结果,因此用了ajax加载,便于用户在浏览正常搜索结果不会被拖慢,这是符合用户体验的,但是ajax不能被搜索引擎爬行,里面的链接自然就爬行不到了。

3.报告页面用flash或者图片好?还是用文字好?

文字是搜索引擎喜欢的,图片和flash搜索引擎理解不了里面的内容,但是用户一般来说,希望有更加直观的动画或者图片来传达意思,大段大段文字一般都没人有兴趣看。

上面说的3个问题,都是SEO和用户体验有所矛盾的地方,这样的问题还有很多。通过SEO人员的调和,可以采用一些曲线救国的方式,来解决这样的问题,因此SEO需要技术吗?这个问题我想很多人已经有答案了。比如第三个矛盾,html5是一个不错的选择!

下面说一下SEO和用户体验有结合的地方。

1.用户提出,网站的内容需要上一页和下一页的功能。

这是一个听上去很简单的功能,但是我们一直没去做,主要是和我们的构架有关,为了这个东西,需要额外的去请求一次数据库,我们觉得不值得,但是事实上这个对SEO还是有一点帮助的,这次直接由用户提出了。

2.用户提出,报告页面需要有一些说明文字来说明图表。

一张折线图,抵不上”XX今年比去年增长了15%”,主要还是图表功能肯定需要自己制定,需要用户去操作,那人家自然是不愿意去麻烦了,那正好,我还想穿插点文字信息丰富页面内容呢,这次就给你吧。”Don’t make me thinking”,是UED过程中一个概念。

3.用户提出,能给一些专业名词/概念的建议

网站内容中,总会出现一些用户不明白的专业名词或者概念,这时候,就需要我们能给他一些提示,让他继续阅读下去。这边可是一个加内链的好机会,促进的爬行的过程中,又能提高PV。其实这个功能很多网站都有做,文章中穿插链接,但是那些穿插的链接,真的是用户想要看到的吗?比如我这边举个例子,网站是哪个就不说了,它们文章的链接,连”女人”,”流行”,“衣服”,这样的词,都要去加个链接。这样的链接,除了让我在阅读文章的过程中头晕眼花外,什么用处都没有。因此,这些锚文本的准确率,值得我们研究。会上我们提到了tf-idf的权重概念,一个词的整体文档出现频率太高,那就完全没有做链接的必要。理想状态是,一个用户能够无障碍的阅读完全文,遇到不明白的概念,总会有另外一个页面或者提示来说明。

SEO不是一次性的工作,SEO是为搜索引擎打工的工作,你把你的网站做得能更加规范,能提供更多有价值的内容,那搜索引擎也会给予你更多的流量。

SEO为什么遭人恨?

SEO为什么遭人恨?
今天中午的时候,向公司技术部门的同事询问了一些页面结构修改方面的困难。虽然之前有所感觉,但是没有详细的确认过。

页面结构的调整,内容丰富程度,都很大程度上影响着SEO的效果,尤其是对一些大网站来说,数据丰富,结构复杂,轻易调用一块数据,没那么简单。

前两天在群里面说过:“想要解决整体收录的问题,只要能让网站任意一条旧数据,都能在很浅层的地方调用出来”。如果你不能理解你的网站的架构,数据库结构,很容易把SEO做到遭人恨。

为什么这么说?拿我们自己网站为例,打开一个页面。除了文本内容,还有一个相似条目,同类条目的模块,这两个模块,需要向Solr发送一次请求。设计时候,这些条目还有附加信息,需要向数据库发送请求。大文本内容,又要向Mongodb发送一次,几个请求下来。页面速度已经不怎么好看了。

缓存是完全不够用的。千万,上亿的页面等着被搜索引擎抓取,原本网站内部的结构已经控制着搜索引擎不断抓取新的页面。除非所有页面静态化,否则帮助有限。

而每条信息又有几十个不同的参数,在数据库里面组成了一个多表互相关联的情况,很容易出现超级长的SQL语句

如果你不考虑这些功能对网站性能的影响,实现难度,复杂程度,单纯的要求技术部门帮你做这做那,我觉得一般人家的确不愿意做了,一是因为有时候这个看似很简单的功能在我们这边就是无法实现;二是因为我也不知道这个功能对我们网站有多大帮助。

“SEO改那些东西有毛用?”,“SEO总是提些奇奇怪怪的要求!”,“这功能不可能做出来的!”

SEO们责怪别人技术不行,技术责怪SEO乱来,一个公司可以没有SEO,因为还有其他推广手段,但是没有技术不行。最终SEO就落成一个被人抛弃的部门。

许多SEO还在沉浸在自己给自己创建的梦想之中:通过SEO来大量的流量,通过SEO日赚XXXX,通过SEO致富发财。我们是新兴行业。

一些SEO“专家”们,最多谈的东西,都是些和自己八竿子打不着的互联网新闻,今天这家公司上市了,明天那家公司出新产品了,并且时不时指点江山一下:“电子商务泡沫要破啦”,“这个产品对SEO有帮助啦”。让一些不明真相的群众们看着:哇,这群高人站在潮流的前端。做SEO很前卫,很时髦。

一谈SEO技术,要么是炒冷饭,摆出一副良师益友的姿态,比如“入门帮助”,“新人干货分享”其实网上一搜一大堆;要么就是谈策略。

回头仔细看看这些策略,大都要上升到商业层次,这个市场啊,用户啊,营销啊一套又一套。全是高度概括,好比脱裤子放屁,压根没看出来和SEO有什么直接关系。

一群人沉浸在自己的乌托邦中,幻想只要坚持下去,SEO没什么做不到的。打个比方,坚持原地踏步走,不能让你往前挪一米,虽然这也叫坚持。

另外一个幻想,就是幻想自己在努力,在学习。每天这个QQ群跑到那个QQ群,这个论坛晃到那个论坛,不停地等着“专家”们能够放出一些能一招致命,快速提升流量的方法,时间就在这种闲晃中过去了。有的SEO真的做的很闲,因为没什么东西好做。没有自己的想法,也无从下手。觉得SEO不就是写文章和发外链吗?不停的发就行了,还有什么好做的呢?网站要修改,找程序员嘛,改不出又不是我的问题。

吐槽有点多,回头正事上来,如何解决SEO遭人恨的问题?

沉下心来学点有用的东西,不要幻想一招致命。

如果你不怎么喜欢程序,先研究研究统计学,市场营销学(很多SEO在谈这个,不知道有多少人理解什么叫营销,并且不建议看网络营销,先看看线下营销,因为这是经过几百年的发展总结出来的经验之谈),信息架构等等地东西。(看书绝对是好习惯,难道指望那些“干货”博客一篇两篇文章就能把这么复杂的一个课题说透?)

网站技术是100%要明白的,否则无法和技术人员沟通。如果你连服务器,数据库,前端代码都弄不清是什么东西。不知道它们是怎么工作的。那真不知道你的SEO有多大难度。(我见过有个SEO主管把301作为一个高端技巧来形容。)。改改title,meta,改改h1h2加粗,改改url,发发帖子?等着流量自己上升?

有了技术的基础,能与技术部门共同协作了,网站的SEO才会有希望做好,也能解决本文开头的问题,网站我想新增一个内链模块,如果能照顾到我们的数据库查询难易程度,花费比较小web开销。考虑到技术人员工作的流程,写清楚各类文档。把自己作为技术的一份子去做,而不是高高在上要求别人这样那样,SEO便不会再那么吃力。

将SEO整合入整个项目过程

【SEOmoz】翻译+个人注解:将SEO整合入整个项目过程

当网站经常更新修改,很容易造成一些对SEO有巨大影响的错误。有时网页的标题只包含了公司名称;又或者是文件从测试服务器上COPY过来时,把noindex标记也一并带来了(夜息注:我就遇到过这样的悲剧。);再或者说你发现某个分类下的链接都是nofollow的。错误随时会发生,但是将SEO理念注入整个网站项目能帮助你及时发现这些错误。

?

需要整合SEO工作的,有下面四个环节:

l 计划阶段

l 设计阶段

l 开发阶段

l 运营阶段

?

(夜息注:似乎一个网站项目的过程全包含在里面了,可见想要做好SEO,必须步步为营。)

?

?

想要做好SEO,那最好的解决方法就是在每个阶段开始的时候,就让SEO工作者加入其中,或者在让SEO参加会议讨论。让SEO人员对整个计划给出SEO方面的建议,比等到项目完成了,再让SEO提出修改方案要高效率得多。尽量让项目在一开始在SEO领域就朝正确的方向走。

?

(夜息注:一般公司对SEO不怎么理解,以为只是一些代码方面的小修改,其实SEO是富含技术含量的全局化操作。)

?

计划阶段

将SEO加入这个阶段是非常重要的,它能够为整个工程设定一个期望值。当你们投票决定是否要开发一个新功能或者重新设计网站,再或者增加一些新的内容时,如果你有SEO的思维,你就能对整个项目做出较大贡献:目标群体期望和项目功能是否一致? 如果这是一个商业开发项目或者合作项目,你如何调整平衡SEO的利益?

?

如果你的SEO工作没有与整个项目组脱节,计划阶段是开展SEO好机会。为项目组的每个人提供一个SEO的提醒列表,让他们在开展自己的工作时,能够提醒他们将必要的SEO思想融入到工作中去。

设计阶段

在设计阶段,你可以在网页线框图转交到设计或开发人员前进行检查,以确保SEO的元素融入到整个网页中。在程序员们把代码都写好之前,把一个h3标签换成h1标签要容易的多。更为理想的是,你能够和整个前端团队一起工作,在需要代码修改时,在旁边作出注解好让每个前端同事都注意到。把需要SEO修改的东西列成表是一个好注意。

(夜息注:以我个人工作的经验,把SEO需要修改的地方列成表并且进行追踪跟进是一个高效率的行为,因为你不知道哪天你自己或者你同事就会忘记其中的一条或者多条。)

?

?

让你完成线框图时,你得确定所有页面上的注解都已经设置完毕,并且能够被开发人员看到。尤其是标题,URL阶段,元标记,标题标记,不用JavaScript制作重要内容(夜息:比如导航,内链池等等),网站分析系统追踪代码部署正确等等。这能避免设计人员重新回头再修改,节约时间和防止每次最后去找人修改的时候被鄙视。

?

(夜息注:我们前端负责人和我聊天说,我们最痛苦的就是晚上6点打算发布新版本下班回家了,你突然跑过来说还要改这改那的,我们还得继续加班。)

?

在整个网站进入开发阶段前,与开发负责人开个一个简短的会议,讨论一下如何在较小调整下,把SEO工作执行以及如何节约时间。一般这个过程可以包含在这个项目讨论会上,抽5分钟来确定一下SEO的工作执行情况。尽可能简短一些,因为大家的时间都很宝贵:)。如果你们的开发人员并不是很懂SEO,那你可以向他们推荐一些基础学习资料。(夜息注:《Google网站质量指南》是不错的选择,不过有时候他们并不愿意看那么长的东西,就需要你作为SEO,自己去挑选一些和开发人员有关系的SEO知识来培训他们以方便更好的开展工作。)

?

开发阶段

这个步骤是很直截了当的;你可以在正式发布之前去开发服务器上检查一下。对照提醒列表,你确定是否每一项都严格的执行了,并且那些线框图上的SEO元素有没有正确的添加。有些在所有页面的东西,比如noindex,nofollow等,能否顺利的检查,取决有开发服务器的配置问题,如果不能,则通知开发人员这个开发环境不利于开展测试。(这边需要用一些专业的用语)。你可以发一份邮件给他们告诉他们有这个问题。

?

当有还有一些问题需要被修正时,那就需要通知开发人员。这边建议写一份详细的文档,配合带标记的图片,比1000字的废话要强很多。当然,清晰的文字说明还是必要的。当开发部的同时为你提出的修改加班到很晚,那记得第二天对他表示感谢或者带份早餐。

?

运营阶段

当这个项目正式上线后,重新再检查一下你的提醒列表确保万事大吉。这个步骤还是很重要的,因为开发服务器和正式服务器环境不同,所以有些代码可能会发生改变或者执行错误。如果你网站更新时发现了这些问题,那可以考虑把网站版本倒回去来防止SEO方面出问题。

?

(夜息注:下面一段我感觉是废话,我就不翻译了。我个人的理解,在运营阶段,SEO经常打交道的部门有UED+前端,数据分析和SA。通过对网站流量分析数据,了解运营策略并且在SEO方面对主要业务进行照顾,同时与UED和前端配合对网站调整优化。最后,与SA沟通合作,通过对网站日志分析,关注每天爬虫爬行和网站索引收录的情况。当然文案部门是直接共同工作的,网站新增内容页面或者子站,都需要有合适的内容,这边通过SEO中的关键词分析技术,把握行业热点,确定项目内容,是非常给力的。)

培训

把SEO融入到整个网站项目中去是非常重要的,尤其是那些大型网站,每天都有着大量的更新,一个全面的SEO优化和发现网站错误同样能提高网站的表现。虽然如此,培训还是不可或缺的。每个人接触代码或者运营网站的人,至少都应该有一些SEO的基本常识。这意味着对于公司内部SEO工作建设,你必须为你的组员们提供一些培训课程。培训开发人员和市场营销人员能减小你开展SEO工作时的阻力,因为大家都对SEO这个概念了解,同时能够很好的遵循你为他们设置的那些”SEO规则”。

?

另外一个好方法是基于你们公司网站和SEO的情况,建立一个SEO准则或者公司内部SEO指导,并且把它放在公司内部网上让每个人都能看到。确保整个项目的SEO工作都被完美的执行。当每个人都对SEO了解并且发现项目中有地方和SEO标准冲突了,那就能做出及时的修改而不用都等都做好了再回头为了SEO重做。

搜索,推荐,聚合和SEO:放大你网站潜力的SEO方法

搜索,推荐,聚合和SEO:放大你网站潜力的SEO方法占个坑,有空继续写一.前言本文比较适用与中大型网站的SEO人员,小网站也可以参考,先说明两点本文是写给有一定实战经验的SEO看的,如果扫了两眼就说完全看不懂,那不是我的问题。

这个方法经过了大量的研究和实践,证明是一套一直会有效果的SEO方法,至少我身边好几个朋友做的都挺好,给网站带来了大量的SEO流量。但请不要企图在看完本文后30秒你网站流量没有飙升觉得我在忽悠有具体问题可以@我新浪微博或者QQ上找我询问,我很乐意解答,如果是这个应该怎么做啊,看不懂之类的问题我也无法回答。

目的在于探讨一种挖掘网站的内容潜力,把网站中用户可能会关心的内容呈现给用户,满足其需求,获取相应的SEO流量。

很多大型网站都在用的一种方法,但是很少有人出来详详细细的解释。

这样的SEO流量是如何获得的,下面举一个通俗易懂的例子。

假设我在百度上搜索“iOS 英雄无敌3”,目的是找一个能在iOS下运行的英雄无敌3这个游戏。

事实上这个游戏并不存在。因此压根不存在一个页面可以让我找到我想要的内容(如果有也是标题党)于是我进入了tgbus的这个关于iOS 英雄无敌3的页面。

我在这个页面上找到了iOS上的英雄无敌2这个游戏以及其他类似英雄无敌3的iOS游戏,以及一些奇奇怪怪的新闻(ok,这个页面做得并不是很容易阅读)Finally,我在tgbus上下载了英雄无敌2的iOS版本试试。

OK,我们再换个实际生活中例子:

一个姑娘去买衣服,于是看上一条粉红色的连衣裙,但是没她要的尺码。

这时候营业员会怎么做,没错,推荐一些类似颜色or款式的连衣裙,并且有码。

(TGBUS似乎推荐出了一条牛仔裤。)SO,我们应该如何去找出用户想要的连衣裙和我们仓库中有的连衣裙,并且在最恰当的时候给用户最好的结果,还能获取到SEO流量,这并不是一件很简单的事情。

Wait,这不是就一个推荐引擎么?这么复杂的玩意交给工程师做就行了。事实上多数时候,这只是SEO们一厢情愿的东西,工程师才不会来鸟你什么推荐引擎,我们先从一个可执行的角度,自力更生来把这个SEO方法实施下去。

二.内容分析,关键词分析,数据接口设计内容分析一个SEO知道自己网站有多少内容很重要,经常遇到和人说:“你网站这个XX页面有问题” ?? “啊?这是什么页面啊,我从来没见过。”

一般一个网站垂直去分,有首页,内容页,列表页。

内容页中,又可能分图片页,评论页,文章分页等等列表页中,又可能分频道页,产品列表页,索引页,专题页等等。

一般一套页面对应一套甚至多套php模板。

需要弄清楚这些模板是否在一个架构内,是否公用数据库,页面上使用了哪些字段,最好可以找到对应模板的开发人,如果有条件申请到源代码查看权限,可以自己看一下。一个内容聚合的需求可实现度很大程度上取决于上面这些内容,先弄清楚把配料都弄齐全了,再开始做菜,否则巧妇难为无米之炊。

横向去分可能是更多往business方向考虑,比如有我们有卖线路的,卖门票的,卖酒店的,攻略,用户图片,论坛帖子等等各个频道,各个频道可能是由不同的部门在负责。哪些是网站热卖的,需要热推(至少你做个SEO的东西得有商业价值,在电商公司非常重要),包括各个频道是否有人还在运营,一个常年无人打理的频道,显然不是一个好的内容源。一般来说,主要的产品线,和UGC的内容一般是网站内容提供主力。如果我们想挖掘用户需求,也可以优先考虑它们。

这个步骤需要花很多时间,复杂一些网站甚至要1个月才能弄清楚网站到底有多少类型的页面。在弄清楚上面的问题之后,接下来,就需要只要知道各类内容有多少数量。

比如多少个SKU,多少文章,多少帖子,多少tags,多少分类等等这是很多人在做类似工作时考虑不周全的,凭感觉去做。最后做出来一大堆重复内容的页面,重复页面对SEO有多坏的影响就不用再提了。

这个统计内容数量的办法(从好到坏排序)。

1.读数据库2.通过一些”巧妙”的办法去数3.用工具抓4.靠经验猜(基本不靠谱)读数据库是最简单,也是最准确的办法了,一个select完事。

如果没有数据库权限,就要去想办法知道。比如文章有多少条,那可以计算分页数量*每页文章数量来统计如果是自增id,那来凑自增id来数如果是固定格式数据,比如来北京的图片,北京的天气,地区数量*类型来计算,等等通过工具抓是很多seo的梦想,无数人问过这样的问题,有没有什么工具可以统计出我网站有多少网页啊。

抱歉,还真没有,由于种种网站原因,没有任何一个工具可以统计出一个中大型网站到底有多少网页(谁有那这个工具比google,百度爬虫还NB),太多的爬虫陷阱,阻碍深入抓取的东西了。当然,这样的抓取工具并不是一无是处,对于小型网站,或者特定频道,甚至特定区块的抓取,还是有一定作用的。比如Httrack,Xeun,当然还有我比较喜欢用的火车头。python,shell等脚本语言一直是万能的。

对于分库分表的超大型站,我也没有经验应该怎么做,但是我觉得和数据库管理员搞好关系他可能会帮到你,毕竟人家才是专家。

上面基本就是内容分析的大致情况了,弄清楚内容的种类,数量和运营情况,对SEO是有很多好处的。

关键词分析关键词分析我一般从3个角度去考虑。

1.搜索量,其实这个指标是最不重要的,但是确实是大家最关心的指标,所以我先放第一个说。大部分到访关键词的搜索量都是很低的。我举个例子看一下。

选取了某频道月访问量低于30次的关键词,平均下来就是一天只能带来一次访问的关键词,是163k左右的访问量1选取了月访问量高于30次的关键词,平均下来就是一天只能带来一次访问的关键词,是145k左右的访问量1连续观察这组数据我们可以看到如下结论1一个月能带来1000访问量的关键词,平均到每日也仅有30多左右,这个频道的平均CTR大概在10%左右,那每日的搜索量也仅有300,不知道读者能看懂我的意思没,搜索量并没有想象中那么重要。

2.相关性,这个相关性又分两个方面,1是关键词之间如何把有相关性的东西提取出来,学术一点的概念叫做聚类,2是关键词和内容之间如何建立相关性。

先说说为什么要把有相关性的关键词提取出来,1是便于分析用户的兴趣点,以小见大。2是查找重复/类似的关键词。说个常见的外贸行业的SEO手法,往zencart或者magento里面导入几百万的关键词,然后再站内搜索中搜索产品,生成几百万个页面来获取SEO流量,思路是正确,但是做法太粗糙,往往生成的几百万页面中只有几百个页面能获取到流量。我们来看看下面一些关键词”

去北京玩多少钱北京玩多少钱北京玩几钱北京玩要多少钱…”

这些关键词讲述的意思是一样的,完全没有必要制造多个页面.

3.商业价值三.关键词挖掘,清洗与过滤关键词的挖掘说难不难,说简单也不简单。

基本每个人都会问,怎么挖掘关键词制作词库。先说说一些常用的手法。

1.baidu/google API2.采集爱站,chinaz,伯乐等数据3.采集百度下拉框(其他搜索引擎同理)4.采集百度相关搜索(其他搜索引擎同理)5.站内搜索和自然流量关键词6.现成字典/词库讲点具体实现的一些注意点,都是在实践过程中总结出来的东西。方法说了,基本10个人里面有1个人去实践一些就不错了1.百度和google的api是要申请的,想办法搞一个,如果没有,只能用百度网页级别的采集,百度竞价后台经常改,所以不是很稳定,这边友情推荐一个工具http://www.lingdonge.com/(暂时备案中可能打不开),作者很nb,搞侠客站群软件的。百度API的python的SOAP通信有BUG,连不上(可能我水平太低了T_T),PHP会SOAP通信的话可以自己写脚本来跑,Google的没玩过,应该差不多2.API是有精确搜索量的数据,所以是词库第一数据来源3.百度下拉框反采集做的比较少,采集地址为http://suggestion.baidu.com/su?wd=xxxxxxxxx+一堆参数的,具体调整一下,一个小脚本可以搞定,但是数据深度有限,一般采集2轮后就不用再采了,基本采不出新数据了4.相关搜索可以用火车头或者飞达鲁金花之类的,因为是采集SERP,反采集这块要想办法绕过5.站内搜索和自然流量关键词去GA搞一下就行,批量导出不说了。很简单,不是用的GA可能会悲剧一些。

6.拼音输入法词库,推荐一个数据网站http://www.datatang.com/,可以看看,里面会有一些行业词库7.一些特殊的搜索引擎,淘宝,youku之类,他们也积攒了大量的数据信息四.分词/检索/排序/修正五.频道的运营,维护,拓展六.数据监控没有相关文章。