百度搜索研发部:浅谈互联网页面价值

题记:这是一篇很有价值的文章,来自百度搜索研发部,里面透露着许多SEO技巧,原文已被删除。

搜索引擎每天处理着数以亿计的查询请求,每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候,通过查询返回的网页结果,这些需求被满足 了,我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言,页面的价值是指什么,我们为什么要研究页面价值,技术上怎样判 断页面的价值呢?本文将逐一回答这些问题。

一、什么页面价值

前面我们说了,某个页面满足了某一用户的特定需求,就体现了这个页面对用户的价值。那么对搜索引擎而言,价值体现在哪些方面呢?一个简单的推论,所有可能会对用户产生价值的页面都是对搜索引擎有价值的,将这些页面建入搜索引擎的索引中能够满足最终检索到它们用户的需求,我们称这种价值为检索价值。只要是能解决某个用户信息需求的,并且是可以通过某些正常检索需求到达的,那么就是有检索价值的。

小学生张三喜欢在qzone上写日记,写他前天吃了什么,今天玩了什么。这些内容,是有价值的。它们对张三的家长、同学、老师,以及其他小学生,和对小学生日记感兴趣的人来说,都是有价值的。对于这个信息体来说,“张三”这个名字是检索的“key”。

有一些信息单元,只有“浏览”价值,而没有到达该信息的检索途径,那么该资源可能是有价值的,但检索价值就很低。比如一张百度大厦附近的地图,从浏 览角度,是有价值的;但是如果没有任何周边文字说明(或者link的anchor text),只有一张光秃秃的地图,就没有检索价值。当然,如果图片的内容识别技术,有朝一日能自动识别出这个是“百度大厦附近地图”,或者能够自动分析 出地图内的各种大厦、街道、餐馆等的名称,那么这张图一样变得有检索价值了。所以一个页面是否有检索价值,应该取决于两点:

1)是否能解决某个特定的需求(价值)

2)是否可以通过某个常规的搜索方式获得该信息(检索)

那么,没有检索价值的页面,是否对搜索引擎就没有价值了呢?仔细想想,答案是否定的。索引只是搜索引擎的一个环节,对于其他环节而言,没有检索价值的页面有可能对我们更好的收录那些检索价值高的页面有帮助。比如对负责抓取互联网资源的spider而言,有一些页面,本身没有检索价值,但通过这些页面 的抓取和分析,能够更快的帮助我们掌握这一类页面没有检索价值这一重要信息,从而节省更多的流量进行更加有效的抓取。

考虑到这种价值可以算作一种“间接的”检索价值,最终还是立足于索引价值的,在本文中就不再展开论述,我们只关注“检索价值”这一根本问题。下文中提到的“页面价值”特指页面的“检索价值”。

二、为什么要研究页面价值

首先,互联网上的页面是无穷尽的,而搜索引擎的硬件资源是有限的,想用有限的资源去覆盖无穷尽的互联网,我们就需要对页面价值做出判断,不收录那些无检索价值的页面,少收录那些检索价值低的页面。这是页面价值在收录控制方面的应用。

第二,搜索引擎spider的抓取能力是有限的,出于访问友好性的考虑,对于一个网站或一个IP抓取速率需要有一个抓取速率的上限。在这一限制下, 抓取或页面更新就需要有一个先后顺序,而这一排序的主要参考依据就是页面价值,或者说对页面价值的预测(未抓取时)。这是页面价值在spider调度方面 的应用。

第三,对于某些页面,页面内容发生变化,导致它的检索价值从有到无,典型的就是变为“死链”,或者“被黑”。对于这些页面,好的搜索引擎会在第一时 间将其排除出索引,或在检索时对其进行屏蔽,以保证返回给用户的结果是更多检索价值高的“好页面”。对于另一些页面,它不仅具有很高的检索价值,而且有很 强的“时效性”,能够第一时间让用户检索到这些页面对搜索体验有很大的提升。对搜索引擎而言,越快的收录和索引页面意味着越多的额外资源开销,以多快的速 度收录和以多短的周期更新索引,需要通过页面价值的分析来指导。这两方面是页面价值在死链率和时效性两大搜索引擎指标提升上的应用。

最后,普遍意义上的页面价值高低对搜索引擎返回给用户的结果排序上也存在着指导意义。理想情况下搜索引擎的结果是按照与查询请求的相关性进行排序的,在相关性大体相当的情况下,用户更倾向与浏览普遍意义上页面价值高的网页。这是页面价值在ranking方面的应用。

可以说,页面检索价值的研究是搜索引擎中的一项较为基础的工作,对页面价值的认识和判断的准确程度直接影响着搜索引擎的覆盖率、死链率、时效性等几大主要指标。

三、如何判断页面价值

前文中提到过一个小学生张三qzone日记的例子。我们认为这个页面是有价值的,对张三的同学,朋友,家人都有价值。与此类似的,百度CEO李彦宏 在i贴吧上发表一条十几个字的i贴,也是有价值的,对李彦宏的上千万粉丝都有价值。虽然李彦宏的i贴长度可能远小于张三的日记,但就这两个页面的价值来 说,我们都会有一个共同的认识,即从普遍意义上讲,李彦宏的i贴价值远大于张三的日记。(当然,对于张三的妈妈来说很可能这个价值的关系是相反的)

再举个例子,搜索某个人的手机号码,搜索引擎返回了一个结果,是这个人在某个论坛上的一个回复。虽然这个手机号码关心的人不多,但因为资源是绝对稀缺的,对于关心这个手机号码的查询需求,这个页面是完全不可替代的,因此具有极高的价值。

另外,页面检索价值,还受到页面质量的影响。相似的页面,对于满足用户需求来说,往往会有很大差异,比如资源下载速度,页面的布局,广告的多寡。这类差异,姑且称之为页面质量。

最后,有些页面具有明显的公众话题性质,且这些资源往往在刚刚产生时有非常高的关注度,随着时间的推移热度显著下降,有着“新闻”的特征。典型的像各种“门”事件,地震、火灾等大型的自然灾害。我们认为这类资源具有“时效性”特征。

所以,一个页面的检索价值,大致受以下四个要素的影响:

1、感兴趣的受众群大小

2、该页面的稀缺程度(可替代性)

3、该页面的质量高低

4、该页面的时效性特征强弱

这四种要素,简称受众,稀缺,质量和时效性。

1. 受众

受众群体的大小,即代表了用户检索需求的大小。评价受众的大小主要依据信息发布源的受众和信息内容本身受众两大方面。具体因素包括且不限于:

网站忠实用户群大小

一般来说,拥有自己忠实用户群的知名网站,他们的成功,在于他们的内容和服务,比别人更能吸引和满足用户。从这个角度来说,我们可以推论,拥有更多 忠实用户群的网站上的内容,会比忠实用户群较少的网站上的内容,有更多的既有和潜在受众群。这样的话,忠实用户群大小,就可以变成对站点内资源检索价值的 一种衡量指标。忠实用户群的好处在于,它是变动的。如果一个网站变差了,那么用户就会用脚投票。超链有过期问题,作弊问题,而虚假用户群作弊很难。一般所 谓的网站知名度,会和忠实用户群数量密切相关。

资源分布规律

我们再考虑一个网站内部的资源分布所体现的受众群大小问题。比如新浪新闻首页的那些推介内容。新浪编辑为什么要推这些内容?因为他们认为这些是用户 最感兴趣的。那么从索引价值角度而言,相当于有一个庞大的编辑团队,已经对这些内容打上了“符合大众口味”的标签。搜索引擎只需要乐享其成就行了。这样的 话,资源相对于某些结构性关键页面(首页、频道页等)的链接深度,也可以成为衡量一个资源受众群大小的指标了。

访问热门度

我们再从访问热门度角度来考虑受众群大小问题。这个是最直接的,当然,它需要第三方的工具来获取关键数据。通过这个途径,获取的不应仅仅是需要入库的页面,还有用户访问一个网站的访问模式。

超链

超链某种程度上也是受众群大小的反映。某个资源的质量越高,接触的受众群越大,那么获得正常链接的数量往往也越大。

内容特征

A:我写博客:“传言郭德纲要上春晚了。”

B:我写博客:“我今天吃早饭了。”

同样的来源,前者的受众必然高于后者。即:当在发布源相同的情况下,具有公众属性的内容分值会更高。

2. 稀缺

稀缺主要是描述页面在互联网中的独特性。说到稀缺往往会想到重复,稀缺是否等同于无重复,我们应该怎样解读这一概念呢?可以看一个例子:

某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件+新浪”来检索此新闻。这可以被称之为站点增益。另一方面,它在转载过程中可能会改变页面的标题,而且依托其受众,在转载页面上,还有可能出现更多的有价值评论和回复等,还有可能存在指向其它相关事件的新闻链接。这些可以被称之为内容增益。因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。

同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名/稳定性/速度的增益。更有甚者,转载之后在页面上加入大量广告妨碍阅读,或者只转载了内容中不完整的一部分,这样的转载,或者说采集,就是纯重复的,与采集源相比,就是没有检索价值的了。

综上所述,对于主体内容重复的页面,我们应该评价其是否存在站点增益和内容增益,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。

3. 质量

页面的质量是它对需求的满足程度的一种体现。判断页面质量的高低,应该是从最基础的需求依次递进的。

首先,不能是死链、网站要有一定的稳定性、访问速度要令人满意。

其次,主体内容是否完整、版式和字体是否易读、各类广告会不会太多。

最后,信息是否丰富、延伸出的次级需求是否满足。

典型的低质量页面存在以下一些特征:

1、主需求无效/未满足(过期分类广告/软件下载页面,下载链接无效等)

2、死链

3、虚假信息/诈骗等

4、点不稳定

5、影响主需求的权限问题(下载/浏览需要注册会员/积分等)

6、信息不完整(转载不全等)

7、浏览体验差(广告/字体/页面布局等)

典型的高质量页面存在以下一些特征:

1、访问速度快(页面加载快/资源下载速度快)

2、页面整洁干净,主体内容在显著位置。

3、页面信息完整。

4、页面元素丰富(文字、图片、评论、相关推荐等)

4. 时效性

“时效性”是页面价值的一个属性,它一般体现在两个方面:一是页面所描述的事物本身有着较强的公众话题性,容易被传播。这其实是受众的一个体现。二 是页面所描述的事物仅在第一时间有较高热度,随着时间推移热度显著下降。这是一种“新闻”性。对于具有上述两种属性的页面,如果搜索引擎spider发现 页面的时间正处于该事物的“爆发期”或“爆发期”之前,我们认为该页面具有时效性。

需要说明的是,搜索引擎的广义“时效性”是指对所有有价值新资源的及时收录提供检索,而所有的有价值新资源中,有一大部分其收录速度的提升对用户的 搜索体验改善意义是不大的,比如介绍如何瘦身的知识性文章,张三的日记。页面价值中的“时效性”指得是一种突发时效性,也就是所有有价值页面中最需要及时 收录的那些。对页面时效性的判断是为了指导我们将搜索引擎有限的资源投入到最关键的地方,产生最好的性价比。

判断页面的时效性价值,主要通过下面一些途径:

页面本身受众是否有短时间的突增,比如超链爆发。贾君鹏的帖子就是一个典型的例子。

描述相同事物的互联网页面是否有段时间的突增。贾君鹏事件短时间内爆发出大量相关讨论、报道,和这一事件相关的所有内容都具有了时效性属性。

根据一个集合内的页面是否具有上述两种特征,推测该集合的时效性价值。比如魔兽世界吧经常爆出一些热门帖子,公众话题,我们推测出自魔兽世界吧的帖子其时效性“潜在价值”比较高。

四、页面价值的研究重点

前文已经介绍了页面价值的含义,研究的意义与价值判断的方法。最后我们再看一下,从技术角度上,这一方向的研究中的重点方向。对页面价值的研究工作主要致力于三方面:

1、对页面价值体系的认识。我们目前对页面价值的认识是来源于前文所述的四个维度,这个认识是否全面,对于不断变化的互联网环境与用户需求,这些维度应该如何扩展与变化才能更好的服务于整体的搜索体验提升,是一个很重要问题。

2、对于反映页面价值的页面特征提取。巧妇难为无米之炊,挖掘更多的页面特征,更准确合理的特征提取是页面价值判定准确率提升的基础。

3、对各种页面特征的组合策略(机器学习)。针对不用的应用方向,需要利用相应的特征通过合理且高效的策略拟合出页面价值的最终评价结果。

前端优化:BigRender

前言

有对象才叫跨年,没对象叫熬夜。所以,在这没对象的元旦假期的夜里捣弄了一下前端优化的东西。如果你听说过FaceBook,太好了,你肯定是个网 络潮人;如果你还听说过FaceBook的bigpipe,那么你多数和我一样是单身IT狗。很好,那么今天我就说说bigrender吧,你没看错,我 也没写错,我想讲的就是bigrender,前面讲的都是废话。

介绍

bigrender是前端优化的技术,从字面上都可以很清楚的理解这一技术特点。big(大)& render(渲染),如果翻译不对,请骂度娘。bigrender顾名思义是对大页面渲染的优化。bigrender的原理是通过某种方式,将首屏不需 要的html代码先存放起来。渲染好首屏后,再将存储好的html代码逐步渲染出来。

效果

先看看效果,下面的截图是美团的页面的截图,通过截图可以看出,上面红色框内的就是首屏的内容,这部分是被渲染好的,下面蓝色框内的只是输出了个占位框,内容时空白的,内容都被保存在一个隐藏的textarea框内(见图1)。

使用bigrender的好处显而易见,减少DOM节点,加快首屏的渲染,提高用户体验,进一步思考,如果你的页面不单止大,还有很多图片资源,还可以延迟首屏外的图片加载,提速是杠杠滴。

bigrender-美团

图1

实现

这个元旦,通过改造个人博客实现bigrender。如图2,每个红色框都是一个article标签,把article内的html都保存在 article里面隐藏的textarea,article设了一个最小高度(article渲染后会移除最小高度),目的是把整个页面撑开,给屏幕添加 滚动条事件,当每个article出现可视范围的时候就渲染textarea里面的html。

<textarea class=“br-rendered” style=“display:none”></textarea>
<article class=“br-warp” style=“min-height: 300px;”></article>

bigrender-效果

图2

bigrender-效果

图3 效果

JS代码

(function($){
$.fn.bigrender = function(opts){

var winHeight = document.documentElement.clientHeight;
var sum = 0;
var count = 0;
var flash = new Array();

// ‘class’ 是textarea父节点的类;’textarea’ 是textarea标签的类;’threshold’是距离进入屏幕还有150像素就开始渲染;’remove’是否删除textarea标签? ? ? ?
options = $.extend({
‘class’ : ‘.br-warp’,
‘textarea’ : ‘.br-rendered’,
‘threshold’ : 150,
‘remove’ : true,
},opts);

$brenders = $(options.class);
// 渲染首屏的内容
initBigrender();
// 绑定滚动条事件
scrollDisplay();

// 函数定义
function initBigrender(){
$brenders.each(function(n,object){
sum++;
if(isRender($(this))){
display($(this));
count++;
flash[n] = true;
}else{
flash[n] = false;
}
});
}

// 判断时候需要渲染
function isRender(object){
offsetTop = object.offset().top;
ojh = object.outerHeight(true);
st = Math.max(document.body.scrollTop || document.documentElement.scrollTop);

if(offsetTop+ojh+options.threshold >= st && offsetTopoptions.threshold < (st+winHeight)){
return true;
}else return false;

}

// 渲染textarea内的html代码
function display(object){
$display = object.find(options.textarea).eq(0);
if(options.remove){
object.append($display.val());
$display.remove();
}else{
object.append($display.val());
}
}

// 屏幕绑定滚动条事件,当待渲染的内容进入可视屏幕就触发isRender函数
function scrollDisplay(){
$(window).scroll(function() {
if(count < sum){
$brenders.each(function(n,object){
if(flash[n] == false){
if(isRender($(this))){
display($(this));
count++;
flash[n] = true;
}
}
});
}
});
}
};
})(jQuery);

调用方式

$.fn.bigrender({‘threshold’ : 100}); ?// 提前100像素开始渲染

渲染前html

<article class=“br-warp” style=“min-height: 300px;”>
<textarea class=“br-rendered” style=“display:none”> ? ? &lt;div class=“title”&gt;&lt;a href=“http://www.hcoding.com/?p=27” rel=“bookmark”&gt;Symfony2目录结构说明&lt;/a&gt;&lt;/div&gt;
&lt;div class=“entry-meta”&gt;&lt;a href=“http://www.hcoding.com/?p=27” title=“下午4:12” rel=“bookmark”&gt;&lt;time class=“entry-date” datetime=“2014-11-14T16:12:48+00:00”&gt;20141114&lt;/time&gt;&lt;/a&gt; 分类:&lt;a href=“http://www.hcoding.com/?cat=5” rel=“category”&gt;PHP&lt;/a&gt;&lt;/div&gt;
&lt;div class=“cover”&gt;&lt;/div&gt;
&lt;div class=“summary”&gt;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;了 解框架的目录结构是框架快速入门的一个途径,一个成熟的框架,每个功能模块都被划分存放在不同的目录。在网上找了很多关于Symfony2目录结构,但都 是不是很明了,所以,今天在自己看了几个月的Symfony2框架后写下这篇拙文,简明地分析Symfony2框架的目录结构。本文会说明哪些是框架核心 包、哪些是第三方插件包、哪些是应用程序包、配置文件存放在哪里等。 ? ? ? ? &lt;a href=“http://www.hcoding.com/?p=27” style=“font-size:12px;color:#19b4ed”&gt;阅读全文&lt;/a&gt;
&lt;/div&gt;
&lt;div class=“tags”&gt;标签:&lt;a href=“http://www.hcoding.com/?tag=php” rel=“tag”&gt;PHP&lt;/a&gt;&lt;a href=“http://www.hcoding.com/?tag=symfony2” rel=“tag”&gt;Symfony2&lt;/a&gt;&lt;/div&gt;
</textarea>
</article>

渲染后html

<article class=“br-warp” style=“min-height: 0px;”>

<div class=“title”><a href=“http://www.hcoding.com/?p=27” rel=“bookmark”>Symfony2目录结构说明</a></div>
<div class=“entry-meta”><a href=“http://www.hcoding.com/?p=27” title=“下午4:12” rel=“bookmark”><time class=“entry-date” datetime=“2014-11-14T16:12:48+00:00”>2014年11月14日</time></a> 分类:<a href=“http://www.hcoding.com/?cat=5” rel=“category”>PHP</a></div>
<div class=“cover”></div>
<div class=“summary”>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;了 解框架的目录结构是框架快速入门的一个途径,一个成熟的框架,每个功能模块都被划分存放在不同的目录。在网上找了很多关于Symfony2目录结构,但都 是不是很明了,所以,今天在自己看了几个月的Symfony2框架后写下这篇拙文,简明地分析Symfony2框架的目录结构。本文会说明哪些是框架核心 包、哪些是第三方插件包、哪些是应用程序包、配置文件存放在哪里等。 ? ? ? ? <a href=“http://www.hcoding.com/?p=27” style=“font-size:12px;color:#19b4ed”>阅读全文</a>
</div>
<div class=“tags”>标签:<a href=“http://www.hcoding.com/?tag=php” rel=“tag”>PHP</a><a href=“http://www.hcoding.com/?tag=symfony2” rel=“tag”>Symfony2</a></div>
</article>

结语

bigrender通过减少DOM节点,加快首屏的渲染,但是,它也是有额外的性能损耗的,可以看到上面渲染前textarea里面的html代 码,在服务端把html代码保存在隐藏的textarea里面,所以在服务端会把html代码转义:尖括号等都被转义了,这个会增加服务器的压力;而且, 这个的改造只是前端的渲染,服务器依旧是一次过计算所有的数据,输出所有的数据,这一点没有得到提高。

本文链接:http://www.hcoding.com/?p=194

原创文章,转载请注明:JC&hcoding.com

如何通过日志分析进行最给力的优化应对?

从事SEO、竞价的时间说长也不长,说短也不短,其实真正的高手是从实战中锻炼出来的,实战是从强有力的数据分析中提炼出来的,那么如何通过日志分析来进行针对性解答呢?
问题1:有没有更全面更系统的一款免费的日志分析工具?
问题2:通过日志分析,具体要查看哪些数据?蜘蛛爬行次数最多的页面?蜘蛛爬行的时间段?蜘蛛爬行的目录?还有其他什么数据要归纳吗?这些蜘蛛日志数据又说明了网站的一些什么问题呢?
问题3:如何通过日志来进行针对性的优化改进?比如说通过蜘蛛爬行的时间段我们具体改进的是在蜘蛛爬得比较勤的时间段更新文章比较好一点,那么其他一些分析的数据又如何进行针对性改进呢?

我来回答吧
问题1:有没有更全面更系统的一款免费的日志分析工具?
这个我们放到最后去说,因为我们要先了解我们需要什么资料,然后在去选择工具,甚至开发自动化工具
问题2:通过日志分析,具体要查看哪些数据?蜘蛛爬行次数最多的页面?蜘蛛爬行的时间段?蜘蛛爬行的目录?还有其他什么数据要归纳吗?这些蜘蛛日志数据又说明了网站的一些什么问题呢?
我们分析日志的目的是什么?
日志可以看到所有你想看到的内容。但是我们这里说的日志分析,基本上是指搜索引擎蜘蛛的日志分析。
那么
第一:我们就要把想要分析的蜘蛛数据提取出来,例如百度:Baiduspider/2.0 Google的 Googlebot
第二:我们要确定要分析的维度,例如:蜘蛛到访次数,抓取量,停留时间,返回码分类(特别是200.404),唯一抓取量,每个目录的抓取量。
第三:有了这些维度以后,我们怎么去判断他是否“合格”呢,这里我们就要知道,我们网页有多少页面量,例如:我有100w个页面,但是他只爬行了1w个页面。那就有问题了,问题在哪里?出了问题怎么解决?
第四:我们分析这些日志不是为了分析而分析,要记录这些数据,然后和流量,收录量做对比,记录
问题3:如何通过日志来进行针对性的优化改进?比如说通过蜘蛛爬行的时间段我们具体改进的是在蜘蛛爬得比较勤的时间段更新文章比较好一点,那么其他一些分析的数据又如何进行针对性改进呢?
第一个小问题比较简单,你分析出啥问题,就去解决。
第二个小问题去研究这个没有啥意义。

 

外链的表现形式有哪几种?哪种外链形式效果最好

外链的表现形式有哪几种?

1、锚文本外链

这是权重最高的外链,如果发外链,最好发这样的外链。锚文本是把一个关键词,做一个连接,指向一个页面。

2、网址超链接

超链接的意义跟锚文本一样,可以由一个页面直接指向另一个页面,只是他的表现形式不是关键词,而是文本式的链接。

3、纯文本链接
纯文本是纯文字的,即纯字母的一个链接表现,是不能直接点进入另一个页面的链接。
但不是说纯文本就没有用了,一个纯文本链接,可以引蜘蛛,这个大家都知道。

外链的形式目前来说是分为以上几种,各位seoer根据自己的实际情况选择相应的外链形式吧。

哪种外链形式效果最好?

1.点击流量

2.单向链接

3.用户自发及编辑推荐

4.内容相关性

5.锚文字(最好的外部链接)

6.链接位置

7.页面权重及拍名

 

 

 

Web Log Explorer网站日志分析工具使用(常见问题汇总)

原创小人物。抱歉,喜欢说谢特,法克的人对英文也是半桶水,外加不是专业的WA人员,所以这些属性的翻译有点蛋疼了~
半汉化,是因为我脱不了壳,核心代码翻译不了,但是他们有语言包,可以在语言包里汉化,之后的结果是太监式的中英混世魔软
So,请大伙将就下~~以我英语三级没到,喜欢看美剧的人做的翻译,我相信您看看不会痛苦到菊疼的地步的

本帖卖弄风骚,欢迎拍砖~~最近菊疼,前前后后托了3个多星期,今天完工,喜欢折腾就用呗,用爽就分享呗~
至少我是怀着让大伙看着菊疼,翻译寻乐子的,中秋不管这贴有没有火了,都欢乐欢乐~~哈哈
中文语言包,放到软件文件里,然后运行软件 点View -Optoins – Language For 右边的… 之后选择中文语言包


特征使用
1, 日志获取,本地,FTP

可以选择本地导入,也可以选择服务器上批量拉稀式的下载~~~~~
2,? ?? ???文件类型组别的统计及分类

这个牛逼的,可以自定义很多文件类型的统计,在软件的右边,从中间开始扩散去看,自己定义文件类型去!~很全面滴~~

———————————————————————————————————————————————————-
五大常规日志属性-大杀器
1,数据属性
特别说明的是,访问路径,所有目录,所有文件类型,所有错误响应码。
访问路径

这个数据导出后,还可以做转换路径统计哦,这个得看自己喜好了~这个路径功能不错
所有目录

目录,很清晰,很爽的说。~~按自己目的挑目录做nofollow蜘蛛的引导~~~~
所有文件类型

所有错误响应码

嘿嘿这个不错吧~~
———————————————————————————————————————————————————–
2,访客属性

基本上没什么好说的,国家数据比较全。
———————————————————————————
3,? ?? ???来源属性
可能软件问题,或者编码问题,数据拿不出来~很奇怪,这个来源属性
数据为空,我不截图了~~(谢特,他们都下班了!~咱继续折腾~~~)
(光年的统计会有百度上次关键词抓取记录,BS=keyowrds的抓取,尼玛这个记录真的很棒棒的。
对那些做数据精准定向的数据人员来说,应该多了一层用户搜索行为分析,数据样本大,渣渣,设个用户讨论组讨论下,归类下,很欢乐啊~~~用户那傻渣渣的喜好都可以比较好的捕捉。)

好吧,我承认,我现在开始意淫的欢乐了~~


————————————————————————
这个比较不错,能统计所有类型,但是无法自定义蜘蛛类型。

蜘蛛树这个东西比较好玩,能按日期查看,可以查看的方式很多,组合使用!~
没有分辨率属性统计,伤不起!~~无法自定义伤不起~

5,? ?? ???日期属性
—————————————-

如果要看特定日期的访问内容,用这个比较不错

其他,好玩点~
无论哪个栏目,右击鼠标你可以看一个所有参数,这个牛逼啊,可以查看所有动态页面访问情况

——————————————————————————————-
扩展说明,EXCEL 自制图表等图表生成与导出。

这个图标很鸡肋~~~点击 View- 然后选择有chart的选项,都能产生太监式的图标。~


不过导出XSL应该不错的有数据栏里右击选择导出CSV格式
亲们~我想说的是,这个才是我们最想要的,数据样本表格化,就可以自定N种数据类型,什么曲线图,饼图,N复杂的数据模型建立,牛逼的函数公式,扯远了,不过玩数据,数据样本是最重要的~

SEO排名与SEO真相有多远

就在不久前几天,其实我那个烂博客wocaoseo的seo竟然跑到首页一段很短时间,由于那个博客权重前一段继承了wocaoseo论坛的权重,再加上 我现在给与他标题进行了修改,进行了集中式的标题(其实还根本不够),所以导致网站的需求开始倾斜,所以百度给与了较高的权重,而且就在27号,百度站长 社区还给我发了私信,告诉我那个博客已经被判断为优质内容,让我提交sitemap,如下图:

 

sitemap开通通知

 

但是,说实话,我那个博客内容极少,到了现在文章也不足100篇,蜘蛛抓取根本不是问题,所以我觉得也是很没有必要开通,但是为了以后计划还是打算投入度 娘的怀抱。而且今天上午,那个博客再次发威,被百度把seo这个词调到了首页,很多人给我说这件事,我都淡淡地说,其实我已经打算关闭那个博客了,现在只 是为了做一些测试,才没有关闭而已。

 

我这么说,可能很多人不太理解,很多人认为这个博客不错了,如果好好运营的话,seo稳定到首页指日可待,甚至可以说我那个烂博客就做“seo”到首页可 谓是势在必行,志在必得。但是我却感到很悲哀,因为只有我知道,因为那个博客seo优化做得很烂,我不想上去了误导了一些人,特别是这些做seo的,都真 的太爱跟风了,谁的网站排名好就认为这个网站的seo做得好,比如seovip和爱站,我曾经在知乎上看到一个提问关于爱站为何seo排名首页的问题,一 大堆的人都在说神马用户体验好,什么这个站的seo做得好的话,真无语。

 

不知道seo的总是太爱跟风,而懂seo的一些人,做的seo总也是差强人意。说句得罪同行的话,我观察了“seo”前几十名的网站,怎么认为没有一个站 的seo做得好的呢?别说那些”seo“排在首页的网站,其实从seo的角度来看,做得都是很差的。可是人们貌似都看不到真相了,无知者对seo首页的顶 礼膜拜了,做seo到首页的人洋洋自得吧,却从来没有思考过你的网站seo做得好吗?对,就是我说的,我看了前50名的seo网站,觉得没有一个站的 seo做得合格的,虽然也有我的站。

 

所以我有时候很后悔,一直后悔做seo类网站,虽然我做的时候一般都是测试性质的,甚至更多的时候只是玩玩而已,但是还是有时候免不了误导一些人的。比如 不久前我看到几个人拿我博客模板去做了seo网站,而且连一些我的品牌词都没有去掉,我只能说很抱歉了,这个网站的seo做得并不好。

 

我原本已经不想做seo类网站了,比如我那个博客,你可以去看好了,基本上停止了更新新东西了。而在此时,我却不得已另做了一个新的seo网站,而且我故 意在首页去掉了很多核心词,而只做品牌词,到最后甚至只在标题上写着”焦大SEO“,其他的全部都不要了,主要一个想法就是为了证明,其实seo真的不等 于seo排名,你seo排名做得再好,你能获得多少的seo流量,我即使不做seo这个词的排名,我相信我的新网站照样可以获得比你大得多的seo流量, 这就是建立新网站的目的,也借此希望人们不要停留在浮躁和自傲中,去真心做一个好的seo网站出来,而不是只是一个做seo首页排名的网站而已。

 

做seo做了几年之后,我愈发觉得很遗憾的是,目前的seo网站基本都是给其他seo新手一种借鉴和模仿对象的,但是目前没有一个网站的seo做得好的, 岂不是很奇怪吗,岂不是很不正常吗?seo行业排名好的网站尚且没有融入任何的seo技术含量,试问其他行业的网站又何来seo技术含量?

 

seo是一种指导性行业,seo网站自身除了拼排名外,我觉得最主要的也应该关注自身的seo问题,而不是只是一个摆设……

(声明:”SEO排名与SEO真相有多远”为本站编辑原创,如果发现侵权请联系站长。)

原文链接:http://www.jiaodaseo.com/topic/zixun136.html

逛网与美丽说seo案例分析

逛,发现喜欢。这或许是很多人上网的喜欢方式,我隐约记得白鸦在一次采访上说到现在人的购物方式,在淘宝上人们决定买一件物什之前是经过非常多的挑拣的, 所以他非常看好类似美丽说的模式,后来突遇车灾,后来决定创立了逛网。大约在2011年时候,我了解到白鸦在UEO界类似于SEO界的ZAC,于是努力地 看他的博客和他的视频,看逛网的发展历程,但是很遗憾的是,逛网的发展并没有我们想想的那么好,今天躺在床上无事,便敲写一些文字分析下这个“美丽说”的 seo分析,浅薄之见,希望对看到这篇文章的人有所帮助。

 

首先,逛网的用户体验很符合“设计理念”,如果了解基础的用户体验设计,逛网无论在head区或帮助条做得都很好,在很多细节从用户体验上都比美丽说人性 化好很多;但是可惜的是在国平所说的敦煌失误上,逛网也延续了,URL设计上也设计了很多文字URL,在服务器段的优化细节上差距美丽说就更远了,所以可 以对比看得出来,逛网在看得到的地方做得很好,可惜在不是用户看到的地方做得并不尽人意了。

 

然后,再回到设计上,我们知道一点大站的seo在于结构,其实也就是信息架构。说起信息架构,我觉得整个信息页面在架构上最主要的是有2块的,一个是以什 么样的信息属性安排信息,另一个是信息的相关性的布局,这牵涉到主题相关性的判断,我觉得这两点是信息页面架构的核心,从关键词角度来说,我们布局关键词 的核心思想就是“覆盖”“精准”。而“覆盖”对应于信息的对外属性,“精准”对应于信息的对内属性。如何把握这两个度是seo的最核心的,而做seo的更 多却是漠视……

 

扩展一点,很多人觉得seo没有什么好做的,觉得做关键词分析不知道从何做起,也不知道为何要做关键词分析。在这里,我细说一点,比 如你有ABCDEF一共6个单词,如果需要你布局到一个页面上,比如说是首页上,你该怎么布局呢,需要考虑那些细节?我看到很多人都在说首页只要布局3个 就可以了,这样他们采用的是放弃策略,要知道首页就一个,3个词和6个词的组合相差多少倍,排列组合下你就知道你浪费了流量。好吧,你想真 的“覆盖”,那么有多少需要的细节呢?其实只有一个,就是ABCDEF你哪个放在哪里。但是想摆好顺序绝不是简单的事情。比如要考虑那个词是核心主题词, 那些词组合需求是最大价值的组合,而一旦结合结合页面,又要思考到更多的文件结构和语义构成(信息构成),这些细节元素构成了一个页面主题元素,在这方 面,有兴趣的可以百度下 北京韩国 ,统计看看排名顺序的差别。

 

我在上面之所以说了信息架构和细节,是因为大网站的seo在于细节和结构、数据和用户,当然这是我个人的理解。

 

数据从哪里来呢?类似于美丽说这样的网站,数据挖掘还是相对容易的,因为他背对淘宝,而淘宝的数据是相比于其他的行业是多了一条来源渠道的。我之所以这么 说,是因为我以前认为白鸦他们都是阿里的内部的人,对于很多真实的数据还应该有的,这也应该在网站运营的初期或在网站架构上体现出来,甚至可以让逛网在一 段的积累之后快速爆发起来,但是结局却很悲剧,目前这些美好的愿景没有实现,而搜索聚合却被一些人所利用,逛网成为了很多XX信息的源,杯具。

 

说了这么多杂乱的话,我最主要想说的是,运营一个网站是不容易的,即使某个方面是很强的也应该关注seo,如果逛网在开始就有一个靠谱的seoer在指导 运营,加上白鸦大哥的执着用心和强大的用户体验感触,我相信逛网是可以和美丽说比肩齐眉的,但是在seo关注不够(比如早期曾经增加了大量的垃圾链接) 导致了逛网很难火了。

 

PS:现在看到很多人说seo的效果不好了,什么社会化的流量占比多少,我想给大家说个真实的情况是,一个站如果没有seo在背后支撑,再牛也会逐渐走下 坡路,除非你是淘宝,看一个网站流量不要看占比多少来说明某个因素的大小,比如一个知名的汽车公司在facebook做广告,分析数据后发现后 facebook不值得做,于是停掉了,结果整个公司的业务忽然下滑10%以上……。(在此举例是想说明的是,比如你seo流量来源占比可能只有20%, 但是没有了seo你可能损失50%的流量,为何,因为很多用户是经常性的能搜索到你才用你的站,才给你较高的关注度,所以SEO流量任何时候还是不能忽视 的一部分。)

 

各种因素是相互影响的,seo所起到的作用还是非常大的,比如做医疗,现在竞价几乎把所有的流量抢走了,而推广几乎带不来多少患者,是不是可以不做推广把所有的钱都做竞价呢,这个只怕木有一个公司敢这么做,这就是因素的影响。

(声明:”逛网与美丽说seo案例分析”为本站编辑原创,如果发现侵权请联系站长。)

原文链接:http://www.jiaodaseo.com/topic/wen139.html