首先我们来了解一下何为聚合页面:
简单来说,就是将网站现有的页面整合成一个新的页面。例如,你有两个页面,将这两个不同的页面合并,就形成了一个聚合页面。当然,前提是你的网站页面数量要足够多,否则很容易被判定为内容重复。假如你有10000篇文章页面,将它们组合成1000个不同的页面,那么你就有了1000个聚合页面。
最常见的聚合页面就是标签页面,如图所示:
它是一批聚合页面,每个页面下的文章都由不同栏目下的文章组成。
那么,我们为什么要做聚合页面呢?
原因如下:因为核心关键词的排名难度较大,通常放在网站权重较高的地方,比如网站首页、网站栏目页。而长尾词的排名相对核心词会简单很多。当我们拥有大量的长尾词并使其排名后,比如网站收录过W后,有10000个长尾文章页有排名,每个页面带来一个IP,就是10000个IP,这是核心关键词无法做到的。
出于这种原因,我们希望通过制作聚合页面这种权重比普通页面更高的页面来提升长尾关键词的排名。如果你的网站本身有大量的页面,将它们分类别组成大量的有层次的聚合页面,在不需要人为或采集新的页面前提下,通过本身已有的页面生成大量的聚合页面,这些页面的关键词和标题用来做长尾关键词,当这些长尾关键词有排名后,网站的流量将会有大幅提升。
以下是一个实例供大家参考:
这个页面就是一个典型的聚合页面:
点击“平板电视十大品牌”进入,我们可以看到它是由一些商品列表页组成的。
这些商品列表页是网站本身就存在的,也就是说通过网站本身的商品列表页生成了这个聚合页面。这个B2B网站有大量的商品列表页生成了大量聚合页面,通过这些聚合页面来做长尾关键词的排名,从而达到流量的增长。
如何利用聚合页和词库进行SEO流量优化
对于大中型网站的SEO工作来说,人工分类只能解决中短尾词的着陆页需求,可能做成分类列表,也可能做成专题页来抢占关键词排名。但还有大量的长尾搜索需求该如何覆盖呢?
常规做法是长尾词聚合页。
聚合页是什么?
举个例子,看下面的阿里巴巴产品聚合页:
通过关键词在站内搜索出一些结果,制作成SEO友好的静态化页面。
聚合页面之间需要做一些内链,并在网站高权重页面添加索引入口,以加快收录,从而获得大量长尾流量。这种做法对于B2B和分类信息网站来说都是常用手段。
搜索引擎也会时不时打击这种页面类型,但如果网站内容足够丰富,搜索相关性不是太离谱,内容足够支撑页面的话,这种优化方法必须要做。
词库搭建
因为聚合页是由大量长尾关键词自动生成,所以词库质量好坏,直接影响到搜索流量。
如何获得大量长尾词?
金花关键词工具
战神关键词工具
5118关键词拓展
5118付费会员可以下载某个域名下的全部百度PC关键词。
通过以上工具,可以获得大量长尾关键词,以便于后续的研究分析。
词库清洗
虽然可以通过第三方工具获得大量关键词,但你需要进行数据清洗,比如过滤一些违法词,或者对关键词进行文本分析替换或删除。
如果词量巨大,动辄百万,甚至千万的时候,常规的文本编辑器都很难处理了。(比如sublime,editplus等)
这时候需要用编程的手段来辅助处理,或者使用一些Linux下的强大文本处理指令,如Sed或Awk。这些工具Mac也是默认支持的。
比如我需要从300万词中提取纯关键词,就是不包含地区名(主要是城市名)、不包含“供应”、“价格”、“批发”等,最好是一个专有名词,不包含其他修饰词或组合。
比如“石家庄小松挖掘机价格”,处理后的“纯词”应为“小松挖掘机”。
这样方便以后自己拓展,比如为了抢产品的价格和报价,我们可以组合词“小松挖掘机价格”、“小松挖掘机报价”等长尾词,这样页面设计和SEO元素都会更加精准,页面质量也可以更高。
如果想做图片词聚合页面,使用“纯词”另外组合出“小松挖掘机图片”即可。
为了实现这样的效果,需要简单学习一些sed命令。
删除包含某个关键词的行
比如我要删除包含:“美女”关键词的行。
sed-i.bak'/美女/d' filename
这个命令就可以删除词库中包含“美女”这个关键词的行,直接更新当前文件,并且对原始文件做一个备份,扩展名为.bak。(filename.bak)
关键词替换
比如我要把所有关键词中包含的“出口”换成“进口”:
sed-i.bak's/出口/进口/g' filename
s字符代表替换,g代表全局替换,如果只替换第一个出现的“出口”,则可以去掉。
关键词删除
那删除呢?其实就是一种替换,那就是把符合的词,替换成空。
比如我要把所有关键词中开头包含的“供应”去掉:
sed-i.bak's/^供应//g' filename
s字符代表替换,“^供应”代表以“供应”开头的关键词(支持正则),g代表替换所有“供应”,如果只替换第一个出现的“供应”,则可以去掉。
如果我要把所有关键词中结尾包含的“厂”去掉:
sed-i.bak's/厂$//g' filename
“厂$”代表以“厂”结尾的关键词
根据关键词长度过滤词
删除小于等于三个字符的关键词
sed-i.bak-r'/^.{,3}$/d' filename
注意:这里不是按字节算的长度,比如即使UTF-8格式,也是每个汉字算1个,而不是算3。
请注意:此处并非按照字节计算长度,即便在UTF-8编码下,每个汉字也仅算作1个字符,而非3个。
剔除长度不少于十个字符的段落
sed -i.bak -r '/^.{10,}$/d' filename
当然,指定字符长度范围也是可行的。