Skip to content

zoenbo/chinaseotools

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

81 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

优化不易,我用python

关键词挖掘 word.py

关键词挖掘是seoer一项非常重要的工作,挖掘关键词的好坏往往决定着获取流量的大小。

关键词的获取

预定义关键词

每个网站都有自己的定位,搞清楚这个很重要。用www.vrnew.com来举例,这是一个企业站,它的定位比较明确:产品展示,品牌宣传,咨询获取。 所以预定义几个词,这几个词越短越好:

品牌词:华锐视点<- 北京华锐视点数字科技有限公司       
地域词:北京                       
行业词:vr|ar|虚拟现实|增强现实                     
业务词:内容制作|技术研发|解决方案 

这些词的来源是通过:关于我们或者百科或者询问站长

关键词的获取途径

  1. 几家搜索引擎搜索结果相关搜索、SUG
  2. 几家大的社交、媒体(微博)的相关搜索
  3. 各搜索引擎的风云榜
  4. 竞价关键词获取工具(搜索引擎一般都提供)
  5. 百度司南工具
  6. Log日志关键词数据
  7. 站内搜索关键词数据
  8. 商务通、商桥等在线咨询工具内的关键词
  9. 竞争对手网站上的tag页
  10. 竞争对手(尤其是对seo很重视的)站点title
  11. 竞争对手竞价关键词
  12. 竞争对手页面keyword
  13. cnzz数据 基于预定词以及获取途径,可以获取大量的关键词

关键词的分类

  • 品牌词
  • 业务词|行业词
  • 衍生词

关键词的帅选 怎么帅选关键词? 怎么知道这些

  1. 我们先来给预设词打个分值:
ar	2
vr	5
虚拟现实	4
增强现实	1
华锐视点	5
制作	3
方案	3
技术	3
海淀	1
上地	1
北京	5
鞍山	2
深圳	4
教育	5
工业	5
家装	5

  1. 把它们放到一个个矩阵里(用表格表示把)
预设词/关系词 北京专业vr制作公司 北京AR房产公司 北京vr虚拟现实培训公司
ar 0 1 0
vr 1 0 1
虚拟现实 0 0 1
增强现实 0 0 0
制作 1 0 0
方案 0 0 0
技术 0 0 0
北京 1 0 1
公司 1 0 1

然后算这些词在长尾词或者文章标题的分值和,分值越高则相关度越高,设定一个及格线,就筛选出了相关度最高的一些词。


|-vr
|-vr->眼镜
|-vr->眼镜->原理
|-vr->眼镜->排行
|-vr->眼镜->是\什么
|-vr->眼镜->怎么\用/怎么\使用
|-vr->眼镜->多少\钱
|-vr->眼镜->哪个\牌子\好
|-vr->眼镜->看\片\什么\感觉
|-vr->眼镜->看\的\毛片\哪里有
|-vr->眼镜->几十元\的\有\效果\吗
|-vr->眼镜->能看\普通\岛国\片
|-vr->眼镜->怎么\链接\电脑
|-vr->眼镜->视频\资源\岛国

排名监控 monitor.py

搜索结果分析|竞争对手分析

分析搜索结果参数

> import monitor
> monitor.baidu_index("seo",0)
>  [{'data-click': None,
  'domain': 'baike.baidu.com/',
  'id': '1',
  'srcid': '91',
  'title': 'SEO_百度百科',
  'tpl': 'bk_polysemy'},.....]

关键词排名定位

监控优化关键词排名变化

>  import monitor
>  monitor.get_index_baidu("www.vrnew.com",*["华锐视点","vr","虚拟现实"])
> 
 [{'rank': ['1', '66', '93'], 'word': '华锐视点'},
 {'rank': ['86'], 'word': 'vr'},
 {'rank': ['48'], 'word': '虚拟现实'}]

page.py

一个链接:http://www.vrnew.com/index.php/News/newscontent/id/612

  1. 它的title
  2. 它的keywords
  3. 它的description
  4. 它的模拟抓取内容结果
  5. 它是否被baidu收录
  6. 它是否被so收录
  7. 它是否被sogou收录
  8. 它的内链有哪些 共多少条
  9. 它的外链有哪些 共多少条
  10. 它有哪些些词汇呢?举例:{url:"http://www.vrnew.com/index.php/News/newscontent/id/612 " ,wordlist=[("首页",433),("vr",23),("Vr公司",20),("华锐视点",10),("北京虚拟现实",10),("虚拟现实公司",10),("北京华锐视点_VR虚拟现实/AR增强现实内容制作公司",1)]}

site.py

在这个包里,想实现对服务器数据的抽取,以及网站相关信息的调查,还有一些数据的统计分析

目前有:

  1. whois信息的抽取
  2. domain->ip
  3. 服务器环境
  4. robots文件的抽取
  5. 站点内所有的连接
  6. baidu收录数统计 以及已经收录的连接
  7. so收录数据统计 以及已经收录的连接
  8. sogou收录数据统计 以及以及收录的连接

一些功能:    

  1. 生成网站地图
  2. 生成死链文档
  3. 友情链接检测
  4. 网站日志分析(限于iis日志,apache日志暂不能处理)

About

analyse the web site for seo

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%