关键词挖掘是seoer一项非常重要的工作,挖掘关键词的好坏往往决定着获取流量的大小。
关键词的获取
每个网站都有自己的定位,搞清楚这个很重要。用www.vrnew.com来举例,这是一个企业站,它的定位比较明确:产品展示,品牌宣传,咨询获取。 所以预定义几个词,这几个词越短越好:
品牌词:华锐视点<- 北京华锐视点数字科技有限公司
地域词:北京
行业词:vr|ar|虚拟现实|增强现实
业务词:内容制作|技术研发|解决方案
这些词的来源是通过:关于我们或者百科或者询问站长
- 几家搜索引擎搜索结果相关搜索、SUG
- 几家大的社交、媒体(微博)的相关搜索
- 各搜索引擎的风云榜
- 竞价关键词获取工具(搜索引擎一般都提供)
- 百度司南工具
- Log日志关键词数据
- 站内搜索关键词数据
- 商务通、商桥等在线咨询工具内的关键词
- 竞争对手网站上的tag页
- 竞争对手(尤其是对seo很重视的)站点title
- 竞争对手竞价关键词
- 竞争对手页面keyword
- cnzz数据 基于预定词以及获取途径,可以获取大量的关键词
关键词的分类
- 品牌词
- 业务词|行业词
- 衍生词
关键词的帅选 怎么帅选关键词? 怎么知道这些
- 我们先来给预设词打个分值:
ar 2
vr 5
虚拟现实 4
增强现实 1
华锐视点 5
制作 3
方案 3
技术 3
海淀 1
上地 1
北京 5
鞍山 2
深圳 4
教育 5
工业 5
家装 5
- 把它们放到一个个矩阵里(用表格表示把)
预设词/关系词 | 北京专业vr制作公司 | 北京AR房产公司 | 北京vr虚拟现实培训公司 |
---|---|---|---|
ar | 0 | 1 | 0 |
vr | 1 | 0 | 1 |
虚拟现实 | 0 | 0 | 1 |
增强现实 | 0 | 0 | 0 |
制作 | 1 | 0 | 0 |
方案 | 0 | 0 | 0 |
技术 | 0 | 0 | 0 |
北京 | 1 | 0 | 1 |
公司 | 1 | 0 | 1 |
然后算这些词在长尾词或者文章标题的分值和,分值越高则相关度越高,设定一个及格线,就筛选出了相关度最高的一些词。
|-vr
|-vr->眼镜
|-vr->眼镜->原理
|-vr->眼镜->排行
|-vr->眼镜->是\什么
|-vr->眼镜->怎么\用/怎么\使用
|-vr->眼镜->多少\钱
|-vr->眼镜->哪个\牌子\好
|-vr->眼镜->看\片\什么\感觉
|-vr->眼镜->看\的\毛片\哪里有
|-vr->眼镜->几十元\的\有\效果\吗
|-vr->眼镜->能看\普通\岛国\片
|-vr->眼镜->怎么\链接\电脑
|-vr->眼镜->视频\资源\岛国
分析搜索结果参数
> import monitor
> monitor.baidu_index("seo",0)
> [{'data-click': None,
'domain': 'baike.baidu.com/',
'id': '1',
'srcid': '91',
'title': 'SEO_百度百科',
'tpl': 'bk_polysemy'},.....]
监控优化关键词排名变化
> import monitor
> monitor.get_index_baidu("www.vrnew.com",*["华锐视点","vr","虚拟现实"])
>
[{'rank': ['1', '66', '93'], 'word': '华锐视点'},
{'rank': ['86'], 'word': 'vr'},
{'rank': ['48'], 'word': '虚拟现实'}]
- 它的title
- 它的keywords
- 它的description
- 它的模拟抓取内容结果
- 它是否被baidu收录
- 它是否被so收录
- 它是否被sogou收录
- 它的内链有哪些 共多少条
- 它的外链有哪些 共多少条
- 它有哪些些词汇呢?举例:{url:"http://www.vrnew.com/index.php/News/newscontent/id/612 " ,wordlist=[("首页",433),("vr",23),("Vr公司",20),("华锐视点",10),("北京虚拟现实",10),("虚拟现实公司",10),("北京华锐视点_VR虚拟现实/AR增强现实内容制作公司",1)]}
在这个包里,想实现对服务器数据的抽取,以及网站相关信息的调查,还有一些数据的统计分析
- whois信息的抽取
- domain->ip
- 服务器环境
- robots文件的抽取
- 站点内所有的连接
- baidu收录数统计 以及已经收录的连接
- so收录数据统计 以及已经收录的连接
- sogou收录数据统计 以及以及收录的连接
- 生成网站地图
- 生成死链文档
- 友情链接检测
- 网站日志分析(限于iis日志,apache日志暂不能处理)