找回密码
 注册账号

QQ登录

只需一步,快速开始

关键词网址采集器 v2.5.1.0 - 按关键词采集搜索引擎收录网址

水淼·关键词网址采集器

水淼·关键词网址采集器

软件大小: 2.3 M 软件语言: 简体中文 
软件版本: v2.5.1.0 授权方式: 注册机
操作系统:Win10 Win8 Win7 WinXp 
下载
  • 软件介绍
入关键字采集各搜索引擎的网址、域名、标题、描述等信息
入关键字采集各搜索引擎的网址、域名、标题、描述等信息

支持百度、搜狗、谷歌、必应、雅虎、360等。每个关键词600到800条,采集例子

关键词可以附带搜索引擎参数,就跟网页里输入关键词搜索一样,
如百度里搜索结果网址中必须包含bbs的关键词,则输入“关键词 inurl:bbs.”

保存模板可引用的数据:#网址#
采集的原始网址
#标题#
网址对应的网页标题
#域名#
原始网址的域名部分,如“http://www.6666a.cn/123.htm”中的“test.6666a.cn”
#顶级域名#
取原始网址的顶级域名部分,如“http://www.6666a.cn/123.htm”中的“6666a.cn”
#描述#
网页标题下面的一段描述文字

Excel导出:
csv是一种文本表格,能被Excel兼容显示为多列多行的数据。只要在保存模板中设置为:
"#网址#","#标题#","#描述#"
这种格式就是csv格式,使用引号围住每个项目,多个项目使用逗号隔开,然后保存扩展名填为csv即可
问题集锦:
1.为什么采集一段时间之后,无法采集?

这可能采集多了被搜索引擎限制。一般换个IP(如使用VPN换IP)即可继续采集,如果不换,只能等待搜索引擎取消屏蔽之后才能继续采集。百度的屏蔽时间通常半小时到数小时。
不过,现在即使出现验证码屏蔽,软件也会弹出验证码手动输入的(百度、谷歌)


2.不同批次关键词采集的结果为什么会存在部分网址重复?

尤其是只引用了 #域名# 或 #顶级域名# 之后,这种部分网址重复的情况比较多。这也是正常的,因为每个网站的内页可能包含很多主题,不同关键词都可能采集到该网站的不同内页,当引用域名后,相同网站的不同内页的域名结果自然就相同了。
另外,软件里的自动去重,是针对本次采集的结果内部进行去重,以前采集的结果是不在本次去重范围的。如果两次采集的结果存在部分网址重复,可以把他们合并一起,使用软件去重(水淼·文本去重打乱器)。


3.为什么采集回来的网址的主题与关键词不符?

是因为引用了 #域名# 或 #顶级域名# 后,取的是域名部分,域名打开的是该网站的首页,而采集的原网址可能不是首页,而是该网站的某一篇文章的内页,该内页包含关键词主题,因此被搜索引擎收录,软件才能采集得到。但取域名后,你打开的域名首页就不一定包含该关键词。
为了比对采集是否正确,可以在保存模板里输入:#标题#
,保存为htm文件,采集完后可以自己打开该文件查看比对。


分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏
收藏1

免责声明

1、本主题所有言论和图片纯属会员个人意见,与本论坛立场无关

2、所发布的一切破解补丁、注册机和注册信息及软件仅限用于学习和研究目的

3、不得将上述内容用于商业或者非法用途 否则,一切后果请用户自负。

4、本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内删除

5、 如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。

6、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号