[软件]今日头条关键词搜索采集 1.0版

前几天有个老兄要定制今日头条搜索关键词结果的火车采集规则,被我婉拒了,因为用火车来采集今日头条文章,很容易被跳转验证甚至屏蔽IP。

昨晚用litrpa做了个采集机器人软件模拟人工访问今日头条,同时访问文章页面的地址带有aid和jtoken,测试采集了几百篇文章,一切完美。

支持内置浏览器界面显示页面采集状态,万一遇到验证,可以人工过验证后继续采集!

简单说一下大概的采集和发布流程。

打开软件,点运行,在弹窗中设置aid、关键词和采集搜索结果的页数。

aid:的获取很简单,在电脑浏览器打开今日头条网站搜索关键词,然后底部状态栏里就可以看到:

关键词:就是你要搜所的词:

采集页数:搜索结果列表页,每页10条文章,根据你的需要来设置页数,页数=10=采集100条文章

点确定后开始采集,采集过的文章ID会保存在已采集过的文章ID.txt,避免下次重复采集;文章保存于软件目录内的“文章采集”目录内的以关键词命名的目录内,图片也保存在这个目录内的“images”目录中,采集完成后可打包上传到网站目录解压即可,下个版本将支持FTP自动上传图片。

 

说下文章发布。

为了方便各种网站程序发布文章,采集的文章将保存为txt文档,通过火车采集器进行发布,毕竟火车有很多网站系统的发布模块。

发布方法:

先创建一个任务规则(规则随便写,发布模块配置好就行了)

在火车采集器的“任务批量处理”中选择这个任务,然后选择保存文章txt的目录,导入即可,如下图:

然后在任务上只勾选发布,允许任务后就可以发布文章到自己网站了。别忘了图片目录打包上传到网站根目录!

觉得有点麻烦的话那就对了,很简单的采集谁都会,复杂一点就是门槛了,对采集内容来说,有门槛,才是好事。

如果你用的是帝国cms,那你有福了,可以定制支持采集后自动发布文章的软件,不需要火车采集器来发布了。

1.0版的运行流程图,改进空间很大,新手可以参考一下自己做:

最后感谢汶Sir开发的软件 https://www.litrpa.com

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇