所在分类:  AMAZON 所属话题: Amazon

【原创】亚马逊评论采集器,可批量,永久免费。

Hello, 大家好。
本程序是由python编写,专用于爬取Asin的评论,这是该程序的最初版本,目前是自用于美国站点,后面功能会慢慢增加。作出几点说明:
 
1. 该程序为单线程,楼主条件有限,暂时没有购买代理ip, 所以无法维护自己的代理池,如果不用代理ip的话,直接使用多线程百分百会被亚马逊干掉,单线程和多线程的区别也只是爬取速度上的区别,目前单线程是足够用的。
 
2. 该程序第一次使用会先创建Asin_list.txt文件,你需要先将目标asin填写到txt文件中,数量没有限制,一行一个,asin错误会让程序运行失败。
 
3. 因为是自用,没有给程序写一个美观的ui, 使用的是dos界面(全自动爬取,感觉也不需要ui),图标也没有更换,凑合着用吧。
 
4. 目前爬取的内容包括Review的 : 评论人名字, 星级, 发布时间,验证购买, 评论标题, 评论内容。内容将保存在 xls文件中。 其他的内容看你们需不需要,需要的话是可以加进去的。
 
5. 本程序永久免费,不定期维护更新,请勿出售买卖(虽然很多卖家根本看不上这个程序,但是流程还是要走的呀,哈哈)。
 
6. 如果大家发现了一些bug或是不合理的地方,请指出,我会及时回复和修复。
 
9-12更新:
新加入爬取内容:变体评论标识,点赞数,评论的评论数。提升了爬取速度(爬取大几千或几万评论的时候,后期可能会变慢或假死,变慢是因为大量的请求堵塞网络,假死可能是被亚马逊检测到了,导致重新建立连接也失败),后续将添加其他所有站点的爬取选项。不定期更新。
 
9-12下午更新:
新加入 全站点爬取评论,日本站除外(要翻墙才行)。需要注意,因为是批量爬取,所以同站点的Asin放在txt文件中是没有问题的,但是如果将几个站点的asin放在一起,这样是无法爬取成功的。另外楼主的网络访问各个站点都很慢,测试的效果不是很好,具体效果请你们自行测试,如果发现有什么bug和其他问题,可以给我留言。

 
程序网盘地址 : 
链接:https://pan.baidu.com/s/1CwoPM7S55m6SrNkWUIIRPg      提取码:9xgi 

 
QQ图片20190911103740.png QQ图片20190911103904.png
已邀请:
我们值得给有分享精神的人点个赞                                                                                                   

要回复问题请先登录注册

 
知无不言 粤ICP备18098034号-1