以前做某产品时,想了一大堆的推广思路,因为跟销售有关,淘宝上又有很多的同类商品,所以准备抓一下购买竞争产品的淘宝用户,从中挖地点人,遂有了一下的脚本,做的比较粗糙,只是为了满足当时的需要,后期没有在进行细致维护,因为后来发现这条路子不通..淘宝没有接口能直接发旺旺信息,如果模拟来做的时候,大部分用户还必须先加为好友,还有旺旺每天只能加50个好友….
如果需要小批量推广,或者你有大把的时间,你可以尝试一下用这个思路推广。
说远了,这篇主要介绍如何抓取,这个脚本是从某宝贝页面的的用户评价处抓取的淘宝(旺旺)昵称,淘宝中,很多的时候都是通过前端的请求通过ajax去后端取数据,的,这个评价也不例外,SO,我们不用去加载宝贝页面那么庞大的信息,直接访问他的接口来数据就行了。然后通过正则匹配一下昵称,再去掉哪些隐藏成*号的昵称,然后入库。OK。
这个脚本是要连库的,一个两个表,nickname,抓取后的昵称存放在这里,turl,抓取的淘宝页面地址。
1 | CREATE TABLE `nickname` ( |
天猫的产品页面没测试,C店的没问题,如果测试时上面的URL失效了,那就自己再去招一个吧。
1 | import MySQLdb |