采集场景
在速卖通(AliExpress)首页的http://www.aliexpress.com中输入关键词,收集关键词搜索后得到的商品列表信息。
采集字段
页面上的关键词、标题、产品ID、产品图片地址、产品详情链接、价格、免费退货、星级、销量、商店名称等数据都可以收集。
采集结果
采集结果可以导出为Excel、CSV、HTML、数据库等格式。导出到Excel 的示例:
1.请求方式:HTTP POST GET
2. 公共参数:
姓名
类型
必须
描述
钥匙
细绳
是的
调用key(必须拼接在GET方式的URL中)
秘密
细绳
是的
通话键
接口名称
细绳
是的
API接口名称(包含在请求地址中)[item_search、item_get、item_search_shop等]
缓存
细绳
不
[yes,no]默认是yes,会调用缓存的数据,速度比较快
结果类型
细绳
不
[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容可以直接读取中文
郎
细绳
不
[cn,en,ru] 翻译语言,默认cn 简体中文
版本
细绳
不
API版本
3. 请求参数
请求参数:q=shoestart_price=end_price=page=cat=discount_notallow=sort=page_size=seller_info=nick=ppath=
参数说明:q:搜索关键词
cat: 类别ID
start_price: 起始价
end_price: 最终价格
sort: 排序[出价,_出价,_销售,_新]
(bid:总价,sale:销量,上新上架时间,加_前缀从大到小排序)
第:页
4.请求代码示例,支持高并发请求(CURL、PHP、PHPsdk、Java、C#、Python.)
#编码:utf-8
'''
兼容python2.x和python3.x
requirement: pip 安装请求
'''
从__future__ 导入print_function
导入请求
# 请求示例url 默认请求参数已进行URL编码
url='https://api-vxin.Taobaoapi2014.cn/aliexpress/item_search/?key=你自己的apiKeysecret=你自己的apiSecretq=shoestart_price=end_price=page=cat=discount_only=sort=page_size=seller_info=nick=ppath='
标题={
'接受编码' : 'gzip',
'连接' : '关闭'
}
如果__name__=='__main__' :
r=requests.get(url, headers=headers)
json_obj=r.json()
print(json_obj) 5.错误码说明