业界动态
python如何调用谷歌搜图api_python爬虫抓去google图片搜索结果的图片
2024-11-19 03:06

# -*- coding: gbk -*-

python如何调用谷歌搜图api_python爬虫抓去google图片搜索结果的图片

import mechanize

from BeautifulSoup import BeautifulSoup

import cookielib,re

import base64,zlib

import Image,StringIO

# Browser

br = mechanize.Browser()

# cookie Jar

cj = cookielib.LWPcookieJar()

br.set_cookiejar(cj)

# Browser options

br.set_handle_equiv(True)

br.set_handle_gzip(True)

br.set_handle_redirect(True)

br.set_handle_referer(True)

br.set_handle_robots(False)

br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)

br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/4.0.0')]

br.open("http://www.google.com.hk/search?um=1&newwindow=1&safe=strict&hl=zh-CN&biw=1920&bih=473&tbm=isch&sa=1&q=car&btnG=")

html = br.response().read()

content = BeautifulSoup(html).findAll('script')

pattern = re.compile(r"(?&lt=data:image/jpeg;base64,).*(?=';)")

count=0

for item in content:

#print item

match = pattern.search(str(item))

if match:

dataStr = match.group()

dataStr = dataStr.replace(r'x3d','=') #这行代码是关键,折腾了我大半天。网页里的base64编码,在不是4的倍数时,会用“x3d”补足,要替换为=;(0x3d即为=的Ascii码值)

bin = StringIO.StringIO(dataStr)

bout=open('d:\out\data%d.jpeg'%count,'wb')

base64.decode(bin,bout)

bout.close()

    以上就是本篇文章【python如何调用谷歌搜图api_python爬虫抓去google图片搜索结果的图片】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/news/10301.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多   
最新新闻
【原】免翻!Google谷歌最新镜像,国内直接访问,某高校低调提供,赶紧使用
据不完全统计,订阅「王不留」公众号的学生里,80%考上了国内外知名高校研究生▼点击下方名片,关注「王不留」私信:国家地理,
B站核心代理商|商业起飞、带货起飞、信息流一站式开户代运营服务|Story信息流板块介绍
B站广告推广的重要性B站作为一个不断发展并拥有众多用户的视频分享平台,吸引了越来越多的广告主的关注。在进行B站广告推广时,
不受国内限制的浏览器 不受限制的万能浏览器
  无论是电脑上,还是手机,浏览器是必不可少的软件,不过现在浏览器泛滥,下面万商云集小编给大家介绍下不受限制的万能浏览器
TCL电子与阳光100成立合资公司,打造共享智能家居公寓
  8月16日, 在时空艺境浮窗全场景TV新品发布会上,TCL电子与地产领头羊阳光100置业集团正式签署战略合作协议,将在喜马拉雅共
docker 搭建frp内网穿透以及frp详细使用
下载说明 去github官网下载最新版本,链接地址:https://github.com/fatedier/frp/releases/download/ windows对应&
一听就火的网名
一听就火的网名  由于网络是一个虚拟的世界,为了避免使用真实姓名带来的麻烦所以发明了网名。下面是小编帮大家整理的一听就火
今日头条广告怎样投放的效果好?如何找到目标客户?
方法/步骤1一、头条广告怎样投放的效果好1、线上宣传与线下活动推广本地服务如果只依赖发发传单,超过90%的用户拿到传单后都无法
MobileFile Search(手机文件查找工具) v1.1.5.0 绿色版
  MobileFile Search是一款手机文件查找和管理工具,旨在帮助用户从手机中快速查找用户需要的文件;这款软件不需要安装,因此
人类生活中的“昆虫制造”
文|伯镇一提到昆虫或虫子,总让人不免感到厌恶。但实际上,人类的生存离不开昆虫。作为经济昆虫的代表,虫胶、蚕丝、胭脂虫红曾
本企业新闻

点击拨打: