1
lianyue 2015-06-13 11:56:09 +08:00
google 有伐限制爬多了点 就。。。。 验证码 我记得 google 有ajax 的搜索api json格式的 自己找找吧
|
2
lincanbin 2015-06-13 11:57:21 +08:00
|
3
Andy1999 2015-06-13 12:01:12 +08:00 via iPhone
会限制的
|
4
shierji OP |
5
dong3580 2015-06-13 12:05:29 +08:00 via Android
嵌套一个webbrower控件试试,应该可以,C#里面有ms提供的,其他语言的话不清楚。谷歌搜索检测太多,多玩几次就会干掉。一楼说的那个ajax,每页返回4条,一共18到20页结果,再请求就不行了。
|
7
binux 2015-06-13 12:12:43 +08:00
不要爬桌面版
|
8
elgoog 2015-06-13 12:36:40 +08:00
API不行?
|
9
gdwest 2015-06-13 12:39:28 +08:00 via iPhone
这个问题你要@国内各大搜索引擎
|
10
zhjits 2015-06-13 12:52:32 +08:00
Pricing
JSON/Atom Custom Search API pricing and quotas depend on the engine's edition: Custom Search Engine (free) For CSE users, the API provides 100 search queries per day for free. If you need more, you may sign up for billing in the Developers Console. Additional requests cost $5 per 1000 queries, up to 10k queries per day. Google Site Search (paid). For detailed information on GSS usage limits and quotas, please check GSS pricing options. |
11
icedx 2015-06-13 13:01:11 +08:00
有
|
12
icedx 2015-06-13 13:15:51 +08:00
V2EX 不支持缩进 所以你把下面两行代码贴到Python 中就能看到解决方法了
Code="""import[Space]requests\n\nConf_UseProxy=0\n\nHeaders={'User-Agent':'Mozilla/4.0[Space](Windows;[Space]MSIE[Space]6.0;[Space]Windows[Space]NT[Space]5.2)'}\n\nif[Space]Conf_UseProxy==1:\n[Space]import[Space]socks[Space]\n[Space]import[Space]socket[Space]\n[Space]socks.set_default_proxy(socks.SOCKS5,'localhost',1079,rdns=True)[Space]\n[Space]socket.socket[Space]=[Space]socks.socksocket\n\ndef[Space]GetGoogle(KeyWord):\n[Space]Url='https://www.google.com/search?q='+KeyWord\n[Space]Response=requests.get(Url,headers=Headers)\n[Space]print[Space]Response.content\n\nGetGoogle('QueenSamaprpr')""" print Code.replace('\\n','\n').replace('[Space]',' ') |
15
icedx 2015-06-13 13:25:59 +08:00
这个不是对楼主说的: 不要吐槽我的代码风格, 你们那些个没解决问题的没资格吐槽我的代码风格!(指
这个才是对楼主说的: 翻页的参数是: &start=(目标页数-1)*10 |
16
icedx 2015-06-13 13:29:01 +08:00
|