NxnXgpuPSfsIT 最近的时间轴更新
NxnXgpuPSfsIT

NxnXgpuPSfsIT

V2EX 第 173408 号会员,加入于 2016-05-17 10:34:37 +08:00
维护 itchat、trip,业余写玩具的
根据 NxnXgpuPSfsIT 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
NxnXgpuPSfsIT 最近回复了
2020-09-18 17:51:20 +08:00
回复了 wsxka 创建的主题 macOS [上架抽专业版] Anchor:好用的 Mac 任务栏和通知中心
nb
2018-07-20 16:16:46 +08:00
回复了 reaCodes 创建的主题 Python Python 输出多行时如何原地刷新?
@reaCodes Windows 下面我见过两种比较简单的解决方案
gist.github.com/littlecodersh/2ab4d88070eb16bf9f2b26f7cbc16ad0
2018-05-22 14:08:14 +08:00
回复了 yoke123 创建的主题 Python Python 异步和线程的一些疑问
没懂替换 url 的值,如果是替换 data 的值的话是不是这个意思?

import trip

json_data = {'a': {'url': 'https://www.v2ex.com', 'data': '' },}

@trip.coroutine
def fetch(k):
r = yield trip.get(json_data[k]['url'])
json_data[k]['data'] = r.content

def main():
yield [fetch(k) for k in json_data]

trip.run(main)
2018-01-04 14:37:40 +08:00
回复了 Nick2VIPUser 创建的主题 程序员 (请教)如何提高爬虫的效率/采集速度
@Nick2VIPUser 可以试试 Trip, 替换 requests 比较方便,github.com/littlecodersh/trip
急用的话可以直接 gevent 碰碰运气。
2017-12-15 23:07:03 +08:00
回复了 NxnXgpuPSfsIT 创建的主题 Python Trip: 协程 Requests 实战,获取免费代理
@2225377fjs
很棒!尊重是交流的基础。


所以我们达成共识了,

由于其独特的切入点,gevent 在根源上存在问题,这是劣势。
* patch 会给项目带来毁灭性的隐患,且无法预料
* 不区分协程函数和普通函数(不使用 yield )是一个很糟糕的习惯
* 侵入式的兼容只能产生一个不可知的过渡用品,而不是一个有保障的产品

而你说的优势,你举出的观点最好的性能是源于你当时对于主流协程的不了解。
至于解释,你说了你不用,你不愿意解释。但你也认识到了那些问题都是普通用户在日常使用可能中会碰到的。

我们于是能清楚的看到大牛所说的希望可以有项目出现的空白,
你想要使用协程网络库,现在有了不存在根本层面问题的选择。


所以最终回到我的观点,gevent 是一个没有办法的将就。
Requests 的作者说他想要一个这样库却没有时间,我们有。
不敢说有什么水平,起码达到了高效、可用,
起码可以完美的完成就像文中介绍的操作。
我们才分享了项目的介绍,给那些也曾经意识到这块空白的程序员。
我们可以一起使用,提意见,志同道合可以一起开发。

而对于那些幸运的能一直处在 gevent 安全区中的用户或者项目已经基于 gevent 的用户,
这个项目只是给你们多一个选择,即使你换用官方的协程,依旧可以使用到协程 Requests。
2017-12-15 17:04:07 +08:00
回复了 NxnXgpuPSfsIT 创建的主题 Python Trip: 协程 Requests 实战,获取免费代理
贴出最基本的协程的使用,只是用过远没有精通,更不会自视甚高的傲视他人却给出可笑的代码和观点:
![]( http://7xrip4.com1.z0.glb.clouddn.com/v2ex/gevent-trip.png)

Result:
55200
0.718000173569
55200
12.2539999485
55200
0.746000051498

另外,一个最基本的页面,送给需入门的程序员们:docs.python.org/3/library/asyncio-task.html#coroutine
2017-12-15 14:44:26 +08:00
回复了 NxnXgpuPSfsIT 创建的主题 Python Trip: 协程 Requests 实战,获取免费代理
@2225377fjs
gevent 的侵入导致的 bug 我已经举出了那么多例子,不再多做解释。再次提醒,他会给程序埋下无法发现的隐患。

很遗憾,我发现你竟然是在完全不了解框架的情况下与我进行的交流。
所谓的性能差距竟然是来源于你完全不了解 Python 官方主流协程的运行方式,也没有花哪怕三分钟了解一下这个项目或是 tornado 或是 asyncio 的入门。
你打字的时间远不止三分钟,相较你说的没空,嚣张怕是更适合你。

关于回答,你依旧无法做出任何实质性的回答。
很意外,你无法 show me the code,哪怕是一个空余时间的小项目,而论证的唯一一个观点竟是这样的水平。
然而不出所料的,你依然出言不逊,展示着你的自负。
抱歉,这样的话,我没有时间和你浪费。

言尽于此,嚣张和自负背后往往有相适应的能力与才华,我真心希望你有但我没能发现。
不再回复,祝好!
2017-12-15 09:53:32 +08:00
回复了 NxnXgpuPSfsIT 创建的主题 Python Trip: 协程 Requests 实战,获取免费代理
@2225377fjs
换言之,你的回复告诉了我你不能就 gevent 的缺陷做出任何解释,也无法证明你唯一提出的观点高效。

你认为 gevent 是优雅的高效的产物,而我告诉了你实际上他只是一个没有办法的将就。
所以需要非基于 gevent 的重新实现:
* 他不会给程序埋下无法发现的隐患
* 他使用了更好的协程习惯
* 他每一个方法都有保障,不会充满了不可知

我说的,我证明了。

而你空无一物的嚣张回答,相较于想要好好交流的同行,更倾向于一个无脑的喷子。

我不想引战,所以各有优劣的观点我也每一个好好阐述。
Python 之父,Requests 作者,董伟明的观点我摆出来了。
可能产生的问题的代码,issue,原理我也摆出来了。

而不像你,
说都有相应支持,却一个也举不出来,告诉我你指的是什么? kafka、rabbitmq、zookeeper,我洗耳恭听。
说 gevent 性能也是 python 环境下最好的,谁提出谁举证的道理不会不懂吧,没有举证就不要乱说。

你说:“不要不了解情况就开始说人家这不好,那也不好”,送还给你。

你不了解 yield, yield from,我把 pep 找给你看。
你看不到 gevent 也存在自身巨大的缺陷,我找大牛找代码找原理和你讲。

我的所有开源项目都在 github 上,你才知道我是这个库的作者吗?
大家都是普通程序员所以我从来没有因为我写过几个项目就觉得自己很了解什么。
而你随意指责别人的项目是半吊子,不拿出实际的理由也不给出足以信服的个人背景。
不好意思,我不能接受。

所以可以麻烦把你自信的来源向我展示一下吗?
让我看看你到底写过什么。
如果你想继续讨论而非无脑喷,请好好证明一下你的观点。
2017-12-15 04:40:20 +08:00
回复了 NxnXgpuPSfsIT 创建的主题 Python Trip: 协程 Requests 实战,获取免费代理
@2225377fjs
你认为 gevent 是优雅的高效的产物,而我想告诉你实际上他只是一个没有办法的将就。

首先,关于讨论,
技术或者项目经验存在高低,是否能意识到 gevent 存在的问题都无所谓,我们可以慢慢交流。
但是你希望还是可以认识到没有进行充分的论证,指责他人的工作毫无意义是一件很没有礼貌的事情。
另外,措辞体现一个人的素质,尊重这件事情也是相互的,于人于己应该都是有利的。


说他是将就,是因为:
* gevent 会给项目带来毁灭性的隐患,且无法预料
* 不区分协程函数和普通函数(不使用 yield )是一个很糟糕的习惯
* 侵入式的兼容只能产生一个不可知的过渡用品,而不是一个有保障的产品

所以需要非基于 gevent 的重新实现:
* 他不会给程序埋下无法发现的隐患
* 他使用了更好的协程习惯
* 他每一个方法都有保障,不会充满了不可知


我的观点里有一个大局,一个细节。


说大局,
主要是希望你把我放在一个同等的位置上听一下我说的话,讨论才能有意义。
把我当成一个一无所知的跳梁小丑的话,可能你也提不起兴致和我交流。
当然,如果你可以拿出你的项目让我认同,我也不介意自己以跳梁小丑的身份虚心求教。

以我浅薄的见识看到的大局里,我不是一个人固执己见倾向于使用 yield 等关键字。
和你讲一下我看到的大局,那些大牛都是怎么看待 gevent 的。

Python 之父明确表明过 gevent 不是一个好的实现
你可以在他的 Twitter 里看到: https://twitter.com/gvanrossum/status/443093650533142528
gevent 早已出现,而加入标准库的是 asyncio 而非 gevent 更是对这一态度的明确实践。

Requests 的作者对于本类项目的期待是我写这个项目的初衷。
Requests 的作者一直认为使用 gevent 不是一个好的做法,他多次在 grequests 的 issue 中提出希望有基于 Future 和 yield 语法的协程 Requests。
例如 Issue#10 和 Issue#51,他提出这是一个好的想法,但是他没有时间实现。
( Issue#10: suggestion: use concurrent.futures instead of gevent 中他这样说道:
I'm 100% for this now — i've been talking about it for a few months now. Just need to implement ;))
在 gevent 和其他的基于 yield 的协程的选择中,他百分百的站在了 gevent 的对立面。

不说国外,国内学习 Python 多多少少听说过董伟明,特别是 Web 开发一块。
他在个人的博客中明确表明:所以建议大家放弃 Gevent,拥抱 asyncio。
http://www.dongwm.com/archives/使用 Python 进行并发编程-我为什么不喜欢 Gevent/)


说细节,
是希望我们可以在讨论中把优劣讨论的越来越清楚。
我就回复开始的三个点一个一个解释:

关于隐患,先上一个特别简单的代码:
import multiprocessing, grequests; manager = multiprocessing.Manager()
他报错了,如果不是这段代码非常简单的只有一个引用,你需要多久要怎么发现是 gevent 的问题?
另外,这个问题你需要怎么修复?
所以就有了很多报出 gevent 毁了他整个项目的情况: https://github.com/kennethreitz/grequests/issues/55,https://github.com/pytest-dev/pytest-xdist/issues/254
不仅如此,关于垃圾回收,gevent 也会导致问题: https://www.projectcalico.org/the-sharp-edges-of-gevent/
更不要说一些操作的误区,例如使用 RLock,却发现明明都是主线程却没法锁两次。

使用 gevent 你难免会陷入是不是 gevent 又出问题了和完全没有修理的头绪的噩梦当中。
所以我说 gevent 是一颗定时炸弹,而我的项目不是,所以我认为我的项目有意义。

关于习惯,
董伟明关于习惯有一段话说得很好,我就不画蛇添足了:
Gvanrossum 说用它就是” patch-and-pray ”,太形象了。
由于 Gevent 直接修改标准库里面大部分的阻塞式系统调用,包括 socket、ssl、threading 和 select 等模块,而变为协作式运行。
但是我们无法保证你在复杂的生产环境中有哪些地方使用这些标准库会由于打了补丁而出现奇怪的问题,那么你只能祈祷( pray )了。
在 Python 之禅中明确说过:「 Explicit is better than implicit.」,猴子补丁明显的背离了这个原则。
我认可这个观点,即使仅是为了服务持有这个观点的这些人,我也认为我的项目有意义。

关于三方库,
你说 gevent 最大的一个优势就是可以与很多现有库兼容,api 也非常干净,我同意。
gevent 通过侵入式的修改让一些三方库直接可用,这很棒。
但这只是不可预知的部分可用,例如 Requests,你了解哪些部分是无法像预期那样表现的吗?
另外,这些部分哪些是可以修复的,哪些是框架所限无法修复的呢?
所以才需要一个让 Requests 所有部分功能都明确可用的库才出现。
你提到了很多外部系统,本项目基于 tornado,你可以将这些和 tornado 或者 asyncio 进行配对搜索,你就能发现全都有相应支持。
反观 gevent,kafka 的支持我并不认可 Github 上那个仅有 11 Star 长久未更新的项目,rabbitmq、zookeeper 之流更是不堪。
我不满足于不可预知的部分可用,所以我认为这个项目有意义。

当然还有一点是效率,
你并没有证明你所提出的相对于其他协程解决方案的高效,这里提一下,希望可以在后面的交流中看到。
另外,在证明的时候还是希望可以考虑到 gevent 对于 Python 解释器的限制。


最后,感谢你的时间,也期待你的回复!
2017-12-14 20:35:51 +08:00
回复了 NxnXgpuPSfsIT 创建的主题 Python Trip: 协程 Requests 实战,获取免费代理
@wcsjtu 是的,py3 用这个库就可以 async 和 return 了
所以我自己在用不是在写教程的时候也都是 3 的写法
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5807 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 06:11 · PVG 14:11 · LAX 22:11 · JFK 01:11
Developed with CodeLauncher
♥ Do have faith in what you're doing.