那我就来继续随便谈谈Twisted
首先讨论一下, 为什么需要twisted, 需要异步
为了更高效的利用CPU和资源, 提高用户的相应速度
任务需要较长时间才能完成分成两种情况,
1) 计算量较大, 需要CPU算好久才能算出来, 自然算出来才能给结果, 称为CPU等待.
2) 需要等待其他的数据, 比如需要从服务器等待获取信息, 需要从数据库等待查询结果, 这种虽然自己很闲, 无事可做, 但不得不干等, 称为I/O等待.
CPU等待是没办法的, 就是要算那么长时间, 唯一能做的是为了让用户体验好些, 大家轮流占用CPU, 这种典型的方法就是多线程...
I/O等待是应该需要优化的, 这是干等白白浪费并占住了资源, 使得其他用户也无法使用. 这儿就需要异步, 需要twisted, 需要callback.
本来我要等待数据, 然后程序才能继续, 异步的做法是, 把后续的处理程序封装成callback, errback, 把等待数据ready封装成event (让系统调用select去侦听数据I/O). 这样主程序不需要去专门等待某一个event, 有event触发就处理, 这就达到异步的效果.
所以在判断是否需要使用异步, 该不该使用twisted时, 只需要考虑是否存在I/O等待, 只要有I/O等待就应该考虑使用异步.
而Twisted的代码无论多么复杂, 其实都是在做如下这样简单的事情,
通过定义Protocal和Factory来解析请求
通过定义Callback来处理请求
定义I/O connection (将Factory作为参数, 包含Protocal和Callback), 并加到event loop(Reactor)中去
Run Reactor
再来, Twisted主要应用于什么场景, 使用Twisted真的比直接使用socket方便合理吗
Twisted主要用于开发server, 它就是为此而生的
下面我们通过简单的例子来和socket对比一下,
下面我们先来看一下客户端, 建立一个链接, 发送多条message
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) sock.connect((ip, port)) sock.send('Hello World1') time.sleep(3) sock.send('Hello World2') time.sleep(3) sock.send('Hello World3') sock.close()
先来看看socket的server, 显然这段代码只能接收到第一条message
如果需要接受所有的message, 必须在conn.recv前加上while, 这样保证接收到所有message后才去accept新的connection.
如果同时打开多个client, 那么这儿必须先接收完第一个client的所有message, 才能开始接收第二个client的...
这样就block了, 用户就不爽了...
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM) sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) sock.bind(('localhost', 3000)) sock.listen(5) while True: conn, addr = sock.accept() buf = conn.recv(1024) print 'Recv data:' + buf + '\n'
再来看看用Twisted实现的server, 可以试试同时打开多个上面的client, 该server是可以同时并发接收每个client的数据的, 而不是需要处理完一个client, 才开始处理下一个. 所以确实用Twisted开发server比直接使用socket方便合理许多.
from twisted.internet import protocol, reactorfrom twisted.internet.protocol import Factoryclass Echo(protocol.Protocol): def connectionMade(self): self.factory.numProtocols = self.factory.numProtocols+1 print 'connectionMade' print 'numProtocols:'+ str(self.factory.numProtocols) def connectionLost(self, reason): self.factory.numProtocols = self.factory.numProtocols-1 print 'connectionLost' print 'numProtocols:'+ str(self.factory.numProtocols) def dataReceived(self, data): #self.transport.write(data) print 'dataReceived:' + str(data)myFactory = Factory()myFactory.protocol = EchomyFactory.numProtocols = 0reactor.listenTCP(3000, myFactory)reactor.run()
想想Twisted是怎么样实现这种异步的, 是怎么样保存各个connection并在之间自由切换的?
从头开始, 大家先简单把I/O想象成文件, 对于操作系统而言, I/O操作就等同于对文件的读写操作, 其他对系统是透明的.
对于一个Twisted server, 刚开始监听一个I/O端口(这儿可以想象对于Twisted有个侦听队列, 刚开始list中只有一个port), 等待请求...
请求到达(相当于conn, addr = sock.accept() ), 触发connectionMade Event, 并把该connection加到侦听队列.
某connection收到数据, 触发dataReceived Event
某connection closed, 触发connectionLost Event, 并把该connection从侦听队列中删除.
如果在某个callback, 如dataReceived中出现一个很耗时的任务时该怎么办, 比如需要从另外一个服务器获取数据.
异步中, callback使用的第一原则是, 不能block, 因为主线程一旦block, 啥事就都做不了
所以这儿必须要再次使用异步, 在callback中再次设置event和callback, 并将和远程服务器的connection加到侦听队列中.