分模块测试

application.py

对 application.py 的测试,调用命令:

python test/application.py

test_reloader(self)

def test_reloader(self):
    write('foo.py', data % dict(classname='a', output='a'))
    import foo
    app = foo.app
    
    self.assertEquals(app.request('/').data, 'a')
    
    # test class change
    time.sleep(1)
    write('foo.py', data % dict(classname='a', output='b'))
    self.assertEquals(app.request('/').data, 'b')

    # test urls change
    time.sleep(1)
    write('foo.py', data % dict(classname='c', output='c'))
    self.assertEquals(app.request('/').data, 'c')

总的来说,这个过程会生成一个 foo.py 文件

import web

urls = ("/", "a")
app = web.application(urls, globals(), autoreload=True)

class a:
    def GET(self):
        return "a"

这是一个典型的 web 服务端应用程序,表示对 / 发起 GET 请求时,会调用 class a 中的 GET 函数,测试就是看看 web.application 是否可以正常完成任务,即是否可以正确返回”a”

下面详细看代码。

首先使用 write 生成了一个 foo.py 程序:

        write('foo.py', data % dict(classname='a', output='a'))

write 源代码:

def write(filename, data):
    f = open(filename, 'w')
    f.write(data)
    f.close()

data 定义:

data = """
import web

urls = ("/", "%(classname)s")
app = web.application(urls, globals(), autoreload=True)

class %(classname)s:
    def GET(self):
        return "%(output)s"

"""

data 相当于一个小型 web 程序的模板,类名和返回值由 一个 dict 指定,生成一个字符串,由 write 生成文件。

下面是类别和返回值为 a 时的 foo.py

import web

urls = ("/", "a")
app = web.application(urls, globals(), autoreload=True)

class a:
    def GET(self):
        return "a"

测试的方式采用 TestCase 中的 assertEquals 函数,比较 实际值与预测值。

import foo
app = foo.app
self.assertEquals(app.request('/').data, 'a')

app.request('/') 会得到一个Storage类型的值:

<Storage {'status': '200 OK', 'headers': {}, 'header_items': [], 'data': 'a'}>

其中的 data 就是 foo.pyGET 返回的值。

我对这个 app.request('/') 是比较困惑的。以 foo.py 为例, 之前写程序时,一般是有一个这样的程序:

import web

urls = ("/", "a")
app = web.application(urls, globals(), autoreload=True)

class a:
    def GET(self):
        return "a"

if __name__ == "__main__":
    app.run()

然后在浏览器中请求 0.0.0.0:8080/ 。 而在 request 之前,也没看到 run 啊,怎么就能 request 回 数据呢,而且通过上述代码运行后,程序会一直运行直到手动关闭, 而 request 的方式则是测试完后,整个程序也结束了。

所以,下一部,想比较一下 application.runapplication.request 的不同。

我们只看关键部分,即返回的值是如何被设值的。

web.application.request 中:

def request(self, localpart='/', method='GET', data=None,
            host="0.0.0.0:8080", headers=None, https=False, **kw):

    ...

response = web.storage()
def start_response(status, headers):
    response.status = status
    response.headers = dict(headers)
    response.header_items = headers
response.data = "".join(self.wsgifunc()(env, start_response))
return response

上述代码中 self.wsgifunc()(env, start_response) 比较另人困惑, 我还以为是调用函数的新方式呢,然后看了一下 wsgifunc 的代码, 它会返回一个函数wsgiwsgi(env, start_response) 为参数。 在 wsgi 内部,又会调用 handle_with_processors, handle_with_processors 会再调用 handle

    def handle(self):
        fn, args = self._match(self.mapping, web.ctx.path)
        return self._delegate(fn, self.fvars, args)

测试了一下,self._match() 会得到类名, self._delegate 会 得到返回的字符串,即 GET的返回值。

进入 self._delegate, 会最终调用一个关键函数 handle_class:

def handle_class(cls):
    meth = web.ctx.method
    if meth == 'HEAD' and not hasattr(cls, meth):
        meth = 'GET'
    if not hasattr(cls, meth):
        raise web.nomethod(cls)
    tocall = getattr(cls(), meth)
    return tocall(\*args)

参数cls值为foo.a, meth 会得到方法名 GET, 然后 tocall 会得到函数 a.GET, 至此,我们终于得以调用, GET函数,得到了返回的字符串。

从整个过程可以看出,没有启动服务器的代码,只是不断地调用 函数,最终来到 GET 函数。

再看看 web.application.run:

def run(self, *middleware):
    return wsgi.runwsgi(self.wsgifunc(\*middleware))

接着,我们来到 wsgi.runwsgi:

def runwsgi(func):
    """
    Runs a WSGI-compatible `func` using FCGI, SCGI, or a simple web server,
    as appropriate based on context and `sys.argv`.
    """
    
    if os.environ.has_key('SERVER_SOFTWARE'): # cgi
        os.environ['FCGI_FORCE_CGI'] = 'Y'

    if (os.environ.has_key('PHP_FCGI_CHILDREN') #lighttpd fastcgi
      or os.environ.has_key('SERVER_SOFTWARE')):
        return runfcgi(func, None)
    
    if 'fcgi' in sys.argv or 'fastcgi' in sys.argv:
        args = sys.argv[1:]
        if 'fastcgi' in args: args.remove('fastcgi')
        elif 'fcgi' in args: args.remove('fcgi')
        if args:
            return runfcgi(func, validaddr(args[0]))
        else:
            return runfcgi(func, None)
    
    if 'scgi' in sys.argv:
        args = sys.argv[1:]
        args.remove('scgi')
        if args:
            return runscgi(func, validaddr(args[0]))
        else:
            return runscgi(func)
    
    
    server_addr = validip(listget(sys.argv, 1, ''))
    if os.environ.has_key('PORT'): # e.g. Heroku
        server_addr = ('0.0.0.0', intget(os.environ['PORT']))
    
    return httpserver.runsimple(func, server_addr)

前面是对参数 sys.argv 分析,根据参数指定,启动相应服务, 我们的简单web程序没有参数,所以直接来到最后几行。

关键在于最后的 return

return httpserver.runsimple(func, server_addr)

可以看出,这里启动了一个服务器。

再看看 httpserver.runsimple的代码:

def runsimple(func, server_address=("0.0.0.0", 8080)):
    """
    Runs [CherryPy][cp] WSGI server hosting WSGI app `func`. 
    The directory `static/` is hosted statically.

    [cp]: http://www.cherrypy.org
    """
    global server
    func = StaticMiddleware(func)
    func = LogMiddleware(func)
    
    server = WSGIServer(server_address, func)

    if server.ssl_adapter:
        print "https://%s:%d/" % server_address
    else:
        print "http://%s:%d/" % server_address

    try:
        server.start()
    except (KeyboardInterrupt, SystemExit):
        server.stop()
        server = None

从注释中可以看出,这里使用了 CherryPy中的 WSGI server, 启动了服务器。

        server.start()

我们不再继续深入下去。只是直观地了解一下, application.runapplication.request 的不同之处。

从这里我们看出了相当重要的概念 WSGI。 这里有几篇对 WSGI 作介绍的博客:

这里有对 WSGI 的详细介绍: