Flask 中的全局变量是线程安全的吗?如何在请求之间共享数据?

Posted

技术标签:

【中文标题】Flask 中的全局变量是线程安全的吗?如何在请求之间共享数据?【英文标题】:Are global variables thread-safe in Flask? How do I share data between requests? 【发布时间】:2015-12-25 06:00:08 【问题描述】:

在我的应用程序中,一个普通对象的状态是通过发出请求来改变的,响应取决于状态。

class SomeObj():
    def __init__(self, param):
        self.param = param
    def query(self):
        self.param += 1
        return self.param

global_obj = SomeObj(0)

@app.route('/')
def home():
    flash(global_obj.query())
    render_template('index.html')

如果我在我的开发服务器上运行它,我希望得到 1、2、3 等等。如果同时从 100 个不同的客户端发出请求,会出现问题吗?预期的结果是 100 个不同的客户端每个都看到一个从 1 到 100 的唯一数字。或者会发生这样的事情:

    客户端 1 查询。 self.param 加 1。 在执行 return 语句之前,线程切换到客户端 2。self.param 再次递增。 线程切换回客户端 1,客户端返回数字 2,例如。 现在线程移动到客户端 2 并向他/她返回数字 3。

由于只有两个客户端,因此预期结果是 1 和 2,而不是 2 和 3。跳过了一个数字。

当我扩展我的应用程序时,这真的会发生吗?我应该看看全局变量的哪些替代方案?

【问题讨论】:

【参考方案1】:

您不能使用全局变量来保存此类数据。它不仅不是线程安全的,也不是进程安全的,而且生产环境中的 WSGI 服务器会产生多个进程。如果您使用线程来处理请求,您的计数不仅会出错,而且还会根据处理请求的进程而有所不同。

使用 Flask 之外的数据源来保存全局数据。数据库、memcached 或 redis 都是合适的单独存储区域,具体取决于您的需要。如果您需要加载和访问 Python 数据,请考虑 multiprocessing.Manager。您还可以将会话用于每个用户的简单数据。


开发服务器可以在单线程和进程中运行。您不会看到您描述的行为,因为每个请求都将被同步处理。启用线程或进程,您将看到它。 app.run(threaded=True)app.run(processes=10)。 (在 1.0 中,服务器默认是线程化的。)


一些 WSGI 服务器可能支持 gevent 或其他异步工作者。全局变量仍然不是线程安全的,因为仍然没有针对大多数竞争条件的保护。你仍然可以有这样的场景,一个工人得到一个值,产出,另一个修改它,产出,然后第一个工人也修改它。


如果您需要在请求期间存储一些全局数据,您可以使用 Flask 的g object。另一个常见的情况是一些管理数据库连接的***对象。这种“全局”类型的区别在于它对每个请求都是唯一的,而不是在个请求之间使用,并且有一些东西可以管理资源的设置和拆卸。

【讨论】:

【参考方案2】:

这并不是对全局线程安全的真正答案。

但我认为在这里提及会议很重要。 您正在寻找一种存储客户特定数据的方法。每个连接都应该以线程安全的方式访问自己的数据池。

这可以通过服务器端会话实现,并且可以在一个非常简洁的烧瓶插件中使用:https://pythonhosted.org/Flask-Session/

如果您设置会话,则session 变量在您的所有路由中都可用,它的行为类似于字典。存储在此字典中的数据对于每个连接的客户端都是单独的。

这是一个简短的演示:

from flask import Flask, session
from flask_session import Session

app = Flask(__name__)
# Check Configuration section for more details
SESSION_TYPE = 'filesystem'
app.config.from_object(__name__)
Session(app)

@app.route('/')
def reset():
    session["counter"]=0

    return "counter was reset"

@app.route('/inc')
def routeA():
    if not "counter" in session:
        session["counter"]=0

    session["counter"]+=1

    return "counter is ".format(session["counter"])

@app.route('/dec')
def routeB():
    if not "counter" in session:
        session["counter"] = 0

    session["counter"] -= 1

    return "counter is ".format(session["counter"])


if __name__ == '__main__':
    app.run()

pip install Flask-Session 之后,你应该可以运行它了。尝试从不同的浏览器访问它,您会发现它们之间没有共享计数器。

【讨论】:

【参考方案3】:

请求外部数据源的另一个示例是缓存,例如 Flask-Caching 或其他扩展提供的缓存。

    创建一个文件common.py 并在其中放置以下内容:
from flask_caching import Cache

# Instantiate the cache
cache = Cache()
    在创建 flask app 的文件中,使用以下代码注册缓存:
# Import cache
from common import cache

# ...
app = Flask(__name__)

cache.init_app(app=app, config="CACHE_TYPE": "filesystem",'CACHE_DIR': Path('/tmp'))
    现在通过导入缓存并执行如下方式在整个应用程序中使用:
# Import cache
from common import cache

# store a value
cache.set("my_value", 1_000_000)

# Get a value
my_value = cache.get("my_value")

【讨论】:

几个问题。 1. 每个进程都有一个缓存吗? 2. 如果一个缓存不是每个进程唯一的,它是进程安全的吗? (我是否可以获取一个锁,以使其他进程在缓存被另一个进程写入时无法写入缓存?) 你可以在这里阅读更多关于缓存配置的信息@ProQ flask-caching.readthedocs.io/en/latest/index.html#simplecache【参考方案4】:

虽然完全接受之前的赞成答案,并且不鼓励使用全局变量进行生产和可扩展的 Flask 存储,但出于原型设计或真正简单的服务器的目的,在 Flask“开发服务器”下运行...

...

Python内置的数据类型,我个人使用并测试了全局dict、as per Python documentation是线程安全的。不处理安全。

对于在开发服务器下运行的每个(可能并发的)Flask 会话,从这样的(服务器全局)dict 插入、查找和读取都可以。

当这样的全局 dict 使用唯一的 Flask 会话密钥作为键时,它对于服务器端存储会话特定数据非常有用,否则不适合 cookie(最大大小 4 kB)。

当然,应该小心保护这样一个服务器全局字典,以免它变得太大,在内存中。可以在请求处理期间对某种过期的“旧”键/值对进行编码。

同样,不建议将其用于生产或可扩展部署,但对于本地面向任务的服务器来说可能没问题,因为单独的数据库对于给定任务来说太多了。

...

【讨论】:

以上是关于Flask 中的全局变量是线程安全的吗?如何在请求之间共享数据?的主要内容,如果未能解决你的问题,请参考以下文章

flask的Request对象

flask_上下文

Flask上下文管理源码分析

Flask之线程与协程

java中的++i是线程安全的吗?

Flask_获取请求信息