下载客户端

北京到底有多少人戴口罩？这里进行了一次街头口罩观测实践

茅明睿／北京城市象限科技有限公司创始人王铭扬／北京师范大学物理系访问学者张圣林／卡迪夫大学生态城市硕士

2017-01-03 18:28

来源：澎湃新闻

∙ 市政厅 >

雾霾中的一次口罩观测实践

在过去一个月间，北京市的空气质量开始恶化，频繁出现的雾霾天气，扭转了不少公众关于“今年空气质量好转”的印象。尤其是，从12月17日开始，北京市的空气质量指数突然居高不下，连续一周的重污染，挑战着市民的忍耐极限，

但就算在如此严重的雾霾天气下，也并非所有人都会戴口罩。城市象限——一群心怀“用数据治理城市”理想的创业者，试图研究北京的公共健康问题。比如：北京究竟有多少人在雾霾天戴口罩？

城市象限曾用各种传感器去对城市、街道开展人本观测。比如，用红外传感器统计街道上的人数，用摄像头计算街道的喜悦程度。但是，观察市民戴口罩，我们并没有特别可靠易行的方法。于是，我们从扬·盖尔(Jan Gehl）先生那里寻求帮助。

扬·盖尔，著名建筑师，丹麦皇家建筑艺术学院教授，他是人性化城市设计思想的积极倡导者和身体力行的实践者，他的著作在城市规划和设计界有广泛影响。在其新作《公共生活研究方法》中，他系统介绍了PSPL(公共空间与公共生活）研究法，提出了自己对公共生活研究领域的思考和意见。其中第一条方法便是现场计数法。

图1. 扬·盖尔先生与他的新书

现场计数是公共生活研究的一种基本方法。街头几乎所有事物都是可以被计数的：比如人数、性别比例、多少人正在相互交谈、多少人在微笑等。调研数据可以主要依靠人工数数、用手持计数器，或用笔在纸上做场地标记，来进行记录。

利用现场计数法，笔者从11月17日开始，在上班路上，进行了口罩观测实践。截至目前共有23天的观测记录。由于特殊情况有些日期并没有观测记录。

观测时间：2016年11月17日-2016年12月23日8-9点

观测地点：崇文门外大街路西(约观测10分钟）；南礼士路(约观测5分钟）

观测对象：行人和自行车骑行者

观测内容：记录戴口罩和不戴口罩的人数

除了观测人数，笔者还对一些环境数据进行记录，包括观测时的空气质量指数(AQI）、观测日的天气、温度、风力等数据，形成了一系列观测记录，并将主要数据绘制于图2中。

在持续一个多月的口罩观测实践过程中，一些有趣的结果被逐步发掘出来。

图2. 崇文门、南礼士路戴口罩人群比例与AQI的关系图 (11/17 - 12/21)

如图2所示，黄色和橙色曲线分别代表崇文门附近和南礼士路附近观测到的街道上戴口罩人群比例(戴口罩的人数/总人数*100%）；蓝色曲线代表AQI，其数值体现了空气质量；从曲线总体趋势看，崇文门和南礼士路区域戴口罩的市民比例与AQI指数正相关，空气质量越差，戴口罩比例越高；但在2016年11月17日、11月26日等日出现异常。比如11月17日、12月12日，AQI并不高，却有相当高的比例人群戴口罩；而11月26日，AQI非常高时，戴口罩的人群比例却低得多。显然，除了AQI，还有其他因素影响市民戴口罩的行为。

图3. 崇文门、南礼士路戴口罩人群比例，AQI与雾霾预警指数的关系图 (11/17 - 12/21)

数据分析研究：到底什么影响了戴口罩人群比例

截至2016年12月25日，今冬以来，北京市政府一共发布三次雾霾预警。政府预警是否对市民戴口罩的行为产生了影响呢？

其次，是否有一些公众并没有查看AQI的习惯，而是依据生活习惯——“是否能看到蓝天”来判断空气质量，“非蓝天”不意味着一定有雾霾，那么，能否“看到蓝天”会不会对市民戴口罩的行为产生影响？

此外，按照逻辑推理，对空气质量敏感的人群，在工作日，因为无法避免出行，故选择戴口罩，而周末如果遭遇雾霾则会选择不出门。所以“是否周末”是否也是一个影响街头观测戴口罩人群比例的因素呢？

基于上面的猜想，笔者首先对周末、是否蓝天和雾霾预警三个因素进行了量化处理：

“周末”用0或1量化，工作日设为0，周末设为1；

“能否看见蓝天”也用0或1量化，蓝天为1，非蓝天为0；

政府的雾霾预警采用了“雾霾预警”词条的百度指数（北京）来量化，该指数代表北京关于“雾霾预警”的网络舆情以及市民的搜索热度；值得指出的是，舆情对戴口罩人群的影响时间存在滞后性，因此笔者选择前一日的指数对应次日的观测记录。

表1. 部分样本示例

基于AQI和“雾霾预警”百度指数的归一化数据，我们首先比较了崇文门和南礼士路的戴口罩人群比例，发现二者的关系是线性相关的(R2=0.95）。这说明了同一天、气象条件差不多的地域里，人们戴口罩的比例趋势相同。因此，我们选取的戴口罩人群比例(y)是基于两地总的戴口罩的比例而言的。

将AQI和量化过的因素作为自变量, 因为其与y呈指数关系，故将log(y）作为因变量进行广义线性回归，可以得到戴口罩人群比例与上面因素之间的关系。回归的结果如下：

(R方=0.904）

其中，x1代表标准化的AQI指数，x2代表是否为蓝天，x3代表是否为周末，x4代表标准化的“雾霾预警”百度指数，f(x)代表了回归出的戴口罩的人群比例。xi(i=1,2,3,4）前面的系数代表各自的权重，正值代表正相关，负值代表负相关；权重的绝对值越大对f(x)的影响越大。

也就是说，AQI和百度指数越大，街上戴口罩人群比例越大；而蓝天或周末的时候，街上戴口罩人群比例会减小。其中，AQI对人们戴口罩的影响最大，周末的影响次之，政府预警的影响再次之，是否蓝天对人们戴口罩的影响最弱。

做交叉验证，验证模型准确度，可得到模型预测值与实际观测值的偏差图(如图4)。图中黑色斜线表达式为y=x，x为我们记录的戴口罩人群比例，y代表根据模型算出来的可能戴口罩的人群比例。即当观测值与预测值一样时，蓝色原点应处于黑色斜线上，偏离斜线越远的点预测的越不准确。可见，当戴口罩人群比例小于30%时数据较为准确，其偏差在5%以内，大于30%后，偏差增大，但是仍小于10%。

图4. 实际观测值与模型预测值的比较

就这样，通过回归分析，我们得到了一个足以体现影响人们戴口罩比例的因素的模型。

基于数据的政策评价：“政府的预警到底让多少人戴上了口罩？”

入冬以来，北京一共经历了三次雾霾预警，分别是11月16日上午11点和12月1日下午3点发布的两次为期一天的橙色预警，以及12月16日下午5点发布的未来五天雾霾红色预警。预警初衷是提高市民的防护意识，政府预警通过多种渠道向市民发布，除了新闻媒体、互联网，还包括手机短信。然而，到目前为止，还没有平台或者机构发布有效的，针对北京市雾霾预警这一政策效果判断的结论。能否通过观测结果和数学模型来评估政府的雾霾预警效果呢？

图5. 政府的空气重污染预警短信

考虑到整体的政策评价需要北京全城的多次数据，城市象限首先使用手头数据，计算了一次在有预警和没有预警的条件下，崇文门和南礼士路区域的戴口罩人数变化预测。

由于预警会直接影响百度指数，因此这次建模去除百度指数的影响(x4）。同时根据发布预警的时间，选取非预警时间(除预警时间和预警后的两天）戴口罩的人群比例为因变量，选取AQI，是否蓝天和是否周末作为自变量，建立模型。将预警后的时间段内的三个自变量带入模型，获得不考虑预警情况下，模型预测的戴口罩的人的比例f无预警(x)。

以非预警时间为训练数据进行回归分析，得到回归表达式为：

(R方=0.833）

再做交叉验证，可得到预测值与观测值的关系，可见模型与数据的偏差在3%以内。

图6. 实际观测值与模型预测值的比较

设预警后观测到的戴口罩的人的比例为y0。比较它与f无预警(x)的关系，就可以清楚地评估预警的效果了。

图7. 预警效果图

如果预警有效果，那么预警后得到的观测值会大于模型得出的预测值；如果预警效果不佳，那么观测值将与预测值保持接近或是一致。由于误差在3%以内，因此我们认为二者差距在3%以内，则观测值与预测值保持一致，即预警未有明显效果。观测值比预测值大3%以上，视为有效果。差距越大，效果越明显。

11月16日，2016年入冬首次预警，引起了舆论的广泛传播，人们防护意识提高，尽管11月17日空气质量尚可(AQI 154，轻度污染），市民出行戴口罩人数仍然显著增加(5%）。11月18日，空气质量恶化达到入冬以来首次重度污染，但预警的效果已经显著下降，在更恶劣的空气质量条件下戴口罩的人群比例反而降低。

12月1日第二次预警，由于预警当天的空气质量非常好(AQI 42，空气质量优)，次日空气质量也尚可接受(AQI 109，轻度污染)，能见度较高，戴口罩比例并未增加，预警效果不明显。但是预警的影响并未就此消散，12月3日空气质量恶化(AQI 167, 中度污染)，但市民出行戴口罩的比例仍显著增加，预警显现出一定效果。

12月15日第三次预警，且是级别最高的红色预警；（12月16日没有开展观测）12月17日的AQI高达422，空气严重污染。根据预测模型，我们分析出，如果没有预警，此时市民出行戴口罩人数比例约为16%，基本与11月16日（AQI 403）的比例相似。但由于红色预警的发布，经过16日一整天的舆论发酵，17日戴口罩人数明显增多，提升比例高达16%，可见此次预警起到非常明显的效果。不仅如此，接下来的几天红色预警时间内，戴口罩人数比例均比模型预测的未预警情况下高出很多(6% - 19%)，这充分说明此次红色预警有效提高了市民的防护意识，让更多人出行戴上了口罩。

表2. 环境空气质量指数(AQI)技术规定及雾霾预警等级划分

由此，可得到以下结论：本年首次预警（橙色）首天效果较好，但由于实际AQI有滞后性，预警效力时间较短，并未提升人们对后续空气质量的关注；第二次预警（橙色）准确度欠佳，引起的舆论关注远低于第一次，预警效果在两天后随着空气质量恶化才显现，总体效果不明显；第三次预警（红色），引起了巨大的舆情反响，令戴口罩的人群比例明显增加，效果显著，同时效力持续时间长。可见，雾霾预警机制起码在崇文门和南礼士路地区非常有效！

笔者还注意到，11月26日（AQI 403）达到了严重污染，但由于政府并未发布预警，戴口罩出行人数比例只有16%。假设前一日政府发布了预警且引起了一定的舆情反响——雾霾预警指数取12月17日的百度指数，计算出的戴口罩出行人数比例将达到33%，可增长17%。

此外，还有一些可以用来比较的重要角度。从地点差异看，崇文门地区的行人比南礼士路人对雾霾有更强的防护意识；从人员职业看，保安、停车管理员、环卫、路政工人、快递、外卖等高暴露人群防护意识最低：笔者观察到，在红色预警之前，环卫工人、路政工人群体只有3.5%的戴口罩比例，快递、外卖群体只有4.8%的戴口罩比例，而保安、停车管理员群体则只有2.1%的戴口罩比例。直到红色预警之后，上述高暴露人群才开始提升戴口罩比例，但总体上也只接近全部观察样本的戴口罩比例——考虑到他们长期暴露在污染空气中，即便达到了市民的平均比例也明显不够。

尾声：对口罩观测的众包活动召集

基于观测数据的分析和政策评价，我们开始建立一个空气污染条件下的北京市民公共健康状况图景，建立起了一定的数据常识；同时，我们也能通过数据分析看到，北京市政府的雾霾预警机制确实促进了更多市民对自身健康的关注度，起到了积极效果。

然而，已有的观测有着显而易见的不足——依靠一个人的力量，仅对两个路段在上班途中进行观测，说服力是不足的。且北京城市面积巨大，在不同的区域人群异质性较大，如果想要进行更全面的计算和政策评估，就需要在更大范围开展更全面的观测。这个任务就不是那么容易了。

我们需要采集的数据是在较长时间内（整个采暖季，甚至更长时间），全城各个地区每天早上通勤时段户外活动的人群戴口罩和不戴口罩的人数。所以，我们计划开展一次北京口罩观测的众包活动。

通过这个活动，我们试图更精确地计算北京市民出行戴口罩的人群比例，对比不同地区人群对自身健康关注程度差异，以及评估北京市政府的空气污染预警机制在全市范围内的效果。因此，我们面向全北京市招募志愿者。

我们希望您：

居住在北京市区以内；

使用公共交通、自行车或者步行通勤（这样才能开展观测）；

能够保证必要的数据采集量（不低于15天/月），包括周末和平日；

会使用微信，并能保证及时提交计数结果；

有一双善于观察生活的眼和一颗热爱生活的心。

如果您被录用为志愿者，我们能送给您：