李栋:大数据不是万能的,但它可以推动城市管理决策的优化


疫情大考下,大数据在人员流动管理、疫情发展趋势研判等方面发挥了重要作用。但同时,数据预警和管理决策的“后知后觉”、用户隐私权被侵犯、弱势群体的数据使用门槛过高等问题,也反映出当前大数据运用在城市治理中的困境。
 
此番,搜狐城市特邀清华大学中国新型城镇化研究院高级研究专员,清华同衡规划设计研究院技术创新中心副主任李栋博士,深入探讨大数据在城市治理中的应用之道。

以下为访谈实录:
 
搜狐城市:城市治理已经进入大数据时代,而城市数据的种类繁多,关于人口的、交通的、空气的、土地污染的、供水供电的等等,如果让您排序,哪三项城市数据您认为是最重要的?
 
李栋:我从根源上从城市的本质来思考,城市和非城市最大的区别就是人口的聚集,人口高密度地在城市里生产、生活、消费、就业,享受各种各样的服务,城市才称之为城市,所以人口数据肯定是我们最最关注的一个信息。除此之外就是跟人口聚集相关的住房数据、交通数据、就业数据、公共服务等等,能反映人们在城市里生活好、生产好的必要信息也是我们比较关注的。
 
搜狐城市:说到人口,想到了春节这个人口流动密集时节,因为防疫形势严峻,很多城市呼吁市民留下来过年,城市大数据有哪些用武之地,可以让留在城里过年的打工人,春节过得祥和愉快又有年味儿呢?
 
李栋:虽然我们是做城市数据研究,但是我想说城市数据并不是万能的。城市数据主要还是为了城市运行管理和决策宏观调控做优化,对于个体来说可能作用会稍微小一点。当然就您刚才提到的春运人口流动这些现象,数据可能还是能够发挥一定的作用。举个例子,过去几年通过对移动运营商海量人口迁徙模式的观察研究,我们已经相对清晰地知道中国春运期间人口流动的数量、方向、出发到达时间周期等。根据测算,2021年的春运人口流量大概会下降四成,即六成人可能就留在本地了,这个信息对于人口集中流入和流出地的政府,怎么样做好春节的物资供应、交通保障,比较有参考作用。另外对于留在当地的居民个体来说,目前很多手机应用程序能够查看一些景点、商场、娱乐场所的人口实时分布情况,选择错峰出行或错峰消费,能使出行时的交通比较顺畅,游玩的舒适度也比较高,这是数据能给每个人带来的便利。
 
搜狐城市:大量的互联网应用掌握着很多数据,但现在大家都在意个人隐私权,怎样可以防范个人数据被滥用,怎样防范数据收集越界呢?
 
李栋:数据隐私这个问题还是比较突出的,但这不只是中国而应该是全世界共同面临的一个问题。我觉得最基本的还是要通过法律来进行规制,但法律也分可操作性强不强。应该说欧洲、美国、中国都已经有了原则性的法律要求,空缺的天窗已经补上,但是很多细则的操作性可能还没有这么强。另外有了法律之后,还得有大量遵照执行的主体,主要是科技型大公司和互联网企业,他们本身需要不断去提高法律意识,在服务中减少对不必要的个人信息的采集和滥用。
 
搜狐城市:在利益面前,自觉跟自律是否会打折扣呢?对他们还有哪些约束?
 
李栋:从技术手段来说也会有一些对抗,商业公司也不是铁板一块,比如说现在手机系统里面都会有一个选项,你的用户id可以用一个伪造id替代,所有采集你个人信息的应用就会获得你的伪造id而得不到用户的真实身份信息。因为硬件厂商希望更多的人去使用它的产品,会有一些技术手段去挑战其他的技术公司的采集数据需求,从而互相制衡。
 
搜狐城市:据2020年全国主要城市通勤报告,北京的职住分离是全国最严重的,像我每天通勤双程需要两个半小时,很痛苦。城市大数据能不能解决这个问题?
 
李栋:光靠数据肯定是不行的,但是大数据能推动决策优化,在交通改善方面大数据的价值还是很突出的。第一,职住不平衡是系统性的问题,首先还是需要规划优化,规划在设计当中就应该考虑到实施过程的各种可能变化;其次收集大数据评估职住不平衡的严重程度,这些信息对于改进不平衡来说都至关重要;第三就是在解决方式,学术上有个概念叫Maas,就是出行即服务。出行人通过扫码,这个码是全程所有交通工具共享的,比如出门扫了一辆单车,这个单车骑到某个地方,公交车正好就来了,公交车下来之后,正好地铁就来了,出站就有公交车或者出租车等着,用数据把交通节点打通了,出行更顺畅。对于用户来说只有出发或到达这两个概念,中间其它完全不用操心。未来通过数据把所有的出行服务连接在一起,有可能你在路上虽然花的时间多,但是因为你不用操心,可以看书,可以办公,这个通勤时间就跟在办公室里的体验一样好。
 
搜狐城市:有了大数据应用,人类的生活品质真的是能提高不少。但社会上也会有一些人群应用大数据的能力不强,比如新闻里说的一些老人不会用健康码被拒之门外,如何减轻他们面对数字鸿沟的无力感?
 
李栋:这确实是一个社会问题,但我觉得它不是一个技术问题,它涉及到每一个人生活方式的转变,最好的方式当然是通过合理的产品设计,引导用户自然而然地转向。
 
搜狐城市:是不是大家都要适用这种模式呢?毕竟还有一些小众人群可能更接受原来的模式,或者说他没有能力改变。
 
李栋:我觉得不同模式共存完全是可以的,就是所谓线上线下并行的双轨制嘛。但是随着社会的更替、人群的更替,最终肯定会走向统一的数字化方式,所以促进这个方式并没有坏处。我微信里有好几个志愿者,他们专门到社区去给老人上课,教大家使用微信,把生活当中最基础的几个APP使用技能教给大爷大妈。另外一方面,在建筑设计里有个概念叫适老化设计,适应老人需求的一种设计,我觉得这个概念同样也可以用在信息化或者软件APP的设计里。软件的适老化设计,比如说字体大一些,按钮少一些,包括咱们健康宝迭代了很多个版本,现在也有替老人和小孩查询的这个按钮。我想这是一个好的产品经理应该逐步意识并落实做到的。

直播现场图/搜狐城市拍摄
 
搜狐城市:我知道您正在主导清华城市健康指数的研究工作,对全国主要城市的健康综合水平进行了评估考核,这项调查研究已经结束了吧?
 
李栋:我们做完了第一期结果,将来还要持续地去监测,每年做一个定期的评价,观察各个城市健康水平的变化。这项调查我们希望能获取到城市里各种和健康相关的动态信息,所以补充了挺多政府以外的数据,比如说利用卫星影像去看城市里面的绿化和环境是否舒适,又比如利用穿戴式设备去了解城市市民的睡眠好不好、锻炼多不多等。
 
搜狐城市:我们用户都挺关心哪个城市的健康指数是最高的。
 
李栋:这项评价内容主要考虑了五个方面,健康服务,健康行为,健康设施,健康环境,健康绩效,用这五个维度去刻画这个城市的健康水平,排名最前的是深圳。
 
搜狐城市:深圳的健康设施,比如三甲医院数,人次床位数应该比很多省会城市低。
 
李栋:我们研究确实也发现,没有哪个城市是完美的,深圳也有很多问题。东部地区普遍城市健康指数分会高一些,但是东部地区也有短板,就像您刚才提到的医护人员,因为深圳人口规模比较高,所以人均医护人员数量,人均床位数,人均的设施水平都是偏低的,甚至不如中西部城市。所以这个指数做完之后,我们有一个很深的感触就是,每个城市都有自己需要改进的空间,只是改进的重点和要点存在不同。
 
搜狐城市:您刚才提到穿戴式设施的数据也纳入指数范畴,但它的覆盖面并不是很广,用户样本还是有限的,你们怎么保证采集的数据是科学有代表性的呢?
 
李栋:您说得对,但是目前没有更好的办法,在现有条件下我们需要一套这样的指标去引导大家不断思考城市健康这样的问题。具体说到穿戴式设备,主要是通过这个指标来提示每个人要对自己的健康负责,要运动起来,要注重睡眠、注重锻炼等等,必须要有这样的信息公布出来,让大家意识到城市的整体健康跟每个人都是密切相关的。这个指标应该说它不是一个特别严格的、学术研究所追求的一个完美的模型或完美的公式,其中取舍的平衡点在于迈出第一步,首先它确实是讲科学的,其次一定要把一些关键的信息和内容纳入进来,最后是依然有很大的改进空间,比如说穿戴设备的用户数量越来越多,它的代表性就会越来越强。
 
搜狐城市:在做这次直播访谈之前,我在朋友圈中针对“你最想了解的城市数据”征集意见,有人说“我想了解哪个城市美女最多”,有人想知道哪个城市的离婚率最高。要解答这些问题,如果要做数据分析的话,会采集哪些数据,进行怎么样的分析,才能保证这个结果是比较客观的。
 
李栋:我觉得这个问题特别好,它反映了数据分析的典型特点,都是问题驱动的。像您刚才提到的这些问题我并没有标准答案,但我们一般会有一些分析策略。比如首先看直接数据,民政局有离婚率数据,不管现实当中是真离婚还是假离婚,他只要经过法律步骤,那就有登记有记录,所以一定能算出一个非常准确的数据。但假如政府部门不直接发布相关数据,我们还可以通过间接途径去获得一些信息,比如法院所公开的判决文书,离婚的一种形式是民事判决,这些可以通过检索获得相应数据来进行合理推算。
 
刚才还提到哪个城市美女多,有一种叫先验信息,就是不需通过大数据,生活经验就已经告诉你答案了,比如上海、哈尔滨,或者如古语所说的陕西米脂,这些信息能帮助你去更加聚焦检索的方向。其次使用百度等搜索引擎,这些搜索引擎汇集了所有人提问的信息,可以利用相应的搜索量进行推测。
 
搜狐城市:我想到的是另外一个数据维度,比如说在一些直播平台,看看美女直播注册地哪里数量最多。
 
李栋:这当然也是一个信息,但它的代表性可能没那么强。因为现在直播已经变成一种产业,变成一种行业,不是个人属性,所以它可能反映了那个行业,比如说化妆等和女性更相关的业态在那个城市的聚集程度,而不一定是个人真实的情况。
 
搜狐城市:谢谢李栋博士今天给我们介绍了那么多关于城市大数据的奥秘,大家想了解某些关于城市指征的数据,可以通过李栋博士介绍的这些方法去思考和获取结果。
-end-
 往期精彩回顾 



到顶部