6月14日,在WGDC2018大会上,京东金融集团副总裁、首席数据科学家郑宇就“大数据和AI打造智慧城市”的话题进行了专题演讲,以下为演讲实录。
郑宇:
谢谢大会邀请,有机会跟大家介绍我们最近在城市计算领域的工作。
什么叫城市计算呢?就是用大数据和人工智能打造未来城市。进一步讲,我们是通过对数据不断的搜集、管理、分析和挖掘,再利用挖掘出来的知识解决社会痛点,包括交通、环境、能耗、公共安全等等。它是大数据、人工智能、云计算在城市场景的有机融合。
这个领域现在美国已经有硕士学位,很多国际会议上也已成为一个公共的领域。
现在京东在这个领域里有什么理念,在做什么呢?首先,我们能够提供点线面结合的顶层设计,加上跨多个领域的垂直应用。这个其实很困难,现在市面上有很多做点的智慧城市公司,给你解决一个摄象头的问题、一个充电桩的问题,但是这些点之间是不联系的,是孤立的,给政府管理带来一定的困难。但是要做出一个跨领域的顶层设计,你必须同时在各个行业里面都有很深的积累,这是面临的一个困境。过去十来年我们一直在各个领域里面摸爬滚打,所以积累了很多环境、交通、能耗、公共安全等行业知识,回过头来再做顶层设计,这才能落地。
第二,城市在不断发展,从规划到运维、到预测,而预测又可以指导未来的规划,所以它一定是不断循环和迭代的。下面我以给雄安做的智能城市整体规划方案为例,给大家介绍这个理念。
这里面每一个框框就是点的设计,比如说你规划一个自行车道,这是一个点的智慧城市设计。但是光规划一个自行车道是不够的,规划完了之后就要进行运维。怎么把自行车合理的调度,使得自行车的运力最大化,这是运维的问题。其次我要预测未来各个地方正确的需求,以及未来一年、两年各个地方人们对自行车骑行的需求,这个预测回过头来可以指导我们的规划。这是一条线,这条线变成闭环,点变成线,很多线再变成面,这就叫点线面结合。
我们把城市分成三个阶段,从规划到运维再到预测阶段。每一个阶段里面都有很多板块,比如规划可以包括交通规划、用地规划、环境规划、安全规划等等,整个三个阶段里面都是用一个城市计算平台贯穿始终。
当然平台很重要。这是我们为智能城市打造的城市计算平台,它有三个特点:数据标准化、算法模块化、平台生态化。城市数据看似千百种,但是按照数据格式、数据结构和数据的时空属性,其实只有6种数据。我们用6种数据模型就能够把整个城市里面所有数据装进去,避免了一种数据开发的模型,变得系统不可控、不可复制。我们把看似不相同的应用背后的公共算法抽象出来,变成算法模块放在平台里面,让我们可用模块化的设计快速搭建垂直应用。
我们还会把平台开放出来。当前阶段,有些小型企业有人工智能的需求但缺乏独立搭建平台的能力。此时,他们可以利用我们平台模块化的设计快速搭建自己的垂直应用。
这个平台是针对于时空数据的管理平台和人工智能算法平台,不是普通的视觉、文本和语音算法平台。针对时空数据应该有特殊的理解和特殊的人工智能算法,这也是我们过去很多年的积累。
现在看看在这个平台之上搭建各个板块的应用,涉及到交通、环境、能耗、公共安全,每一个板块举一个实际的案例来展现我们平台的威力。
第一个是跟联通改造线下的营业厅。
联通有大量的线下资源,因为他们有很多营业厅,现在随着很多业务在网上可以完成,用户其实不需要到营业厅办理自己的业务,所以很多营业厅的资源开始变得闲置。联通希望能够对某些营业厅进行改造,在里面提供3C产品的体验和出售,从而把用户拉回到营业厅,只要用户到营业厅就能带来业务的转化。要实现这个目标,我们就要回答两个问题:
第一,把哪些旧的营业厅进行改造,提供3C产品的体验和出售?
第二,到底应该根据哪些地域特点组合这个3C产品,从而使得用户兴趣最大化?因为每个地方的兴趣不一样,有的地方喜欢小米手机,有的喜欢Ipad,要回答这个问题联通自己的数据是不够的,他只有运营商自己一家的数据。这个时候结合京东的数据,我们可以知道各个地方人员对3C产品购买的情况,从而合理的选址、合理的配置资源——这既是数据的融合,也是一个商业模式的融合。
一个是线上的购买,一个线下购买,当用户到营业厅的时候,其实很多时候通过扫码上线查询产品体验,甚至在线上购买,到最后变成线下和线上无界零售。这是我们通过三种数据融合,包括联通、京东和第三方数据,通过人工智能特殊算法选址,并且排序哪些营业厅可能给我们带来利润最大化。我们既考虑用户服务的数量,也要考虑未来各个营业厅的收益,这都是以前不存在的算法,这是学习排序和最大化的覆盖算法,都是新兴的针对时空数据的人工智能算法。
第二个例子是跟摩拜合作,做一个违章停车的检测。
我们发现很多马路边都会有计程车停在自行车道上,占道停车。如果有占道停车发生,我们的骑行线路就不得不改变,弯过来骑到马路中央。这个线路通过GPS统计可以发现捕捉到,如果发现大量的此类线路,我们就可以猜到那个地方有违章停车的现象。用这种方法我们可以自动的感知整个城市街区的违章停车情况,从而把有限的警力投放到该投的地方去做管理,来疏解交通、避免拥堵,避免出现交通事故和人身安全。
这就是用人工智能和大数据的方法提高政府的管理效率,治理城市的案例。
这个跟交通相关,红色的街道通过我们算法自动判断出来,这个地方有违章停车,绿色的地方是没有的。一切东西都是智能的、全自动的,而且不需要装任何的摄象头,不需要对整个城市增加任何传感器,就可以检测违章停车。
我们推荐这样的解决方案:不再给城市增加新的负担,好好利用现在城市已有的基础设施和数据来解决面临的问题。
下面一个是我们为公共安全提供的人流量预测。
我们能够预测每一个区域内部未来多少人进和出,这个跟公共安全有极大的关系。大家应该还记得2015年上海的踩踏事件,那就是因为没有提前预知这个地方多少人进、多少人出,导致管控措施与人流量的级别不对等,从而导致事件发生。如果我们可以提前预测这个地方人的进和出,就可以提前管控、提前疏导。
最早时候我们只能做均匀网格的人流量进和出,但是实际上区域并不是均匀网格的。区域是由主要街道和河流构成的区域,就像这样的区域,这个区域的人流量怎么预测?会使得以前的算法,比如说视觉算法、CNN算法都会失效,因为都是均匀网格的。
针对时空数据特殊的人工智能算法才可以解决这个问题,进一步预测人流量的转变。从A到B多少人,以前我们只知道A总数多少人进去,总数多少人出来,并不知道这个人从哪里来、到哪里去。现在我们可能知道,比如说这个会场有20%的人可能从火车站过来,10%来自于清华,这样在源头进行管控,避免了事故在终点去解决。这里面用了大量的针对时空数据的人工智能算法,而且这个难度非常大,创新性非常高。
下面这个案例是救护车的选址。
我们知道打120求救电话,120会派一辆车把病人送到医院,送到医院之后这个车会返回到救护车的站点,救护车的站点和医院并不在同一个地方,这是两个不同的体系。医院不能把救护车全部放在院里,救护车的站点选址很重要,这是天津市的真实系统。以前救护车的站点靠拍脑袋决定,看看这边多少人,多少路放一个站点。但是这个地方对120的真实需求并不仅仅与人数相关,还与人的体质、生活状况、交通情况相关。
现在基于大量120的真实求救数据,我们知道什么时间、什么地方有多少人抢救,以及每一辆救护车去抢救时的轨迹数据。结合这两类数据,我们对救护车的站点进行重新选址,在不增加任何资源投入的情况下,还是这么多站点,但是从站点到病人的抢救时间缩短了30%。这是人命关天的事情,这是大数据、人工智能算法带来的价值。
这是深圳市管网水的测点。我们希望能够提前预测哪个地方的水质发生了变化,根据预测可以提早改变出厂设置,保证水到达居民饮用站点的时候水质是好的。这个预测是很困难的,我们的管道虽然不复杂,但受很多因素影响。
这里我们用新的人工智能算法对所有测点的水质做协同的预测,而不是单点预测。这里面用了很多的数据,包括气象、水质、地面上的交通流量等情况。大家可能觉得地面上交通流量怎么会影响水质?因为地面上的交通流量和地理信息反映了区域的功能,不同的区域在不同时间会有不同的用水模式,不同用水模式导致了水质的变化。所以很多因素看似不直接相关,其实相关,这是大数据的理念,多元素融合,在我们很多项目都得到大量的体现。
下面这个是我们跟国家能源局最新合作的项目。
我国的电力行业里面,火电占70%的比例。火电最大的问题是要烧煤,煤是不可再生资源,同时会产生污染物排放,痛点是怎么用更少的煤发更多的电,并且产生更少的污染排放。最近我们用人工智能的算法,比阿尔法狗更难、更高级的算法,对整个锅炉的发电工艺进行了优化,使得我们能够人工智能的算法动态的控制锅炉的开度、送风、送水,让锅炉用更少的煤发更多的电,产生更少的污染排放。整个效率提高0.5,意味着什么?发电效率提高0.5,意味着推广到全国2千多台机组,全国一年节约一百个亿。并且这不仅仅是钱的问题,这是环境保护的问题,这是人类产业升级的问题,整个国家能源行业发展的根本问题,这是一个非常重大的突破。
这也是我们出来做这个事情的情怀,我们希望我们的技术,能够让国家、让人民的生活变越来越好。
再下来是我们做的信用城市。
信用城市包括三个部分,包括居民信用、企业信用和政府的信用。居民信用涉及到我们以后的出行、购物等很多环节。我们为什么用大数据和人工智能来做这个信用体系呢?
第一,人的信用跟产品相关。我们去租一个自行车和我们买房贷款所考虑的因素是不一样的,而且在不同的产品里面不同的数据带来的权重也是不一样的。
第二,判断一个企业或者一个人的信用,我们更多希望预判。如果一个企业出了事情可以告诉我,其实有点太晚。如果能提前知道未来一个季度,这个企业可能存在很高的信用风险,我们就可以提前干预,避免出现事故带来的后处置的管理成本。
第三,信用是需要动态更新的。一个企业可能今天早晨信用还比较好,到了下午的时候可能出了问题,我们希望第一时间能够反映。
基于这三个原因,我们以前基于简单规则打分制的信用是不合适的。现在我们在福州做了一个试点,提出城市诚实信用平台,基于人工智能和大数据的方法,结合政府的数据和企业的数据,为每个居民、每个企业打造针对不同场景的精准信用分数。基于这个平台我们还提出来信用地图,这个地图每个柱子代表一个企业,柱子的高度反映了企业的信用风险,帮助政府把控这个地方各个企业的潜在风险。
我们在福州市政府和新华社的支持下,打造了这样一个信用街区。在信用街区里面提供了信用租赁、信用支付、信用商家、信用购物等5个场景,我们做技术支持。我们看信用地图,这里面每个柱子表示福州市的一个企业。我要强调一点,在算企业的信用分数的时候,用人工智能的方法决定不同维度的权重。我们考虑到司法类、经营类、企业经营、企业司法类、企业创新类等5类数据,但是这5类数据的权重到底是多少?现在用人工智能可以动态的决定这个权重,谁更好,谁更不好。
所以强调第一点是基于人工智能的方法来决定区域的群众来打分。
第二,我们能够对各个企业潜在风险进行预判。2017年9月我们发现这个企业存在潜在风险,结果两个月之后,这个企业果然出现了重大的经营风险。如果能够提前预判到就能提前管理、干预,避免出现经营风险带来的损失,这是预测。
第三,我们发现某些区域里面某个行业的企业普遍存在信用问题,原因可能是这个地方的管理政策或某些策略出了问题。我们能发现信用背后的根源,这是一些简单的打分规则得不到的。
可能大家觉得市面上挺多智慧城市的公司,这里我要强调一下我们的优势是什么。第一,我们不是做传统信息化的,不是做底层的基础设施建设,我们做上层人工智能和大数据带来的智能算法,用智能的算法解决智能的问题,解决现实社会的痛点。我们也不是简单通过云来提供服务,我们并不是卖云,可以基于任何一朵云把云赋能,我们提供一个生态。我们是以解决政府和城市的痛点为出发点,我们也不是只做一个点,我们能够做点线面结合的顶层设计,并且能够做从规划到运维到预测的动态的可持续发展模式。
综合起来,其实我们有以下四个方面的优势。
第一,我们的技术优势。我们的城市计算平台,里面涵盖了大量的基于时空数据的人工智能算法,这个在国际上面属于首创的,有绝对的自主知识产权。我们提出针对时空数据的管理算法,把现在云计算分布式计算环幕跟时空结合,能够提供查询效率一百倍甚至一千倍的结果,而且我们提供了多源数据融合的方法。你只有解决这些问题,才能真正处理好那些场景。
第二,经验非常重要,除了技术本身,我们还需要对行业有深度的理解。这个环境涵盖了交通、能耗、交通、公共安全,我们做了十几年大量的垂直应用,现在回过头来才敢说可以做落地的顶层设计。同时这个领域里面非常缺乏人才,而这种人才很难很难培养,需要用产学园一体化的机制培养,而我们这个团队在学界和工业界两边都有涉足。我个人在四所大学里面担任博导。所以这也是我们人才培养的优势。
第三,我们有强大的数据资源。京东有大量的用户数据,可以理解到城市很多方面的应用,而且还有很多合作伙伴,以及我们有些特殊的联合建模的方法,在数据不出各个平台的情况下面可以联合建模,保护用户隐私的情况下面把数据的价值最大化,能够打破技术壁垒,这也我们的技术。
第四,我们的品牌。我们有五百强的品牌,有网络渠道,有跟近700多家金融行业合作的基础。智慧城市最后落地一定不能靠政府补贴,要有自己的经营模式,要有经营场景,要给社会带来回馈和利润,这是我们的优势。
最后总结一句话“智能城市需要用大数据和人工智能一起打造,需要产学研一体化的培养人才,需要各界政府、企业和学界一起努力,让我们一起共同来见证奇迹。”
{{item.content}}