分享
Scan me 分享到微信

佳格大数据产品副总裁顾竹:遥感大数据的商业运用

佳格大数据产品副总裁顾竹就“遥感大数据的商业运用”发表演讲。

以下是佳格大数据产品副总裁顾竹,演讲主题为“遥感大数据的商业运用”。(该演讲实录中出现大量英文,正在于演讲人确认中,请谅解)

泰伯网

顾竹:谢谢大家,我很荣幸有这个机会为大家介绍一下我们佳格公司,包括我们回国以后做了城市、农业方面的工作。我们团队包括我在内是从美国航空航天局回来的,我们当时在那里做一些关于卫星影像观测的一些工作。

刚才听了几位专家包括张总等说了我们国内的智慧城市,包括GIS方面发展的技术,我们的一些技术已经不输给硅谷了,包括数据的梳理、存储等方面都是在前列的。之前我们的一些数据处理方式包括使用FTP的存储,现在对于大数据处理方面,大家都很熟悉的有(Hadoop)、(spark)。现在处于一个计算机技术爆发的阶段,有很多的开源和共享的东西,大家可以在这个上面做很多之前没有办法做的事。

这个是2016年1月份我们统计过的整个世界范围内大家都开始接触大数据的一些公司,包括(esri),之前老的公司(oracle)都开始对大数据进行一些涉足。我们为什么会有GIS,为什么会有矢量数据?其实在上世纪八十年代,我觉得包括像美国航天航空局等等这样的公司,我们已经在接触大数据,或者说我们已经接触海量的数据了,为什么这样说呢?上世纪八十年代大家的存储方式是什么?是1.4寸的软盘,当时的一张地图是几百兆甚至是上G的,那个时候我们遥感影像就是1个G的。我们怎么样做电子地图呢?GIS怎么样生存呢?我们想出了一个办法,就是实时矢量化,我们把一个几百万像素才能描述的河流抽象成一个点,我们把一个房屋抽象成一个四边形。我们当时都在计算机这些人之前的,我们当时就知道如何应用最简单的方式把最复杂的地表数据抽象成我们可以存储处理的数据,也就是我们大家一直使用的矢量数据。

我们现在有更多的方式比如说(spark),他们有更多的开源的分布式的处理方法或者是方案。现在列出了几个最火的互联网公司,像谷歌、苹果,他们在招人的时候,我是把他们招的一些普通程序员的要求列出来,大家可以看到,谷歌会要求你(postgis),苹果会要求你(GDAL)。在硅谷这几个最先进的或者说大的互联网厂商,他们实际产品的开发中已经少不了GIS了,GIS是他们非常重要的组成部分。

数据用来做什么?比如说一个很经典的例子,星巴克为什么总是比其他地方会冷一点,为什么?因为你觉得冷你就会买一杯咖啡,喝了会暖起来。这个道理很容易理解,星巴克使用这种商业模式或者是方式刺激大家去消费,那么是得多冷?你们不能太冷,那样的话大家就不愿意走进来。那么这个温度是怎么样调的?而且在中国和美国的星巴克的温度是不是一样的?不知道,那么我们怎么做?大数据。

数据就是人类对于事件或者说对于事件存储,最简单的是结绳记事,你做一个事就打一个结,但是您回过头来想这个是什么事的时候,你又想不起来。人的思维方式就是这么简单,二进制的计算机方式和数字没有多大的区别,其实我们也是这样的思维方式了。

这么多的数据表达方式里面,你看了以后会最直接最快的表达?我认为是图画,你在看到的时候可以把信息获取到,图画是最直接、最切合人表达的一种处理方式。

大家都说大数据时代,更多时候我们是走进一个图的时代。上世纪八十年代我们发明出GIS的时候,是因为我们的技术限制,是因为我们存储能力的限制,我们没有办法去存储一个卫星影像,我们是用了矢量的方式去替代。现在云存储、固定存储,我们有各种各样的方式进行存储,而且是越来越快。这个时候我们想,我们为什么不回归到最直接的切合人表达的方式。这是我一直考虑的问题,举个简单的例子,像dos的系统,虽然我之前用,现在却无法用。每一个操作你要去敲那一行的命令行,那个时候以后,比尔盖茨就变成了世界首富,为什么?它把这些打开、复制都用图像化来表示。

还有一个例子就是大家经常说的表情包,为什么大家愿意用表情呢?因为表情更能比文字表达你的感情和思维。你用文字很难叙述一个尴尬的表情或者是一个被雷到的表情。这就是为什么现在表情这么多,为什么现在BBS上,你要说什么事,你要表达什么不如直接放一张图。

之前为什么大家不用图像?因为我们对图像的认知能力太差了。比如说你给计算机看一万张苹果的图片,看完以后你再给计算机看你咬过一口,计算机会说这个不是苹果,因为你的形状上发生了变化。但是给人来看的话,他绝对不会说咬了一口就不是苹果了。为什么之前计算机的认知能力那么的差?因为它没有形成一个抽象的概念。不管这个苹果怎么样变,红的、绿的,咬了一口,人在看的时候不会出错的,它一定是苹果,我们有苹果的抽象的概念,苹果怎么样变,我们的判断是不会受影响的。计算机不一样的,我在形状、颜色、味道任何一个东西不一样,都会有判断。

如何解决这个问题,我们就用深度的曲线。比如说你车在前面开,前面飘来一个塑料袋,你肯定不停的。但是如果是一个兔子的话,你肯定会停止。但是塑料袋和兔子的图像是差不多的,是无法捕捉清楚的,所以我们首先做的是认知世界,深度学习也是这样的,我们先通过图像把世界认知出来,分析出来。计算机不知道怎么样玩,这个像极了人的学习方式,因为你不需要去教一个孩子去夺子弹,你只要告诉他,你停在这里,子弹过来把你打爆了,你就失败了,这个像极了人。这个是人工智能正在往前走或者是我们正在做的事。他们的出发点都是一样的,我们都去处理图像,因为图像数据是我们未来更多要接触的东西。

ALPHAGO的意义,人看到围棋图片的时候,你不用去管他怎么学这个东西,我们让它去看这张图片,它自然寻找中间的感觉,它自然知道下一步怎么样做。说了这么多,回到我们公司正在做的事,我们做的是环境大数据,有很多的包括气象、土地、污染、降温等等的数据。

整个环境大数据里面,什么样的数据是最全面最典型的?我们说是卫星影像数据、遥感数据。技术上是覆盖全球的,你在卫星影像 上可以看到这个地球上的任何东西,这个世界上任何东西都是可以通过卫星影像获取的。

我们在看卫星影像或者是遥感数据的时候我们会获得什么?Skybox这个公司,它最后被谷歌收购了,他跟谷歌说,我可以做到计算全球的原油储量。全球的原油储量70%到90%都在这个海港储存里面,它通过这张图就说服谷歌收购它。技术很简单,但是我们可以通过它去做成。

我们通过自己的深度学习对地表做一些深入的分析,这里是对农田的分析,大家接触过或者听说过,国家进行农田的土地调查。中国的土地是非常破碎的,不像美国是一块平整的。通过我们的计算方式很短时间内把所有的地块自动划分出来,通过地块自动识别每一块天地上的纹理、方向,包括它种植的作物种类,一个小时内可以处理,基本上是3000×3000的数据。

我们现在做分类,遥感影像做分类大家都熟知的,之前大家做矢量化都是用人工去做的,用机器学习的方式去做自动化,有一点困难。我们现在用的方式,我们的精确度可以达到95%到97%。这个技术正在发展,我们会有更多的技术或者是解决方案出来,帮助我们把之前的一些矢量化工作解放出来。

不知道大家是否看得出来这个是什么。这个是山东某个市的市郊,这个是蔬菜大棚的生产基地。大家可以看一下寿光是在这里,整个大棚的面积是寿光市的十倍,我们人就是有这样的能力把整个地表都能够改变,全世界都知道中国人这么厉害。我当时看这个地图以为是一个云,谁知道是大棚。因为这个涉及到产量预估方面的东西,怎么样做呢?传统的方式去数,但是无法数,用传统的机器解决方式也做不了,因为它的材质不一样,它的太阳光辐射是不一样的。我们通过深度学习的方法,我们可以做到98%的精确度,我们可以在四个小时之内前部数完,数字就不说了,这个是客户的数字。这个数据非常靠谱,而且速度非常的快。

我们会通过卫星、无人机做可视化的数据分析,大家在为每一个城市、每一个乡镇、每一个人画属性,我们通过每一个城市的特点因地制宜地差异化进行发展,进行提升。所有这些数据的搜集都与环境的数据分不开。我们如何综合这些环境的数据做更多的事,这个是佳格正在做的,也是希望在座的各位能够让我们学习到更多的东西,谢谢大家对佳格的理解。谢谢!

喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐