分享
Scan me 分享到微信

华东师大率先成立云计算与大数据研究中心

华东师大云计算与大数据研究中心是一个以建设国际性的大数据协同创新平台和研发中心为目的,基于典型的中国式应用、以开展国际前沿的研究和开发为使命的新型研究机构。

  4月15、16日,华东师范大学云计算与大数据研究中心成立仪式暨学术研讨会召开。两天里,来自美国、德国、日本、新加坡、香港等全球计算机学界和业界的60多位精英汇集上海华东师大,共同见证华东师范大学云计算与大数据研究中心成立,并一起探讨云计算与大数据环境下计算机学科和技术发展。

  华东师大云计算与大数据研究中心是一个以建设国际性的大数据协同创新平台和研发中心为目的,基于典型的中国式应用、以开展国际前沿的研究和开发为使命的新型研究机构。该中心依托华东师大及“上海高校知识服务平台”,吸引了业内的国际“大咖”加盟该中心指导委员会。其中,学术委员会主任由澳大利亚新南威尔士大学教授、数据库研究实验室主任林学民担任,中心主任由单名谦、周傲英共同担纲。不难看出,该机构研究人员不仅国籍横跨欧亚美、名誉头衔也是领专业领域风骚,其研究背景的国际性可见一斑。据中心负责人介绍,访问学者的研究机制将成为中心的主要发展方式,今后将有更多的IT界国际精英聚集在此,成为中国的学术“硅谷”。

  IT界始终是一个实践性极强的领域,尤其是“云计算”和“大数据”这种与现实的产业发展、用户模式改革紧密联系的概念,不仅需要学理上的假设与探讨,更需要即时将研究成果反馈于业界和用户。华东师大副校长朱自强表示,云计算与大数据研究中心虽由华东师大牵头创立,但与清华大学、武汉大学、中国人民大学、中山大学、西北工业大学、东北大学、云南大学都确立了合作伙伴大学关系,将共享学术资源和专业人员进行合作研究,同时联合微软、SAP、华为、上海宝信、聚胜万合、高德软件等IT名企,合作进行市场需求调研、联合项目研究和科研成果转化。这在全国乃至全球范围的协同计算中迈出了实质性的一步。

  在IT科研与产业相结合方面,华东师大可以说走在了全国各高校、研究机构的前面,在“大数据时代”率先成立云计算与大数据研究中心,并秉承研以致用的理念,以产业链为纽带,注重产学研的结合,实现伙伴大学和伙伴企业的资源共享,通过需求调研、项目合作和成果转化,让似乎遥不可及的云端技术和隐匿在传输介质中不见其真身的数据,能够还原各自精彩,回馈于社会。

  在会后的采访中,云计算与大数据研究中心主任周傲英如数家珍地介绍了中心的研究方向——Web数据管理与挖掘、并行数据分析工具栈、内存数据管理与分析、实时数据处理与分析、可视化分析、数据服务与安全。交流中,这位我国第一位数据库学科的长江特聘教授向记者侃侃而谈:“中心具体‘业务’并非营利性的,而是让更多的研究伙伴参与其中,各显其能,让各种需求从中获益。大数据概念本身就是一把‘伞’(Umbrella),现在就是把以前的很多概念放在一个概念之下。”的确,大数据研究需要多方协同创新,就像多个伞骨一起作用才能撑起一把大伞,华东师大撑起了这把大伞,让伞沿所能伸及到的地方都成为了IT界学者们研讨理论、共享知识的平台。

  IT科技改变全世界——“云计算”和“大数据”,那些不得不说的秘密

  数字地理、智慧城市、MOOC(大型开放式网络课程)、自媒体……这些听起来既新潮又复杂的概念,引起了不少专家学者的关注甚至普通用户的侧目。实际上,这些概念的实现都离不开大数据和云计算的支持。

  提到“云计算”和“大数据”,大家一定不会陌生。近年来,这两个新兴概念已作为技术与商业热点越来越频繁地见诸媒体,并逐渐为普通民众所了解。云计算与大数据都是信息技术和网络技术发展成熟的产物。前者通过“云”的方式提供服务,将信息处理和系统管理从用户的负担转变为一种基础设施服务,从而解放了用户,使他们可以更专注于各自的应用和业务。大数据则以各种信息收集手段和数据库作为触角,及时捕捉可用的数据,通过过滤、整理、集成、分析和挖掘,为用户提供应用相关的知识。越来越多的传统信息系统,通过面向云计算和大数据的改造和重建,从原先封闭、割裂的状态走向开放与集成。同时,随着移动终端与移动通讯、社交网络、物联网等技术和应用的发展,云计算和大数据催生了一大批新兴应用,涉及了互联网和移动广告、社会公共管理、金融、电信、科学研究等社会、经济和生活的各个方面。在可预见的将来,云计算和大数据会越来越多地在我们的日常生活以及企业、政府和各类机构的关键应用中起到支撑作用。

  华东师大何积丰院士认为,“原本概念炒得过热的云计算、大数据,应该摆脱以往象牙塔式的樊笼,广泛开展国际协同,走‘顶天’、‘立地’之路,让云计算不再飘忽不定,也让‘数据’更好地为企业服务,为国民经济发展‘保驾护航’。”交通运输、灾害处置、环境监测、数字地理、疆域勘定等,无一都可将“新方法”应用其中。作为新兴概念和IT技术的“云计算”、“大数据”,并非空洞的科学名词,它们所撑起的是整个网络时代的人民生活,大至医疗、传媒、地图绘测等体系的重新构建,小至老百姓的衣食住行——这些在不远的将来都将受其益而影响深远。

  在学术研讨会上,专家学者从自身研究方向出发,结合中国IT技术和产业发展的实际情况,做出了精彩的报告。有学者侧重从计算机学科领域内的基础研究方法和模型建构方面,审视“云计算”和“大数据”等新问题,令人印象深刻。如加州大学伯克利分校教授、AMPLab主任Michael J. Franklin做了《伯克利实验室模式:计算机科学研究的协作方法》的报告,阿里巴巴高级研究员阳振坤在《OceanBase:一个分布式无共享关系数据库》报告中向与会者公开了他们开源、分布式、无共享的结构化数据存储系统,卡内基-梅隆大学Lane计算生物学研究中心研究员尹俊鸣介绍了《大规模网络中的混合模型建模》,宏路网络科技(上海)有限公司首席技术官蔡文渊介绍了《Hypers大数据解决方案》。另外还有不少学者将抽象的学术理论与人们熟知的具体生活实例相结合,全方位地展现了大数据时代人们日常生活的各种可能性。

  ——大数据与食品安全

  中国卫星导航系统管理办公室副主任蔡兰波感叹,“现在国内的食品安全违法成本太低,但食品安全信息成本又过高,如果应用云计算和大数据,各方数据协同起来或许能够改变眼下的窘况。”

  ——大数据与地图测绘

  新媒体、网络课程学习这些本就诞生于网络时代的事物,毫无疑问会受到“云计算”、“大数据”的影响,但谁能想到地图绘测这种始自人类启蒙时代的行为也会被纳入到深刻变革的行列?高德软件首席技术官崔海就在报告《地图和LBS位置服务与大数据畅谈》中为我们释惑。他从1570年问世的第一张有意义的世界地图说起,直至400多年后的今天,虽然地图的基本形态未变,但由GIS、CS技术赋予其新内涵的数字地图正在悄悄地改变着世界。随着现代技术的发展以及智能手机和车载导航在人们生活中的普及,LBS位置服务正在经历二次技术革命。从传统地图数据测绘技术, 到Google Street Car技术,再到众包采集, 以及从亿万智能手机用户获得的UGC,大数据的获取、处理和计算技术已经成为地图和LBS位置服务的核心技术。崔海认为,大数据领域的新技术能在LBS服务中产生变革性进步的方向。高德软件已经对中国公路320万公里的地形地貌数据采集,以每台采集车每天行驶150-200公里计,近200台车在途,每车配备6-8个360度旋转的拍摄头,外加一个红外摄影,这么海量的数据经过传输、处理和分析,所产生的用户体验甚至优于谷歌地球(Google Earth)。可以说,在大数据时代,大数据技术所代表的不仅是信息的有效集合,更是一种理念,那就是“用户需求第一”。谷歌地球已经实现了令用户足不出户即可“畅游”全世界,高德软件所做的,就是采集更丰富、全方位的数据,令用户体验到更真实、更实用的中国地图,也让更多的驴友放飞心情去周游,使更多的车辆安全放心奔驰。

  ——大数据与商务智能

  企业在“大数据”的冲击下既能获益,也面临着不少挑战。SAP全球研究总部副总裁单名谦在《云计算与大数据的挑战》报告中预言,到2014年,全球70%的1000强企业会将明细数据导入内存,以提升商务智能应用的性能。但问题是我们把硬件升级、换了高端服务器就能实现“高性能计算”吗?答案显然是否定的。数据存在磁盘里,内存和CPU对数据吞吐的瓶颈难以消除,只有新型架构的数据库才能支撑。SAP的HANA架构,结合了云计算和内存计算技术,成为了解决问题的一种方式。他举了个例子,8500万条数据库记录在2毫秒内瞬间统计完成,1秒完成全部的累加计算,并由饮料业、大学、服务业等企事业提高效率千倍、万倍以至更多的案例来佐证新技术相比传统数据库在秒级处理、实时决策,大规模数据运算和并行处理方面有着快速而便捷的优势,并且低成本运行。“未来的计算系统将由云计算、大数据计算、内存计算和智能计算组成”,单名谦兴奋地介绍:“我们不是把云计算和大数据两个热门问题凑起来,其核心是‘商业价值’,要为经济建设服务,优化了的数据才彰显其价值,否则仅仅是一堆‘数据’而已,并且要有一批懂得该行业运算规则的内行,而不是纯粹的IT人”。

  ——大数据与终生学习

  互联网数据共享、平台式的服务同样深刻影响了教育界。《大数据中的终生学习》是华为诺亚方舟实验室资深研究员张弓的议题,他从终生学习中人的影响、人类行为理解中的迁移学习两方面展开论述。张弓表示,终生学习源于教育界,由于移动互联网的发展再度急剧地加速了大数据的挑战,那么数据挖掘系统就需要有一个连续的模式来应对持续发展的和日益增长的数据流量。“区别于传统的一次学习能力,我们称之为终生机器学习”,张弓表示,“我们希望它能够对付不同的学习任务并具备持续的学习能力。终生学习的重要基础之一就是迁移学习,我们希望在一个领域学习的知识能够使在另一个领域中的学习受益。为了有效的学习,维持一个持续的数据标注能力将是一个重要的挑战”。

  ——大数据与社交媒体

  新媒体早就纳入到了大数据时代的变革之中。华东师大钱卫宁教授《社交媒体数据管理与分析:基于新浪微博的研究》,基于新浪微博近200万用户3年的数据和近4000万用户的关注网络,对玉树地震、日本海啸、11.15静安大火等热点事件演化规律与影响因素进行分析,在僵尸用户和营销帐号检测等社交媒体数据分析问题上做了大量研究,并设计了一个基于真实数据的社交媒体数据分析基准测试工具。研究者还惊奇地发现,情绪和感知有时竟然还会影响到股票指数的升降。钱卫宁认为,高效的社交媒体数据管理与分析对网上集群行为感知与分析、个性化推荐、公共舆情和情感感知与分析具有十分重要的作用。

  ——大数据与医疗卫生

  医疗、电力供应等国家级的公共事业也能利用新兴IT技术完善自身体系,为群众提供更优质、更快捷的服务。IBM中国研究院资深研究员曹锋讲述的《医疗大数据》,表达了在翻天覆地的医疗系统转型中,医院间的协同计算应该从一种以治疗为中心的被动模式向以预防为中心的模式转化,并建立以患者为中心的医疗服务体系,提高药品和医疗的安全性。他引用自己在加拿大安大略理工学院的研究成果,通过对有先天性心脏缺陷新生儿全天候监护的海量数据分析、挖掘,让预警提前了24小时,也明显降低了心脏早衰新生儿的死亡率;通过对纽约附近工人居住区少吃蔬菜和患肥胖症、糖尿病人群的地图数据分析,从中挖掘出并非他们不愿吃蔬菜,而是蔬菜超市缺乏且布局不合理,从而影响到政府出面干预,提高了市民的生活质量和健康水平的结论。曹锋表示,医疗服务正在医疗数据往往是以结构化非结构化等多种形式散落在各种信息源(诸如电子病历,电话记录,传感数据,社会媒体)以PB的量级快速增长。这些数据往往又高度敏感,受限于隐私法案而难以大量获取。我们不乏国内外成功的案例,但在国内的2级城市中,简单联网的医院大有所在,连CS模式也用不上,医疗大数据之路还是一条漫漫长征途。华东师大周敏奇副教授《内存数据管理与分析》,则以智能电网为例,从用户需求出发,让适合现有集群体系架构的内存数据处理系统框架实现内存数据的容错性、可用性、可恢复性为其研究重点;集群环境下的大规模并行处理资源(多节点、多处理器、多核、超线程等)将加速通讯墙问题的产生,多粒度并发处理的控制与调度有望解决通讯墙问题,最终实现实时交互式分析处理的目标。

喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐