2017年5月,新一期的《科学中国人》杂志以《DOA:为大数据“保驾护航”》为题,刊发对我校大数据研究院特聘院长苗放教授的人物专访。
《科学中国人》是中国科协主管的高层次科普杂志,在我国高级知识分子(特别是两院院士)群体中有着良好的声誉和重要的影响,是了解科教界热点、最新科研动态和前沿科学的读物。报道原文如下:
计算机网络、移动互联网、智能手机、智能终端等在近年来的快速发展给我们创造了一个唾手可及的虚拟世界,一抬头我们看见的是现实世界,一低头则进入了一个虚拟世界。各行各业似乎也都离不开这个虚拟世界,科学家需要,工程人员需要……老百姓也同样需要。
“而这个虚拟世界的构成是数据,但目前我们对这些数据的管理和认识是有很大差距的,我们需要一个符合数据特点和特征的基础架构来支撑相关研究,这也是我做DOA研究的一个重要出发点。”多年从事空间信息技术及应用的苗放教授对当今炙手可热的“大数据”研究有着自己独树一帜的眼光,“现在很多人都在强调大数据的‘大’,而在我看来,数据的流动应该被看作是一个过程,数据的产生、收集、存储到作用的发挥等等是一个全过程,这个过程需要现代技术的支撑,更需要有一个合理、有效的结构体系来作基础。”
结缘“大数据”
对于在大数据研究上表现出独树一帜的预见性眼光的苗放,我们一定想不到,其实他并非“科班出身”。1982年,苗放毕业于成都地质学院(现成都理工大学)放射性地球物理勘探专业,1985年获得硕士学位,1990年又获得博士学位。但在这个过程中,为了获取、处理、分析放射性测量数据,苗放不断地要用到计算机,用他的话说,“一直都在和计算机打交道”。
凭着优异成绩和突出表现,1985年苗放留校任教了。1991年,短短时间内他被破格晋升为副教授,1995年又被破格晋升为教授,2002年被评为博士生导师。一路从副系主任、计算中心总工程师、网络信息中心副主任、现代教学中心副主任、信息工程学院副院长、院长到现在的空间信息技术研究所所长等职。1994~1995年间,互联网已在世界范围内兴起。而就是从这个时候起,苗放接触到了互联网,这期间他作为访问学者正在英国剑桥大学进修。回国后,他便开始致力于全国“校园网”的建设。眼界总是被那些始终求新的人打开。之后两年,苗放在法国图卢兹继续学习进修空间信息技术,苗放说:“那个时候已经接触到了现在的大数据,但那时被称作多源、海量、异构的数据。”从这时起,他便一直在和大数据打交道。
2007年,关于“‘数字中国’发展战略”的北京香山科学会议召开。而就是在这个专家和精英云集的会议上,苗放有幸作了“数字地球平台与数字中国技术体系架构”的专题报告,并提出了G/S模式,即今天的端/云模式,得到了专家们的认可,而且在当时引起了很好的反响。苗放说,那个时候他对数据的认识也在逐渐提高。
2012年,苗放参加了在成都举办的国际研讨会,并作了大会主题报告,就是这次报告,苗放提出了标新立异的一个概念“DOA”??面向数据的体系结构。苗放说,“当时还是站在空间信息的角度,面向数据,以数据为核心来构建信息系统和解决信息化方方面面的问题。”“那个时候就提出,还不是很完整,但感觉是对的。通过这几年的发展,越来越发现DOA对大数据的发展越来越有意义。”苗放如是说。
现今,苗放教授致力研究大数据的基础问题,并和企业共建联合实验室,解决企业和大数据产业发展面临的各种问题。对于当今异常火热的大数据,苗放一直有着自己清晰的目标:“解决数据权属、数据共享、数据管控、数据安全等基础问题,让DOA理论体系更加完善”。
DOA??致力建立安全的数据应用生态系统
究竟何为DOA?面向数据的结构体系又为何?苗放给了记者一个形象的解释。“在大数据的研究上,如果一味地跟着别人跑,会产生很大问题,我们应该有自己的体系,自己的创新。”随着认识的不断提高,苗放说,“原来提DOA是一种朦胧的提法,但现在越来越感觉到DOA是人类整个文明发展非常重要的一个方面,将会有非常大的影响。”
从人类文明的进展看待DOA,苗放总结了4个阶段:“农业文明和工业文明这两个阶段,在本质上都是物质文明。农业文明是对有生命物质的一种掌控,持续了几千年,而工业文明是对无生命特征物质的一种掌控,持续了几百年。现在我们已经不知不觉步入到第三次文明??信息文明。信息文明是我们人脑的思想、意识、智慧的一种扩展,是第一次非物质文明,这和物质文明有很大不同。”但对于非物质文明,我们的管理体制、思想认识还是停留在工业文明甚至农业文明的一种思想体制,这不免会产生偏差。“而承载信息文明的本质是数据,所以我认为应该有针对数据特点和规律的一整套管理体系来指导我们进入信息文明的所有行动和做法,DOA在这方面就是一种尝试。”
尽管第四次文明还没到来,但可以预见的必将是智能文明,“机器学习和深度学习等人工智能的快速发展,一定会有一个机器代替人类思考的文明到来,而且很快。”苗放说,“智能文明也是建立在大数据的基础之上的,这就是第二次非物质文明。”我们已经进入或即将进入的非物质文明阶段,应该是以数据作为社会的基础资源的。“以前的资源是物质,现在的资源是数据,但现在我们对这种数据的认识、处理和研究都还很不到位。”物质的复制和传输都有较高的成本和代价,但数据的复制和传输几乎是零成本,这种特性虽有自身的优点,能带来人类信息的广泛交流,实现信息的广泛共享,但同时也带来了一些问题。我们看到了数据的价值,但对数据的资产属性并没有看到。
“任何数据都是有价值的。为什么会产生数据?一定有它的目的性,有目的性就一定有价值,这和物质一样,谁掌握了物质谁就掌握了社会财富。”但我们对数据还没有这个想法,好像谁都可以使用。“所以,我现在正在研究数据的权利归属即数据权属问题,不管数据有没有价值,首先要有方式方法能确定这个数据的主人??数据所有者。数据是客体,而真正把握拥有数据的才是主体,而且数据的权属要非常清楚才行。”
现在从技术上可以做到区分数据的主人,而这一点却被很多人忽略了。“虽然有立法呼吁个人隐私保护,但我认为个人隐私要保护的是个人的隐私,它是以数据的方式呈现的,这是数据和人的关系,所以保护的不仅是数据而是人,数据是客体,人是主体,所以首先要明确数据和人的关系,应该有‘数据权法’或‘数权法’”。权属不清,必将会为今后大数据的发展带来很多潜在的麻烦,而这也正是苗放最为关心的问题,他希望通过自己的呼吁能让更多的人看到问题的本质和严重性。
对于数据权属问题,国外虽有研究,但目前还不完善。美国国防部对数据是如何定义的呢?“数据就是数据加数据权利。”苗放说,“未来的发展及我国的国家性质更应该把数据权属问题说清楚,是哪个部门的,公安部门、交通部门或是教育部门,特别是个人、企业的数据。”“这也是我研究DOA的一个非常重要的出发点。”苗放说道。
正在进行的研究中,苗放也特别强调了数据的权属问题,并把它简单地划分为3个类型:数据的所有者、数据的生产者、数据的使用者。“从数据采集、数据管理、数据传输、分析挖掘、决策支持等,应该有一个符合数据特点的体系架构,这就是DOA。”可以看出,苗放致力研究的DOA,正是为了建立一个安全的数据应用生态系统。
从数据自身入手“穿盔带甲”
云计算、大数据依赖于开放的互联网环境,对数据安全提出了更高的要求。特别是数据集中存放后,黑客利用漏洞和后门入侵系统获取敏感数据,内部人员因利益诱惑或被“社会工程学”所“攻破”而对数据越权访问,这带来了国家安全、社会稳定、企业利益和个人隐私等一系列问题,使数据的安全问题更加严重和突出。
另一方面,随着数据应用、数据交易和数据资产的保护,一系列新的问题,如数据权属问题,数据主权问题,数据产权问题,数据所有者、数据生产者、数据使用者、数据拥有者划分及他们之间的利益关系问题,数据立法问题等被提出。“这些都需要从数据安全机制、数据权属划分等基本问题上着手研究,以解决大数据时代的各种数据问题,适应于新的社会和经济发展要求。”
“应对这个挑战的机制,即面向数据的安全机制。”苗放希望从数据权属与数据安全相结合,研究和建立二者的内在机制,通过网络人员数字证书认证中心(CA)和公钥基础设施(PKI)来实现数据的权属划定及对具有所有权的数据实现原生加密,理清参与数据存储、数据管理、数据传输、数据交易等过程和这些数据拥有者的关系及权利,通过对数据使用者、数据代理者的授权,实现数据的交易和应用,再通过对数据动态行为特征进行实时记录和追踪溯源,从而实现从数据产生、所有权确定、数据安全存储和传输,到数据授权应用、数据行为可溯源全过程的动态管理。
“数据权属是基础,还有两个关键技术,一个是数据的原生注册,一个是数据的原生加密。原生注册是解决管理问题,原生加密是解决安全问题。只有站在数据的角度,去设计一些体制和方法模块,大数据才能发挥真正作用。”对于未来工作,苗放满怀信心,“这个架构并不遥远,不长时间内将会落地发挥作用。”
从数据自身入手,“穿盔带甲”,原生加密,但又要保证能够得到共享和应用,通过数据注册和记录了解数据的基本信息和使用的动态信息,通过授权使数据得到合法合规的使用,并能发现违规数据使用者,这是在数据安全和其安全应用方面的有意义尝试。
作为成都大学模式识别与智能信息处理四川省高校重点实验室主任和大数据研究院院长,苗放带领的团队也在蒸蒸日上。尽管身兼多个职务,工作量很大,但苗放乐在其中。“针对互联网开放环境下的数据安全问题以及数据权属、授权应用等问题,充分利用目前发展的云计算和大数据等技术,建立一套开放环境下数据安全及数据安全应用的合理可行方案和机制,为大数据产业发展和将来数据社会的有序运行提供技术支持。”这是苗放和团队共同努力的目标。
在解决数据安全应用方面,国外类似的技术有Handle标识系统和区块链技术,DOA和它们相比具有自己独到的优势。
谈到大数据的未来发展,苗放最大的愿望是:“把DOA很快推向市场,渗透到社会的方方面面。”但同时,他也提到了一个现实问题,“现在自己的力量还不是太够,虽和一些投资机构也进行过交流,但一些机构看到的是‘短、平、快’的利益模式,而DOA的发展不是一蹴而就的,短时间内见效并不现实。但相信再过几年,一定会给整个大数据的发展带来不可估量的价值。”
最后,苗放坦言:“这就需要有长远眼光的投资商共同发展,还有国家、政府和更多社会力量的支持。”目前,苗放说已经得到了成都市政府的支持,通过竞争拿到了相关项目,尽管经费少,但在苗放看来,只要能为大数据“保驾护航”,就“意义很大”。(《科学中国人》记者 李晓文)