唯一不变的是信息本身
——专访EMC公司CTO Jeffry Nick
 
 
1979年,Richard (Dick) Egan和Roger Marino共同创建了一家伟大的IT公司,经过28年时间,它已经发展成为一个拥有31000多名员工,年收入超过111亿美元的IT巨头。两位创始人的姓氏被刻在公司的名字上,这就是EMC。今天,我们看到这家公司的名字已经成为EMC2,这非常像一个经典的物理学公式:E = mc2。这个质能转换公式的背后代表着一些永恒不变的规律,就像EMC一贯坚持的那样,因为他们相信在IT世界,唯一不变的是信息本身。
 
《程序员》:我们曾经一直认为EMC是一家重点业务在存储领域的硬件公司,今天它已经成为全球第六大软件企业了,作为EMC公司的CTO,您能否谈谈EMC公司的转型?
Jeff:如果你看一看今天呈爆炸式增长的数据信息,你就会明白今天所有IT人员和企业所遇到的问题。仅仅过去的一年时间,我们所产生的数据信息就超过了过去所有年代出版图书数据量总和的300万倍,这还仅仅只是去年产生的数据量。如何管理这些数据信息?如何搜索和寻找这些信息?产生的信息如何分类?数据信息应该如何保护?遗失的数据如何恢复?数据信息如何归档与保存?如何确保数据信息的一致性?在医疗领域,又比如在金融领域,这些数据信息的内在价值是什么?换句话说,如何有效地将信息转化成为技术,这个潜在的市场将会极为庞大,正因如此,在这个领域也将有足够的空间和机会。
再回过头来看企业IT,每年5%总体拥有成本的复合式增长远远无法应付数字信息的爆炸,正因如此,我们将会面临一个前所未有的巨大挑战。我认为这个挑战一定要通过自动化的方式来解决,同时,这种自动化应该是智能的。传统的手工信息管理处理方式必须要彻底替换成为策略驱动的自动化信息管理方式。就像我在以前曾经在很多地方重点强调的那样,所有领域的信息生命周期管理都必须具备基于策略、面向目标的特点,以适应整个系统的目标。
过去很长一段时间以来,EMC都一直在信息管理领域立足,其技术和产品几乎覆盖所有信息管理相关领域,比如资源管理、存储管理、信息生命周期管理等,随着面向服务架构的整合时代到来,策略管理、文档管理以及虚拟化等领域,EMC也大有所为。这些都是这家公司的坚实基础。在面临前面提到的种种机会,EMC的软件开始有了快速增长。
 
《程序员》:那么您认为面对这种爆炸式的数据信息发展,应该采用什么策略呢?请您结合EMC公司的实际情况谈谈未来信息管理领域的主要发展趋势。
Jeff:前面提到了由策略驱动的信息生命周期管理自动化,可以明显看到信息正在逐渐向知识转化。从产品角度,我将从两个方面简单谈谈我们的想法。
在EMC,已经有非常成熟的存储子系统层和软件层数据保护、复制技术。比如Legato的系列产品、电子邮件规格、磁盘规格的数据复制技术,同时包括存储平台SRDF、Symmetrix等,这些技术全部都是为了提供数据保护和备份的。基于内容的活动归档系统也有可靠的平台,比如Centera就是一个很好的例子,它不但能够为提供很强的信息归档能力,而且还支持对象级的数据信息存储,并在存储的同时记录元数据以及数据关系。这样,用户能够更方便地追踪、创建和修改数据实例。通过弄清楚这些不同实例数据之间的关系,更进一步地为无缝的数据恢复和备份打下良好基础。面向下一代基于策略的IOM自动化,现有的技术让我们能解决各种问题,把握住信息管理发展的机会。今天零散的数据信息,已经逐渐作为知识存在,因此数据信息的存储同样需要提高到文档平台层次。传统的纸质信息(传真、文档等)不但需要数字化,而且还需要进行分类,并通过元数据记录各种标签以便在工作流中的查询和检索。此前EMC曾经收购的ProActivity为工作流环境的非结构化数据信息提供监控,为非结构化数据信息提供了内容管理平台,此外,eRoom将作为协作工具为上述平台和工具提供组织。所有的这些技术,都是为了应对信息到知识的过渡。
从信息安全角度来看,我们做出了一个重大的决定,将平台转移到RSA上。继收购RSA Security后,我们的RSA部门最近收购了一家叫做Tablus的企业,这是一家提供基于策略的数据分类和一致性管理公司。自此,信息安全一致性领域已经形成一组经过整合的技术体系,包括采用Documentum作为数据容器、采用EMC智能技术作为IT基础架构以及在各个存储层采用的IOM的智能数据存储。这是我们将各种不同技术整合在一起的一个例子。最近,EMC刚刚收购了一家个人信息在线存储的服务提供商Mozy,为构建下一代信息基础架构集成提供了基础。与此同时,EMC正在着手将这些不同的技术整合在统一的通用架构平台下,以适应未来信息管理的趋势。
《程序员》:我们了解到,EMC前一段时间收购了VMWare公司,您如何看待虚拟化技术在EMC技术体系下的位置?
Jeff:今天我们有机会将整个数据中心全部虚拟化了,这样做的目的是为了让IT变得更加动态(Liquid),而不至于像过去那样僵化(Solid)。虚拟化是一个大趋势,但绝不仅限于服务器的虚拟化,而是需要网络的虚拟化和存储的虚拟化。EMC在全部的技术上都有尖端技术,包括全局的文件系统的网络虚拟化技术Rainfinity;通过VMWare进行服务器的虚拟化;并在未来的Vista平台上做存储虚拟化。我们的总体目标仍然是希望能将各种不同的技术整合起来,从而进一步加强IT的动态性。
同时,我还看到另外一个EMC与VMWare协作的机会。在VMWare中,不管是应用还是服务器本身都被表示成为文件,这样一个体系下,系统需要共享文件、保护文件、复制文件、提供灾难恢复、甚至需要对文件进行归档和版本控制,如果某一天你能将物理资源与应用一同转化成为信息,它将最终成为信息基础架构当中的一部分,从而进一步提高IT的动态性。
 
《程序员》:对于开发者而言,我们认为虚拟化技术和多核时代的结合是非常紧密的,您如何评价我们即将迈入的多核时代?
Jeff:我想虚拟化和多核这两者的关系确实非常紧密。不管是Intel还是AMD,x86架构的最早设计都是部署为单内核、处理器的。因此,它们并没有什么对虚拟化技术的需求。然而一旦进行汇总,人们就会发现虚拟化的价值所在:当你有1000台机器在运转的时候,如果总共只有10%的利用率,那么你就可以好好考虑如何削减机器的数量了。而这一点正是虚拟化技术体现其价值的开始。
今天的单机器、单处理器早已超过单个应用程序所需的计算能力了,单个应用程序往往无法占用全部的计算资源。因此,通常的办法是将很多应用部署在同一个机器上,但我们并不希望这些应用相互之间受到影响,它们应该是相互独立的,所以虚拟化技术在x86架构体系上开始有了用武之地。历史总是在不断的重复,这很像70年代的大型机,那时正是处理器计算能力大幅提升的时候,单个机器的计算性能无法得到充分的发挥,因此虚拟机技术在那个时候被发明出来,让一台大型主机为很多应用程序提供服务,而相互之间又是独立的。今天我们再一次看到这个现象重复出现在通用平台上,也就是x86架构上。由此,我们可以得出的结论就是,在多核时代,从事虚拟平台上的软件开发将会是程序员面临的新机遇。
 
《程序员》:那么您认为在这样的背景下,还有什么是程序员应该努力把握的机会?
Jeff:目前当然有很多值得把握的机会,比如面向服务架构的技术,它让我们能协同信息生命周期管理一同构建信息基础架构。此外,如何将信息转化成为知识将是更具有挑战的领域,大量信息需要发现、分类、捕捉以及元数据收集,所以我们基于各种目的对数据进行语义分析。此外,在医药开发、不同数据源的数据分析、全球变暖现象的研究等众多领域都需要对大量数据进行分析和发现。然而,完成这些事情不但需要挖掘信息,还需要应对数据的不同来源和不同格式,因此在这个领域里充满了创新的机会。
当然,信息安全也是一个充满机会的领域。过去我们为了防止外部数据和信息的入侵,总是关注在防火墙上,然而面临新的时代,如果信息不能进行共享,它就不能成为人们的知识,所以拆掉这些城墙才能发现已有信息的内在价值。正因如此,采用更好的信息安全技术来确保信息可以共享是未来信息安全领域的趋势,我们要做的是弄清楚保护的数据是什么?谁在访问它?访问信息者的角色是什么?基于什么策略在访问?所有的这些要素确保了被共享的信息是安全的。
另外,今天的合作信息与个人信息之间的界线越来越模糊。前面提到的信息爆炸中,有75%的信息其实是来自于企业之外的互联网。而在总体上,85%的信息需要被管理起来,它们同样需要考虑安全性、备份、容灾、持久化,以便将来或者很久以后人们仍然能够访问到,同时也确保他们能够被安全地共享。比如我个人,希望将我的身体健康状况的信息分享给我的医生,而我的财务信息则希望共享给我的财务顾问。这都是未来程序员们面临的潜在机会,因为不管IT如何变化,信息本身是不变的。
 
 
 
Logo

20年前,《新程序员》创刊时,我们的心愿是全面关注程序员成长,中国将拥有新一代世界级的程序员。20年后的今天,我们有了新的使命:助力中国IT技术人成长,成就一亿技术人!

更多推荐