本帖最后由 lvroubaozi 于 2018-4-16 15:05 编辑
IBM如何为企业简化数据处理
现在,整个世界正在产生越来越多的数据,数据正在变成最重要的资产,但是或许也是最难管理的资产,当然除了人之外。
数据相互关联,既可以是结构性的,也可以是非结构性的,而且逐渐分部在不同的地方,可以是在本地服务器,也可以在公共云上,或是移动设备上。对于这些数据,移动他们正在变得越来越有挑战性,而且有时会有丢失,并且很多数据没有被有效的管理。因此对于有些团体如果想使用这些数据通过机器学习去做研究或者应用开发,那么最大的挑战就是如何管理以及处理这些数据。 现在最大的问题是如何使数据结构标准化,也就是我们无法很容易的得到想要的数据,很多时候我们只能使用本地的数据,而云端的数据无法得到。IBM对此格外关注,他们已经将很大的赌注放在了人工智能领域,同时做了很大的努力建立自己的公有云以及私有云,使得客户可以更容易的收集以及分析数据。 最近一个例子就是IBM的综合分析系统,一个可以使数据专家以及数据开发者能够不需要考虑数据的位置就使用数据的平台,无论是公有云、私有云、还是混合云。很快,IBM又展示了私有云平台,一个建立在Kubernetes上的软件平台,可以使企业用户更容易的开发自己的私有云,同时更容易的在公有云和私有云之间移动任务,从而加速开发。 “大多数科学家会遇到很大的阻碍就是数据质量不高,而我们已经通过使用机器学习技术来提高数据质量”,IBM 托马斯说到,“我们需要做数据匹配以及比较,这些需要人工处理的步骤,我们通过机器学习以及软件就可以实现了,这切实地改变了你的认知能力以及处理能力,一旦你开始这么做,你就可以建立机器学习模型并且部署,同时你可以监测模型的状态,发现他们如何在你的环境中运行,哪些地方需要校准,以及哪里需要更多的训练数据” 在Think 2018大会,IBM介绍了将会在Watson系统部署深度学习服务,使得用户可以在IBM云上使用如TensorFlow,Caffe以及PyTorch等平台。同时IBM也以开源工程的方式提供了深度学习核心服务FIDL(Fabric for Deep Learning)。 |