本文共 1296 字,大约阅读时间需要 4 分钟。
Gualtieri说:“关于数据科学家的定义有很多种说法。有人认为数据科学家是管理、收集和存储数据的人,也就是说他们更倾向于计算机科学,而不是分析师的领域。”他把重点放在了寻找懂得如何收集正确信息的人才上面,这使得他的定义显得比其他人的定义更加狭窄。
“很多人都认为数据科学家是会使用Hadoop的人,但我更认同数据科学家就是一个科学家这样的定义。他们决定了处理的数据类型。如果有人没有做好分析工作,不去寻找演算法则并测试它们,那么他们就不是数据科学家。”
理解数据科学家的角色十分重要,但数据管理员在规划一个预测分析项目的时候,还需要考虑在高涨的数据科学家需求背后的技术问题。Gualtieri在近期发布的一份名为《The Forrester Wave: Big Data Predictive Analytics Solutions, Q1 2013》的报告中指出,在海量多变的数据冲击下,现代预测分析帮助企业降低风险,创造独特的客户体验。
虽然基于高级机器学习与其他演算法则的预测分析需要全新的工具技术,但是它提供的商务智能价值,是传统的数据挖掘所不能比的。
Gualtieri说:“以往的商务智能都在于不断生成报表,用不同的方式进行交叉分析,以提供洞察力。但是预测分析大不相同,它运用多种不同类型的运算法则,回归算法、神经网络和各种各样的树算法等等,正是这些运算法则决定了数据的重要性和结果的可能性。”
运算法则就是工作的根基。回想1980年代,人工智能就已经有了类似的运算法则,但是今天的预测分析得以蓬勃发展,还有赖于更加简单的可用性、更加强大的计算能力和更加宽泛的工具互用性。
数据管理员需要信任他们的数据科学家,建立对于如预见性和可能性这些重要概念的理解,做出新兴软件的智慧决策。他们需要设定业务目标,通过预测分析项目将成功最大化,这些都需要对于预见性的充分理解。
Gualtieri说:“企业如果不理解预测将会带来很大的困难。许多人都认为预测过于绝对,但其实预测分析不是二进制。一个预测模型的的结果都是通过概率得出的。”
Gualtieri提到了一家出类拔萃的新兴网络公司Netflix,认为它是一个在概率方面很好的例子。Netflix的在线电影服务采用了预测模型,为用户推荐电影。据用户反映,该公司使用的推荐引擎在预测方面出乎意料地精准,错乱的几率相当小。
对于用户而言,只需要接受或拒绝推荐即可,十分简单。但对于战略部署的业务领导人来讲,就十分困难了。Gualtieri表示,无论怎样,都必须人为决定处理信息的方式。
作者:王玉圆
来源:IT168
原文链接:Forrester:预测分析对数据科学家重要性
转载地址:http://lijio.baihongyu.com/