英特尔:你对数据分析是不是有什么误解?

2018-03-14 09:11 来源:美通社 作者:兰梦

英特尔首席数据科学家鲍勃·罗杰斯(Bob Rogers)近日发表了题为《你对数据分析是不是有什么误解?来看看这六个问题》的文章,以下为全文:

数据对于现代企业的重要程度不言而喻,拥有卓越的数据分析能力可在市场上拥有更大的竞争优势。然而企业用户和一些决策者对于数据分析仍然有一些误解和偏见。

比如:

“我们企业并不需要机器学习这样的高级分析工具。”

“我们有很多数据,但是分析没啥用。”

“我们要进行数据分析就必须要聘请一批数据科学家!”

接下来我们一一揭开这些对于数据分析迷之误解背后的真相。

1,“为了部署像机器学习(ML)这样先进的分析技术,我们必须购入新硬件和大量投资专用基础设施。”

真相:部署高级的数据分析其实没你想象中那么遥远。

许多公司已经拥有大量的高级分析基础设施。例如,工厂车间通常有数千个传感器,但通常不是所有的传感器都被使用,因为它们产生的数据是纷杂的,那么能够很好的管理,存储和集成所有的数据就是一个很好的起点。

如果没有可用于分析的大量现有硬件,也不用太担心,许多云服务提供商(CSP)就可以提供现成的高级分析功能。利用这些资源运行一些试验项目,并由此制定有效的使用案例,然后可以制定一个长期投资路线图,并清楚了解投入产出比。

如果选择内部运行,则可以使用现有的基于英特尔技术的平台来经济高效地支持新项目。

2,“我们不需要像机器学习这样的高级分析工具。”

真相:无论企业规模大小,每个企业都需要高级分析。

很多企业都在做数据分析,也不乏很多企业还在用excel或者简单的在线系统报告来做“数据分析”。

真正的数据分析当然没有那么简单,不过分析数据的第一步是要知道手中到底掌握什么数据,在分析之前就要组织好。简单的在线系统报告显然已经过时了,拜托,现在可是在数据爆炸的时代。

要跟上竞争的步伐,了解数据的实时趋势,使用当前的数据来预测和影响明天会发生的事情,这一点很重要。运用先进的机器学习和其他人工智能技术,可以更快速地理解更多类型和更大量的数据。例如,人工智能技术可以帮助企业在业务流程中自动处理来自文本和图像的信息,这有助于更高效的决策。随着这些数据分析方式变得更加主流,那些不接受它们的人就肯定out啦。

3,“我们有很多数据,但分析不起作用。”

真相:分析数据当然是有用的,但是分析的必须是有效的数据。

在一个高级数据分析的项目中,经常会遇到这样的抱怨“费功夫分析了这么大量的数据,最后得出的怎么还是错误的结果?

这与数据的质量有关。企业在分析数据之前需要有效的方式来收集数据,并进行去重和实时更新。AI(人工智能)和ML(机器学习)算法只能处理给定的数据,所以低质量的数据意味着低质量的结果。所以正确的使用数据管理策略,才会获得真知灼见。

4,“要做数据分析,我们需要聘请一批数据科学家!”

真相:远在天边,近在眼前。

其实不是每个公司都需要一个常驻博士或者数据科学家。了解业务需求和掌握有效数据对决策者才是至关重要的。填补一个数据科学家的职位可能会非常棘手,特别是有特定产品或对专业知识要求极高的行业,并不一定有非常匹配的数据科学家可以有效地发挥作用。所以说借助一些数据分析工具或者开展一些专业培训,在企业内部可能已经培养出了所需的专家。

另一种方法是让运营业务人员直接运用数据分析工具。借助基于云的服务可以清理和处理企业的数据,并提供出展示洞察的算法,这可以使得企业的业务专家转变为数据专家。

5,“要去分析每一个数据”

真相:分析每一个数据是不可能的,也是不必要的。衡量什么是战略才是至关重要的。

当企业开始收集和整合数据时往往会遇到一个很大的诱惑——使用它的一切。但是这种方法可能会变得笨重和昂贵,而且大量不相关的信息会对结果产生不利影响。不断自省正在分析哪个数据集是非常重要的。如果正在分析的这一部分数据是没有商业需求的,那大可以去分析更重要的数据。

这里要强调的就是数据分析要基于业务需求。企业正在部署什么?企业一旦知道了这一点就可以设定可衡量的目标,基于这个目标去开展数据分析工作。

6,“高级数据分析意味着企业需要雇用额外的IT人员。”

真相:现有团队其实足以迎接挑战。

对于一个企业来说,如果有自己的IT团队,那么数据分析方面是有基础的,也可能已经取得一些进展。数据分析最初的工作更多的是充分利用现有的数据。在有基础且有数据分析能力的情况下,企业就有机会吸引才华横溢的IT专家,他们会津津乐道地组织分析创新领先的机会。

还有一种方法就是盘点公司内部已有的数据分析能力,并与外部顾问(如行业分析师或供应商)合作,获取他们的建议并开展相关培训。如企业选择内部开发算法,可以通过FaaS模型(Function as a Service,功能即服务,是一种无服务器计算,是IaaS演进的下一个阶段,它将底层基础架构从开发人员中分离出来,基本上虚拟化了运行和运营管理,无服务器架构允许开发者执行给定的任务,而不必担心服务器、虚拟机或底层计算资源,可极大地减少操作开销和周期。)将其提供给组织内的其他人,以最大限度地减少开发时间。

所以无论企业规模大小,都应该开展数据分析,数据分析也并不是遥不可及,企业要激发自有IT团队的能力,充分释放数据潜力,让企业增强市场竞争力。

英特尔 数据分析

一周热门

2018电源网工程师巡回研讨会