近期多场科技创新、大数据领域的高端论坛在西安竞相召开。西安弈聪信息技术有限公司(简称:弈聪软件)大数据运营总监尹宏刚作为嘉宾参加了多场会议。会余间隙,笔者对尹总进行了专访。尹宏刚认为“大数据不但是一项新技术,更是一种全新的思维模式和工作方法。大数据技术很复杂,因此掌握方法非常重要。”
尹宏刚表示,目前数据增长已经进入爆发期,且非结构化数据占比很大。所谓非结构化数据,就是指数据和数据之间没有内在逻辑关系的数据。这些数据之间是没有任何联系的,这样的数据就是非结构化数据。未来会有越来越多的非结构化数据出现,而如何处理和应用好这些非结构化数据,成为非常重要的议题。
相较于记录了生产、业务、交易和客户信息等的结构化数据,非结构化的信息涵盖了更为广泛的内容,包括了如合约、发票、书信与采购记录等营运内容,如文书处理、电子表格、简报档案与电子邮件等部门内容,再比如HTML与XML等格式信息的Web内容,以及如声音、影片、图形等媒体内容。不至少85%为非结构化数据的比例在每个行业中并非是一个绝对值,此类型数据在不同行业中的占比是不尽相同的。新旧数据的不断变化,现有的信息呈现指数级的增长为数据运用带来了挑战。在了解、寻找数据之外,理解数据背后的含义显得更加重要。
对于收集到的信息,尹宏刚认为,首先需要评估这是否是及时的信息。“比如说一分钟之前收集到的信息,并不代表这个信息本身是一分钟的历史,有可能是一年前的信息”。同时,也需要判断收集到信息的正确性。这在海量数据中,对快速收集到的信息在延时性和正确性等方面的基本判断,就对新技术提出了要求。这对于企业的运行方式也产生了影响。有很多客户都面临数字化发展带来的颠覆和挑战,以及如何在这些挑战下进行革新和转变。科技的发展,包括大数据、物联网、金融科技的深入运用和技术汇集,使得海量数据的挖掘和应用更具备可能。
尹宏刚认为大数据“预测未来”的能力,才是企业通过技术革新应对潜在挑战的重中之重。尹宏刚指出了一个“观察者效应”,也就是说如果这个人在做一件事情的时候,自己知道有别人在观察他,那么这个人就会不自主地去改变自身的行为。在这种情况下,即使用建模的方式模拟了一个不好的或者欺诈的行为,但是实际上这个被观察的对象,其行为跟真实的情况是有差异的,但这一点通过传统的建模方法是没有办法去进行行为检测的。所以就需要有更为高级的大数据手段、更加先进的调查方法来进行解决,去建模未来可能发生欺诈的行为。
留言与评论(共有 0 条评论) |