关闭 More 保存 重做 撤销 预览

   
关闭   当前为简洁模式,您可以更新模块,修改模块属性和数据,要使用完整的拖拽功能,请点击进入高级模式
招商专员 ,电销专员 ,客服专员 信誉平台长期招各大代理合作共赢 OD体育 OD体育

上一主題 下一主題
»
萌虎下山
LV9 苍瀚的风云
帖子    1921
新博币    303 提现
提现    0
TA的勋章:勋章中心
     
    3444 1 | 显示全部楼层 |倒序浏览
    我今天不想扯外国的联赛制度的事情,我今天就是想聊一聊数据的问题。现在没有人会反驳大数据时代这个定位,而上网的人大多数也都很了解大数据这个名词所带来的各种各样的附加概念。

     而在一些有心掌握资源的人手中,大数据成为了一个法宝,一个可以用来完善各种理论的法宝。似乎一切的问题都可以通过大数据来解决。

      但是数据究竟是什么?我们究竟要怎样获取数据?数据自身存在意义么?这三个问题盘横在我的脑子里挥之不去,我是个保守的人,对这个言则必称XXX的东西我一向敬谢不敏。而我其实对数据的“本身”价值和这个时代对数据的附加“价值”保持有深深的芥蒂。

     因为我们对数据的渴求和依赖其实从很早的时候就有,举一个最简单的例子就是做剪报,这就是一种很原始的数据收集工作。只不过我们随着社会的发展,技术手段的提升而对于数据的定义和数据的细化更为严密更为科学。但是“依赖数据”这一点,我们其实从未变过,只不过特定时代的数据采集和数据归纳方法不一样,而数据对生活的影响程度也有所不同。

      那么我们这个时代的数据和过去那些时代的数据只是一个简单的量的增加么?很明显并非是量的增加这么简单的事情。在我们这个时代数据不仅仅是那些流于表面的“事件”也不是那些肤浅“数字”更不是简单的“堆砌”,而是在现有的技术力的前提下,对一个对象进行严密的数据量化的过程。这个分析采集数据的过程,就是现代意义上的“数据量化、挖掘”这两个步骤是数据的根本,也是一切的基础。


    那么我们说的“数据”就是这个么?非也。这些还远远称不上“数据”这些只能叫做“资料”。那么数据是什么?我们现在说的数据其实是资料经过整理之后应用化的那一部分,这才是数据。不可应用的那一部分还是资料,因为也许在其他的地方这些资料就能用上了,就能转化为“数据”。

      所以说,数据应该是对人们的目的有价值的那一部分,人们能从中得到价值的部分,这才是数据。而没有价值的部分,就不能被称之为“数据”。这才应该是数据的定义。


     那么我们究竟要怎样获取我们需要的数据?当我们从冗长的资料里整理出数据以后,我们怎么将这些数据用一种直观的,简洁的方式表达出来?

      这就是数据的第二步筛选。因为我们从原始资料中提取的数据往往是粗糙的,冗余的。我们需要更加精细的划分与安排,根据我们的目的进行整理,它们才能转化为更加精细的有价值数据。

      这里的有价值数据,才是能帮助人们去研究去归纳去采用的基础。而经过了这个步骤,数据才是“数据”。只有经过了这样一道程序的数据,才能被用作决策的参考,才能被用来产生价值。而没有经过这样筛选程序的数据,只能说是高级一些的资料而已。

      所以一个合格的数据,应该至少经过两道很复杂的工序,就是筛选和归纳。就像是大浪淘沙,就像是筛选金沙。我认为,这个过程,才是数据的根本。没有这个过程,就不存在“数据”的概念。

     近期发生的一大一小两个例子可以很好的证明我的观点,先说小的事件吧,上周微软的聊天软件Tay进行产品测试,收集语言习惯的数据,但是仅仅上线了一天,就因为采集了大量的种族主义、纳粹、淫秽等话题而被迫停止这次数据整理。

      从ai的角度来说,现有的技术还无法给ai去规划一个正确的是非观。而实际上,我们习以为常的“是非观”,其实就是我们在整合资料之后进行的第一手数据筛选。那么缺乏了这个数据筛选的结果是什么呢?从聊天软件上看,我们得到了一个满口脏话,充满了种族主义的“坏女孩”。

    让我们把这次数据采纳实验放大一下,转移一下。当我们在面临众多的原始资料的时候,我们是否有一个“是非观”来帮助我们把这些众多的原始资料整理为真正对我们有价值的数据呢?当我们想要做一个决定的时候,有是否有一个“是非观”来帮助我们做出正确的决策呢?这也就是我的眼中数据收集的第一步,这一步至关重要。这关系到我们的数据来源,数据来源正确,真实,合理才能保证数据的价值。

    而第二件事,是一个大事件。那就是比利时恐怖袭击,这次恐怖袭击我觉得任何的形容词都不足以描述。它太可怕了。但是这同时也暴露出了另一个值得思索的问题,欧洲的安保部门对这次恐怖袭击没有提前获知吗?这么说任何一个有常识的人都会告诉你“这绝对不可能”。是的,没有任何消息和情报来说明即将发生一次大规模恐怖袭击是不可能的。但是这次袭击还是发生了,还这么的“成功”。这就要引起我们的思考了。

      实际上欧洲的安全情报机构是世界上最好最高效的情报体系之一,但是近年以来,无论是法国还是比利时都屡屡遭受恐怖袭击的困扰。究其原因,并不仅仅是数据情报不足,也不是没有筛选和整理。欧洲的情报部门作为世界上最先进的情报处理机构不会这么低效这么无能。

      但是袭击还是爆发了,原因就在于,过多的数据,过多的信息,过多的资料,这些庞大的数据量使得决策人在选取数据信息的时候面临着一个巨大的考验,什么才是有价值的?这个问题永远没有唯一正确的答案,尤其是当备选目标过于巨大,当信息来源过于巨大的时候,到底该怎么选取,就成了一个严峻的任务。

      同理,我们放在其他领域,当我们面对大量的数据的时候,其实和我们面对大量的原始资料的时候是一样的。因为我们个人对于数据的处理能力也是有限的。这样数据归纳和数据管理优化就是大数据整合中第二要务。没有这个步骤,数据和资料的区别也就体现不出来。数据也就成不了真正的“数据”。因此,数据的整理归纳,和数据的收集筛选一样,是大数据时代不可或缺的两个环节。这两个环节的专业化,精密化的程度是决定大数据生存的关键。

    那么什么是数据的价值?数据,是为人们提供做决定的参考数据的。而数据越细致,越有效,人们做出决策的错误率也就越低,容错率也就越高。这就是数据的价值。所以大数据时代的基础,是大量的原始资料上的谨慎筛选和科学归纳。原始资料-筛选结果-归纳建议,这三个环节缺一不可。在我们实际生活中,其实接触的大多数是原始资料,而媒体,则承担了筛选的作用。至于归纳,要么是来自于个人的经验,要么就是有更加专业的机构来完成。

      比如在体育圈,我们往往能看到各种各样的消息,和各种各样的新闻、花边。那么这些内容是有效的吗?其实不是,因为我们不知道这些筛选出来的信息数据有什么价值。所以在进行菠菜类活动中,我们很难简单的凭着我们能看到的这些消息对我们投注有什么帮助。因为我们还需要一个更加专业的数据归纳人来帮助我们对这些资料数据进行整理归纳。这样也就是秒爆球讯这样的产品的价值所在,秒爆球讯为用户去进行数据归纳,提供可行性建议,降低用户的风险。这样的良性归纳才会产生足够的价值,这个步骤才是真正的“大数据”。

      大数据,不是我们用来装点的装饰品,也不是拿来装逼的“干货”。而是要实实在在的帮助我们做决策,做决定的东西。你可以说这样看太功利,但是不这么功利,我们谈论大数据就没有价值和意义。所以我的观点是,数据本身是没有价值的,是无法告诉你什么的。只有当你去有意的使用他们的时候,才有价值,才有意义。


    个人签名

    对,人不是经历过才能看清?

    LLLL123
    LV0 未报道用户
    帖子    0
    新博币    0 提现
    提现    0
       
      点击按钮快速添加回复内容: 支持 高兴 激动 给力 加油 淡定 生气 回帖 路过 感动 感恩
      您需要登录后才可以回帖 登录 | 立即注册

      本版积分规则

      快速回复 返回顶部 返回列表