大数据时代:大数据是什么?

超级吃货两枚 2021-09-19 09:33 300 次浏览 赞 105

最新问答

  • 神兽史瑞克

    大指无法在一间范围内用常规软件工具进行捕捉、管理和处理的集合。通过大量的统计了解大家的喜好,想要的东西,从而得到他们想要的,比如精准营销,征信分析,消费分析等等

    浏览 382赞 64时间 2023-10-03
  • 冬眠的羽毛

    大是什么?是一种运营模式,是一种能力,还是一种技术,或是一种集合的统称?今天我们所说的“大”和过去传统意义上的“”的区别又在哪里?大的来源又有哪些?等等。当然,我不是学者,我无法给出一个权威的,让所有人信服的定义,以下所谈只是我根据自己的理解进行小结归纳,只求表达出我个人的理解,并不求全面权威。先从“大”与“”的区别说起吧,过去我们说的“”很大程度上是指“数字”,如我们所说的客户量,业务量,营业收入额,利润额等等,都是一个个数字或者是可以进行编的简单文本,这些分析起来相对简单,过去传统的解决方案(如库或商业智能技术)就能轻松应对;而今天我们所说的“大”则不单纯指“数字”,可能还包括“文本,图片,音频,……”等多种格式,其涵括的内容十分丰富,如我们的博客,微博,轻博客,我们的音频分享,我们的通话录音,我们位置信息,我们的点评信息,我们的交易信息,互动信息等等,包罗万象。用正规的语句来概括就是,“”是结构化的,而“大”则包括了“结构化”“半结构化”和“非结构化”。关于“结构化”“半结构化”“非结构化”可能从字面上比较难理解,在此我试着用我的语言看能否形象点地表达出来:由于是结构化的,分析可以遵循一定现有规律的,如通过简单的线性相关,分析可以大致预测下个月的营业收入额;而大是半结构化和非结构化的,其在分析过程中遵循的规律则是未知的,它通过综合方方面面的信息进行模拟,它以分析形式评估,假设应答结果,并计算每种可能性的可信度,通过大分析我们可以准确找到下一个市场热点。 基于此,或许我们可以给“大”这样一个定义,“大”指的是收集和分析大量信息的能力,而这些信息涉及到人类生活的方方面面,目的在于从复杂的里找到过去不容易昭示的规律。相比“”,“大”有两个明显的特征:第一,上文已经提到,的属性是包括结构化、非结构化和半结构化;第二,之间频繁产生交互,大规模进行分析,并实时与业务结合进行挖掘。解决了大是什么,接下来还有一个问题,大的来源有哪些?或者这个问题这样来表达会更清晰“大的来源有哪些?”对于企业而言,大的来源主要有两部分,一部分来自于企业内部自身的信息系统中产生的运营,这些大多是标准化、结构化的。(若继续细化,企业内部信息系统又可分两类,一类是“基干类系统”,用来提高人事、财会处理、接发订单等日常业务的效率;另一类是“信息类系统”,用于支持经营战略、开展市场分析、开拓客户等。)传统的商业智能系统中所用到的基本上该部分。而另外一部分则来自于外部,包括广泛存在于社交网络、物联网、商务等之中的非结构化。这些非结构化由源于 Facebook、Twitter、LinkedIn 及其它来源的社交媒体构成,其产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断涌现和应用。具体包括了:如,呼叫详细记录、设备和传感器信息、GPS 和地理映射、通过管理文件传输协议传送的海量图像文件、Web 文本和点击流、科学信息、邮件等等。由于来源不同,类型不同的的是同一个事物的不同的方面,以消费客户为例,消费记录信息能客户的消费能力,消费频率,消费兴趣点等,渠道信息能客户的渠道偏好,消费支付信息能客户的支付渠道情况,还有很多,如,客户会否在社交网站上分享消费情况,消费前后有否在搜索引擎上搜索过相关的关键词等等,这些信息(或说)从不同的方面表达了客户的消费过程的方方面面。因此,一般来说,企业用以分析的来源越广越全面,其分析的结果就越立体,越接近于真实。因此,大分析意味着企业能够从不同来源的中获取新的洞察力,并将其与企业业务体系的各个细节相融合,以助力企业在创新或者市场拓展上有所突破。针对“量”这个话题,亚马逊CTO Vogels曾经说过,“在运用大时,你会发现越大,结果越好。为什么有的企业在商业上不断犯错?那是因为他们没有足够的对运营和决策支持。一旦进入大的世界,企业的手中将握有无限可能。”可以预料,在不远的未来,企业如何通过抓住用户获取源源不断的资产将会是一个新的兵家必争之地。在这个层面上,Facebook、Twitter、Google、Amazon,包括电信运营商等领先企业具有无可比拟的优势。在大的领域里是否量越大越好?很多时候我们写文章,并不是想要去重复某一个众所周知的事实,而更多的是想从另外一个角度试图去质疑那些已成事实的事实,并不是想要去推翻,而只是去看这个事实是否存在另外的可能性,虽然很多时候我的那些质疑会漏洞百出,并显得幼稚可笑,但我觉得一个事物的健康发展需要不同的声音,而这正是我们写文章的意义所在。所以,我现在问题是,在大的领域里是否量越大越好?对于这个问题,我觉得应该分两个层面来看,第一个层面是,对大这个整体而言,肯定是越大越好的,多元的能让不同行业,不同组织都可以从大中寻找到解决问题的方法,也是基于此,现在越来越多的企业组织通过不同的终端、应用或者其他手段去疯狂地收集多元的,大让人们能有足够的能力和视野将地球(包括地球上的一切)作为一个整体去看待,这是在从前无法想象的。第二个层面是,对于大的具体应用而言,量是否越大越好,我却有不同的看法。我的理解是,在大的实际应用中你用以分析的量越大,你能得到的东西就越多,而至于得到的那些东西是否是你所需要的,或者对你是否有价值的,没有人能保证。就如同树林里有100条路,每条路上都有一些你觉得有意思的东西,如果你有足够的时间,你可以走遍这100条路,收获很多有意思的小东西,但不是每一条路都会让你得到真正有价值的东西。经常做分析的朋友应该会有同感,在分析的过程中你会发现不同的通过不同的组合导入不同的分析模型会得到很多不同的结果,有时候会有一些很新鲜的结果被发现,这会让你很惊喜,但大部分这些新鲜的结果最后只会出现在你的微博里,而不会出现在正式的分析报告中,因为分析报告是为解决某一具体问题而存在的,旁枝末节太多会显得臃肿且容易混淆。所以,我认为,在大的具体应用面前,我们先要做的是把“大”这个概念忘掉,我们必须弄清楚到底想从大中得到什么,然后带着目的去收集有用的,输入至分析模型中,直接导向我们想要的结果。否则你将花费大量时间、成本去获取,分析。我们需要大应用是能够帮助解决问题的行为洞察,而不是试图研究每一条能够得到的信息。不得不说,大的世界太魔幻了,里面的很多,如果你不是带着明确的目标去应用,你很有可能被陷入在五光十色的中无法自拔。即使你走进了一座金山,最后你能带走的最多也只是你能提动的一小口袋。另外,这同时也揭示,为了避免应用者困在“大的金山”,大必须往下细化,针对不同行业不同领域的特定问题制定不同的解决工具,未来大将会遵循消费化模式,核心基础设施将作为服务或应用程序来。

    浏览 407赞 110时间 2023-03-29
  • little1208

    大是指无法在一间内用常规软件工具对其内容进行抓取、管理和处理的集合。大技术是指从各种各样类型的中,快速获得有价值信息的能力。

    浏览 483赞 153时间 2022-06-24
  • 蓝天勒蓝天

    大指无法在一间范围内用常规软件工具进行捕捉、管理和处理的集合。通过大量的统计了解大家的喜好,想要的东西,从而得到他们想要的,比如精准营销,征信分析,消费分析等等

    浏览 314赞 61时间 2021-11-30
  • 雨林之声

    浏览 387赞 85时间 2021-09-25

大数据时代:大数据是什么?