都说现在是大数据时代,是什么意思?

欠我一场爱情 2021-09-18 16:44 183 次浏览 赞 106

最新问答

  • 猫咪抱抱

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大就是这个高科技时代的产物。

    大(Big data)通常用来形容一个公司创造的大量非结构化和半结构化,这些在到关系型库用于分析时会花费过多时间和金钱。

    大分析常和云计算联系到一起,因为实时的大型集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

    对于海量的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。

    扩展:

    最早提出大时代到来的是全球知名咨询公司麦肯锡, 大在物理学、生物学、环境生态学等领域以及事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。

    大作为云计算、互联网之后又IT行业又一大颠覆性的技术。云计算主要为资产了保管、访问的场所和渠道,而才是真正有价值的资产。企业内部的经营信息、互联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业IT架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。

    如何盘活这些资产,使其为治理、企业决策乃至个人生活服务,是大的核心议题,也是云计算内在的灵魂和必然的升级方向。

    参考来源:百度百科-大时代 (IT行业术语)

    浏览 494赞 53时间 2023-12-24
  • starcraftgod

    大(big data,mega data),或称巨量,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。

    “大”是指以多元形式,自许多来源搜集而来的庞大组,往往具有实时性。在企业对企业销的情况下,这些可能得自社交网络、商务网站、顾客来访记录,还有许多其他来源。这些,并非公司顾客关系管理库的常态组。

    扩展

    大的主要特点

    1、大量

    大的特征首先就体现为“大”,从先Map3时代,一个小小的MB级别的Map3就可以满足很多人的需求,然而随着时间的推移,存储单位从过去的GB到TB。

    乃至现在的PB、EB级别。随着信息技术的高速发展,开始爆发性增长。社交网络(微博、推特、脸书)、移动网络、各种智能工具,服务工具等,都成为的来源。

    2、多样

    广泛的来源,决定了大形式的多样性。任何形式的都可以产生作用,目前应用最广泛的就是推荐系统,如淘宝,网易云音乐、今日头条等,这些平台都会通过对用户的日志进行分析,从而进一步推荐用户喜欢的东西。

    日志是结构化明显的,还有一些结构化不明显,例如图片、音频、等,这些因果关系弱,就需要人工对其进行标注。

    3、高速

    大的产生非常迅速,主要通过互联网传输。生活中每个人都离不开互联网,也就是说每天个人每天都在向大大量的。

    并且这些是需要及时处理的,因为花费大量资本去存储作用较小的历史是非常不划算的,对于一个平台而言,也许保存的只有过去几天或者一个月之内,再远的就要及时清理,不然代价太大。

    4、价值

    这也是大的核心特征。现实世界所产生的中,有价值的所占比例很小。相比于传统的小,大最大的价值在于通过从大量不相关的各种类型的中。

    挖掘出对未来趋势与模式预测分析有价值的,并通过机器学习方法、人工智能方法或挖掘方法深度分析,发现新规律和新知识,并运用于农业、金融、医疗等各个领域,从而最终达到改善社会治理、提高生产效率、推进科学研究的效果。

    参考来源:百度百科-大时代




    浏览 267赞 85时间 2023-10-22
  • jiaoyang0706

    大(Big data)通常用来形容一个公司创造的大量非结构化和半结构化,这些在到关系型库用于分析时会花费过多时间和金钱。

    大分析常和云计算联系到一起,因为实时的大型集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

    对于海量的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。

    扩展:

    思维变革:

    当的处理技术发生翻天覆地的变化时,大时代,人的思维也要变革。

    第一个思维变革:利用所有的,而不再仅仅依靠部分,即不是随机样本,而是全体。

    第二个思维变革:我们唯有接受不精确性,才有机会打开一扇新的世界之窗,即不是精确性,而是混杂性。

    参考来源:百度百科-大时代

    浏览 429赞 153时间 2023-04-29
  • 心晴joanny

    随着云时代的来临,大(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大(Big data)通常用来形容一个公司创造的大量非结构化和半结构化,这些在到关系型库用于分析时会花费过多时间和金钱。大分析常和云计算联系到一起,因为实时的大型集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
      简言之,从各种各样类型的中,快速获得有价值信息的能力,就是大技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。   大的4个“V”,或者说特点有四个层面:第一,体量巨大。从TB级别,跃升到PB级别;第二,类型繁多。前文提到的网络日志、、图片、地理位置信息等等。第三,价值密度低。以为例,连续不间断监控过程中,可能有用的仅仅有一两秒。第四,处理速度快。1秒定律。最后这一点也是和传统的挖掘技术有着本质
      的不同。业界将其归纳为4个“V”——Volume,Variety,Value,Velocity。   物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是来源或者承载的方式 著云台
      例子包括网络日志,RFID,传感器网络,社会网络,社会(由于的社会),互联网文本和文件;互联网搜索索引;呼叫详细记录,天文学,大气科学,基因组学,生物地球化学,生物,和其他复杂和/或跨学科的科研,事侦察,医疗记录;摄影档案馆档案;和大规模的商务。
      大的需要特殊的技术,以有效地处理大量的容忍经过时间内的。适用于大的技术,包括大规模并行处理(MPP)库,挖掘电网,分布式文件系统,分布式库,云计算平台,互联网,和可扩展的存储系统。
      一些但不是所有的MPP的关系库的PB的存储和管理的能力。隐含的负载,监控,备份和优化大型表的使用在RDBMS的。
      斯隆数字巡天收集在其最初的几个星期,比在天文学的历史,早在2000年的整个收集更多的。自那时以来,它已经积累了140兆兆 字节的信息。这个望远镜的继任者,大天气巡天望远镜,将于2016年在网上和将获得的,每5天沃尔玛处理超过100万客户的交易每隔一小时,反过来进口量库估计超过2.5 PB的是相当于167次,在美国图书馆的书籍 。
      FACEBOOK处理400亿张照片,从它的用户。解最初的人类基因组花了10年来处理时,现在可以在一个星期内实现。
      “大”的影响,增加了对信息管理的需求,甲骨文,IBM,微软和SAP花了超过15亿美元的在软件智能管理和分析的专业公司。这个行业自身价值超过1000亿美元,增长近10%,每年两次,这大概是作为一个整体的软件业务的快速。   大已经出现,因为我们生活在一个社会中有更多的东西。有46亿全球移动电话用户有1亿美元和20亿人访问互联网。
      基本上,人们比以往任何时候都与或信息交互。 1990年至2005年,全球超过1亿人进入中产阶级,这意味着越来越多的人,谁收益的这笔钱将成为反过来导致更多的识字信息的增长。思科公司预计,到2013年,在互联网上流动的交通量将达到每年667艾字节。
      最早提出“大”时代已经到来的机构是全球知名咨询公司麦肯锡。麦肯锡在研究报告中指出,已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。
      “麦肯锡的报告发布后,大迅速成为了计算机行业争相传诵的热门概念,也引起了金融界的高度关注。”随着互联网技术的不断发展,本身是资产,这一点在业界已经形成共识。“如果说云计算为资产了保管、访问的场所和渠道,那么如何盘活资产,使其为治理、企业决策乃至个人生活服务,则是大的核心议题,也是云计算内在的灵魂和必然的升级方向。”
      事实上,全球互联网巨头都已意识到了“大”时代,的重要意义。包括EMC、惠普(微博)、IBM、微软(微博)在内的全球IT 巨头纷纷通过收购“大”相关厂商来实现技术整合,亦可见其对“大”的重视。
      “大”作为一个较新的概念,目前尚未直接以专有名词被我国提出来给予政策支持。不过,在12月8日工信部发布的物联网“十二五”规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了海量存储、挖掘、图像智能分析,这都是大的重要组成部分。而另外3项关键技术创新工程,包括信息感知技术、信息传输技术、信息安全技术,也都与“大”密切相关。

    浏览 391赞 76时间 2022-01-09
  • 时光穿梭地鱼

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大就是这个高科技时代的产物。
    随着云时代的来临,大(Big data)也吸引了越来越多的关注。大(Big data)通常用来形容一个公司创造的大量非结构化和半结构化,这些在到关系型库用于分析时会花费过多时间和金钱。大分析常和云计算联系到一起,因为实时的大型集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
    在现今的社会,大的应用越来越彰显他的优势,它占领的领域也越来越大,商务、O2O、物流配送等,各种利用大进行发展的领域正在协助企业不断地发展新业务,创新运营模式。有了大这个概念,对于消费者行为的判断,产品销量的预测,精确的营销范围以及存货的补给已经得到全面的改善与优化。
    "大"在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为。这些的规模是如此庞大,以至于不能用G或T来衡量。
    大到底有多大?一组名为"互联网上一天"的告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的数量37.1万……
    截止到2012年,量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际公司(IDC)的研究结果表明,2008年全球产生的量为0.49ZB,2009年的量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的。而到2012年为止,人类生产的所有印刷材料的量是200PB,全人类历史上说过的所有话的量大约是5EB。IBM的研究称,整个人类文明所获得的全部中,有90%是过去两年内产生的。而到了2020年,全世界所产生的规模将达到今天的44倍。 每一天,全世界会上传超过5亿张图片,每分钟就有20小时时长的被分享。然而,即使是人们每天创造的全部信息--包括语音通话、邮件和信息在内的各种通信,以及上传的全部图片、与音乐,其信息量也无法匹及每一天所创造出的关于人们自身的数字信息量。
    这样的趋势会持续下去。我们现在还处于所谓"物联网"的最初级阶段,而随着技术成熟,我们的设备、交通工具和迅速发展的"可穿戴"科技将能互相连接与沟通。科技的进步已经使创造、捕捉和管理信息的成本降至2005年的六分之一,而从2005年起,用在硬件、软件、人才及服务之上的商业投资也增长了整整50%,达到了4000亿美元。
    折叠大的精髓
    大带给我们的三个颠覆性观念转变:是全部,而不是随机采样;是大体方向,而不是精确制导;是相关关系,而不是因果关系。
    A.不是随机样本,而是全体:在大时代,我们可以分析更多的,有时候甚至可以处理和某个特别现象相关的所有,而不再依赖于随机采样(随机采样,以前我们通常把这看成是理所应当的,但高性能的数字技术让我们意识到,这其实是一种人为);
    B.不是精确性,而是混杂性:研究如此之多,以至于我们不再热衷于追求精确度;之前需要分析的很少,所以我们必须尽可能精确地量化我们的记录,随着规模的扩大,对精确度的痴迷将减弱;拥有了大,我们不再需要对一个现象刨根问底,只要掌握了大体的发展方向即可,适当忽略微观层面上的精确度,会让我们在宏观层面拥有更好的洞察力;
    C.不是因果关系,而是相关关系:我们不再热衷于找因果关系,寻找因果关系是人类长久以来的习惯,在大时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系;相关关系也许不能准确地告诉我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。
    折叠价值
    大时代,什么最贵?
    十年前,葛大爷曾说过,"21世纪什么最贵?"--"人才",深以为然。只是,十年后的今天,大时代也带来了身价不断翻番的各种。由于急速拓展的网络带宽以及各种穿戴设备所带来的大量,的增长从未停歇,甚至呈井喷式增长。
    一分钟内,微博推特上新发的量超过10万;社交网络"脸谱"的浏览量超过600万……
    这些庞大数字,意味着什么?
    它意味着,一种全新的致富手段也许就摆在面前,它的价值堪比石油和黄金。
    事实上,当你仍然在把微博等社交平台当作抒情或者发议论的工具时,华尔街的敛财高手们却正在挖掘这些互联网的"财富",先人一步用其预判市场走势,而且取得了不俗的收益。
    让我们一起来看看--他们是怎么做的。
    这些都能干啥。具体有六大价值:
    ●1、华尔街根据民众情绪抛股票;
    ●2、对冲基金依据购物网站的顾客评论,分析企业产品销状况;
    ●3、银行根据求职网站的岗位数量,推断就业率;
    ●4、投资机构搜集并分析上市企业声明,从中寻找破产的蛛丝马迹;
    ●5、美国疾病控制和预防中心依据网民搜索,分析全球范围内流感等病疫的传播状况;
    ●6、美国奥巴马的竞选团队依据选民的微博,实时分析选民对竞选人的喜好。
    折叠可视化
    "是新的石油。"亚马逊前任首席科学家Andreas Weigend说。Instagram以10亿美元之时,成立于1881年的世界最大影像产品及服务商柯达正申请破产。
    大是如此重要,以至于其获取、储存、搜索、共享、分析,乃至可视化地呈现,都成为了当前重要的研究课题 。
    "当时时变幻的、海量的出现在眼前,是怎样一幅壮观的景象?在后台注视着这一切,会不会有接近上帝俯视人间星火的感觉?"
    这个问题我曾请教过刘建国,中国著名的搜索引擎。刘曾主持开发过国内第一个大规模中英文搜索引擎系统"天网"。
    要知道,刘建国曾任至百度的首席技术官,在这样一家每天需应对网民各种搜索请求1.7亿次(2013年约为8.77亿次)的网站中,如果只是在后台静静端坐,可能片刻都不能安心吧。百度果然在搜索服务之外,逐渐增添了百度指数,后又建立了基于网民搜索的重要产品"贴吧"及百度统计产品等。
    刘建国没有直接回答这个问题,他想了很久,似乎陷入了回忆,嘴角的笑容含着诡秘。
    倒是有公司已经在大中有接近上帝俯视的感觉,美国洛杉矶就有企业宣称,他们将全球夜景的历史建立模型,在过滤掉波动之后,做出了投资房地产和消费的研究报告。
    在可视化呈现方面,我最新接收到的是,一位在美国思科物流部门工作的朋友,很聪明的印度裔小伙子,被Facebook高价挖角,进入其研究小组。他后来惊讶地发现,里面全是来自物流企业、链方面的技术人员和,"Facebook想知道,能不能用物流的角度和流程的方式,分析用户的路径和行为。"
    折叠编辑本段特征
    量大(Volume)
    第一个特征是量大。大的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
    类型繁多(Variety)
    第二个特征是类型繁多。包括网络日志、音频、、图片、地理位置信息等等,多类型的对的处理能力提出了更高的要求。
    价值密度低(Value)
    第三个特征是价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成的价值"提纯",是大时代亟待解决的难题。
    速度快、时效高(Velocity)
    第四个特征是处理速度快,时效性要求高。这是大区分于传统挖掘最显著的特征。
    既有的技术架构和路线,已经无法高效处理如此海量的,而对于相关组织来说,如果投入巨大采集的信息无法通过及时处理反馈有效信息,那将是得不偿失的。可以说,大时代对人类的驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力了前所未有的空间与潜力。
    折叠编辑本段思维变革
    当的处理技术发生翻天覆地的变化时,大时代,我们的思维也要变革。
    第一个思维变革:利用所有的,而不再仅仅依靠部分,即不是随机样本,而是全体。
    第二个思维变革:我们唯有接受不精确性,才有机会打开一扇新的世界之窗,即不是精确性,而是混杂性。
    第三个思维变革:不是所有的事情都必须知道现象背后的原因,而是要让自己"发声",即不是因果关系,而是相关关系。

    浏览 335赞 118时间 2021-11-21

都说现在是大数据时代,是什么意思?