大数据时代是什么意思?大数据是在什么背景下提出的?

WeiXin呵呵呵 2021-09-18 16:44 451 次浏览 赞 122

最新问答

  • jjgirl2008

    大(Big data)通常用来形容一个公司创造的大量非结构化和半结构化,这些在到关系型库用于分析时会花费过多时间和金钱。大分析常和云计算联系到一起,因为实时的大型集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

    大产生背景:

    进入2012年,大(big data)一词越来越多地被提及,人们用它来描述和定义信息时代产生的海量,并命名与之相关的技术发展与创新。

    它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。

    正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到对企业的重要性。

    正如《纽约时报》2012年2月的一篇专栏中所称,“大”时代已经降临,在商业、经济及其他领域中,决策将日益基于和分析而作出,而并非基于经验和直觉。

    哈佛社会学教授加里·金说:“这是一场,庞大的使得各个领域开始了量化进程,无论学术界、商界还是,所有领域都将开始这种进程。

    扩展

    大时代的特征

    1、量大(Volume)

    第一个特征是量大。大的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。

    2、类型繁多(Variety)

    第二个特征是类型繁多。包括网络日志、音频、、图片、地理位置信息等等,多类型的对的处理能力提出了更高的要求。

    3、价值密度低(Value)

    第三个特征是价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成的价值“提纯”,是大时代亟待解决的难题。

    参考来源:百度百科-大时代

    浏览 475赞 118时间 2023-09-12
  • carryme2015

    大时代:

    最早提出大时代到来的是全球知名咨询公司麦肯锡, 大在物理学、生物学、环境生态学等领域以及事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。

    大提出的背景:

    进入2012年,大(big data)一词越来越多地被提及,人们用它来描述和定义信息时代产生的海量,并命名与之相关的技术发展与创新。

    它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。

    正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到对企业的重要性。

    正如《纽约时报》2012年2月的一篇专栏中所称,“大”时代已经降临,在商业、经济及其他领域中,决策将日益基于和分析而作出,而并非基于经验和直觉。

    哈佛社会学教授加里·金说:“这是一场,庞大的使得各个领域开始了量化进程,无论学术界、商界还是,所有领域都将开始这种进程。”

    扩展

    大影响

    现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大就是这个高科技时代的产物。

    随着云时代的来临,大(Big data)也吸引了越来越多的关注。大(Big data)通常用来形容一个公司创造的大量非结构化和半结构化,这些在到关系型库用于分析时会花费过多时间和金钱。

    大分析常和云计算联系到一起,因为实时的大型集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

    在现今的社会,大的应用越来越彰显他的优势,它占领的领域也越来越大,商务、O2O、物流配送等,各种利用大进行发展的领域正在协助企业不断地发展新业务,创新运营模式。

    有了大这个概念,对于消费者行为的判断,产品销量的预测,精确的营销范围以及存货的补给已经得到全面的改善与优化。

    “大”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为。这些的规模是如此庞大,以至于不能用G或T来衡量。

    大到底有多大?一组名为“互联网上一天”的告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量)。

    发出的帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的数量37.1万……

    截止到2012年,量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)

    EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际公司(IDC)的研究结果表明,2008年全球产生的量为0.49ZB,2009年的量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的。

    而到2012年为止,人类生产的所有印刷材料的量是200PB,全人类历史上说过的所有话的量大约是5EB。IBM的研究称,整个人类文明所获得的全部中,有90%是过去两年内产生的。而到了2020年,全世界所产生的规模将达到今天的44倍。

    每一天,全世界会上传超过5亿张图片,每分钟就有20小时时长的被分享。然而,即使是人们每天创造的全部信息——包括语音通话、邮件和信息在内的各种通信,以及上传的全部图片、与音乐,其信息量也无法匹及每一天所创造出的关于人们自身的数字信息量。

    这样的趋势会持续下去。我们现在还处于所谓“物联网”的最初级阶段,而随着技术成熟,我们的设备、交通工具和迅速发展的“可穿戴”科技将能互相连接与沟通。

    科技的进步已经使创造、捕捉和管理信息的成本降至2005年的六分之一,而从2005年起,用在硬件、软件、人才及服务之上的商业投资也增长了整整50%,达到了4000亿美元。

    大的精髓

    大带给我们的三个颠覆性观念转变:是全部,而不是随机采样;是大体方向,而不是精确制导;是相关关系,而不是因果关系。

    A.不是随机样本,而是全体:在大时代,我们可以分析更多的,有时候甚至可以处理和某个特别现象相关的所有,而不再依赖于随机采样(随机采样,以前我们通常把这看成是理所应当的,但高性能的数字技术让我们意识到,这其实是一种人为);

    B.不是精确性,而是混杂性:研究如此之多,以至于我们不再热衷于追求精确度;之前需要分析的很少,所以我们必须尽可能精确地量化我们的记录,随着规模的扩大,对精确度的痴迷将减弱;拥有了大,我们不再需要对一个现象刨根问底,只要掌握了大体的发展方向即可。

    适当忽略微观层面上的精确度,会让我们在宏观层面拥有更好的洞察力;

    C.不是因果关系,而是相关关系:我们不再热衷于找因果关系,寻找因果关系是人类长久以来的习惯,在大时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系;相关关系也许不能准确地告诉我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。

    参考来源:百度百科-大时代

    浏览 169赞 90时间 2022-10-01
  • 呼啦啦达人

    大包含几个方面的内涵吧
    1. 量大,TB,PB,乃至EB等量的需要分析处理。
    2. 要求快速响应,市场变化快,要求能及时快速的响应变化,那对的分析也要快速,在性能上有更高要求,所以量显得对速度要求有些“大”。
    3. 多样性:不同的源,非结构化越来越多,需要进行清洗,整理,筛选等作,变为结构。
    4. 价值密度低,由于采集的不及时,样本不全面,可能不连续等等,可能会失真,但当量达到一定规模,可以通过更多的达到更真实全面的反馈。

    很多行业都会有大需求,譬如电信行业,互联网行业等等容易产生大量的行业,很多传统行业,譬如医,教育,采矿,电力等等任何行业,都会有大需求。

    随着业务的不断扩张和历史的不断增加,量的增长是持续的。
    如果需要分析大,则可以Hadoop等开源大项目,或Yonghong Z-Suite等商业大BI工具。

    不同行业的有不同的自身特点,还需要结合自身的行业知识才能把大转换为价值。
    大时代,应指当前我们所处的以大等技术为潮流的技术时代。
    大时代的提出背景,是在美国提出云计算,大的,而产业界也在面临大需求的不断挑战的背景下提出的。

    浏览 155赞 135时间 2022-04-15
  • 小小桐桐

    现在感觉大家说大,一般都在炒概念,大并不难,怎么让分析落地式很难的,在我来看,目前很多人都在嘘大,但是真正懂大落地的人寥寥无几。给你一个工具,FineBI,楼主可以自己看看。

    浏览 299赞 146时间 2022-01-14
  • 幸福家居

    信息的时代,网络的广泛使用,人们的行为像淘宝、购物、旅游等等,都会产生许多的,并且这些都会被记录和分析。正在不断地膨胀变大,这些对企业生产、推销等有很重要的作用,能帮助企业抓住着重点以及引流产品,能帮助企业在的中找到商机,为企业带来无限机遇。
    “大”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为。这些的规模是如此庞大,以至于不能用G或T来衡量。大到底有多大?一组名为“互联网上一天”的告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的数量37.1万……

    浏览 484赞 107时间 2021-10-12

大数据时代是什么意思?大数据是在什么背景下提出的?