大数据、数据分析和数据挖掘的区别是什么?

开开`心心 2021-09-18 16:35 425 次浏览 赞 81

最新问答

  • 素颜~红太狼

    1、大:指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
    大的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)Veracity(真实性)
    2、分析:是指用适当的统计分析方法对收集来的大量进行分析,提取有用信息和形成结论而对加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,分析可帮助人们作出判断,以便采取适当行动。
    3、挖掘:涉及到很多的算法,源于机器学习的神经网络,决策树,也有基于统计学习理论的支持向量机,分类回归树,和关联分析的诸多算法。挖掘的定义是从海量中找到有意义的模式或知识。
    海阔凭鱼跃,天高任鸟飞。对于进入这个行业的同学而言,你可以选择读研后再进入这个行业,也可以先就业,用你的工作经验弥补你的不足。大、分析或挖掘是实践性很强的学科,从实际工作中获取的知识和能力是你在学校里面无法学习到的,企业最终也是看重你的实际工作能力。

    浏览 191赞 57时间 2023-08-30
  • 肥肥来了啊

    • 分析与挖掘的目的不一样,分析是有明确的分析体,就是对体进行各个维度的拆、分、组合,来找到问题的所在,而发挖掘的目标体是不确定的,需要我们更多是是从的内在联系上去分析,从而结合业务、用户、进行更多的洞察解读。

    • 分析与挖掘的思考的方式不同,一般来讲,分析是根据客观的进行不断的验证和假设,而挖掘是没有假设的,但你也要根据模型的输出给出你评判的标准。

    我们经常做分析的时候,分析需要的思维性更强一些,更多是运用结构化、MECE的思考方式,类似程序中的IF else

    而挖掘大多数是大而全,多而精,越多模型越可能精确,变量越多,之间的关系越明确,什么变量都要,先从模型的意义上选变量(大而全,多而精),之后根据变量的相关系程度、替代关系、重要性等几个方面去筛选,最后全扔到模型里面,最后从模型的参数和解读的意义来判断这种方式合不合理。

    • 大感觉并不是量大,也不是复杂,这些都可以用工具和技术去处理,而是它可以做到千人千面,而且是实时判断规则。

      例如定向广告的推送,就是大,它根据你以往的浏览行为,可以准确的给你推相关的信息,基本做到了你一个人就是一个库,而不是一条。但我们所作的分析更多是针对体的,而非针对每个个人。

    所以大时代也显露出了各类问题,的隐私、熟、孤岛等,这也许就是我们目前看到大分析更看重的是技术、手段的原因。

    浏览 274赞 51时间 2023-06-13
  • 翻滚的石榴

    大概念:大是近两年提出来的,有三个重要的特征:量大,结构复杂,更新速度很快。由于Web技术的发展,web用户产生的自动保存、传感器也在不断收集,以及移动互联网的发展,自动收集、存储的速度在加快,全世界的量在不断膨胀,的存储和计算超出了单个计算机(小型机和大型机)的能力,这给挖掘技术的实施提出了挑战(一般而言,挖掘的实施基于一台小型机或大型机,也可以进行并行计算)。

    挖掘概念: 挖掘基于库理论,机器学习,人工智能,现代统计学的迅速发展的交叉学科,在很多领域中都有应用。涉及到很多的算法,源于机器学习的神经网络,决策树,也有基于统计学习理论的支持向量机,分类回归树,和关联分析的诸多算法。挖掘的定义是从海量中找到有意义的模式或知识。

    大需要映射为小的单元进行计算,再对所有的结果进行整合,就是所谓的map-reduce算法框架。在单个计算机上进行的计算仍然需要采用一些挖掘技术,区别是原先的一些挖掘技术不一定能方便地嵌入到 map-reduce 框架中,有些算法需要调整。

    大和挖掘的相似处或者关联在于: 挖掘的未来不再是针对少量或是样本化,随机化的精准,而是海量,混杂的大,分析是指用适当的统计分析方法对收集来的大量进行分析,提取有用信息和形成结论而对加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,分析可帮助人们作出判断。

    拓展:

    大(big data),指无法在一间范围内用常规软件工具进行捕捉、管理和处理的集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大时代》 中大指不用随机分析法(抽样调查)这样捷径,而采用所有进行分析处理。大的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

    浏览 249赞 146时间 2023-04-10
  • 正在缓冲1234

    去百度文库,查看完整内容>

    内容来自用户:天成信息

    大和分析区别
       大是指用现有的计算机软硬件设施难以采集、存储、管理、分析和使用的超大规模的集。大具有规模大、种类杂、快速化、价值密度低等特点(4V特性)。大的“大”是一个相对概念,没有具体标准,如果一定要给一个标准,那幺10-100TB通常称为大的门槛。     分析是一个大的概念,理论上任何对进行计算、处理从而得出一些有意义的结论的过程,都叫分析。从本身的复杂程度、以及对进行处理的复杂度和深度来看,可以把分析分为以下4个层次:统计,OLAP,挖掘,大。     大分析和分析是有区别和联系的。这里重点关注两者的是技术要求、使用场景、业务范围等方面的区别和联系。重点要区分理论研究和实际应用两方面区别和联系。    第一:在分析方法上两者并没有本质不同    分析的核心工作是人对指标的分析、思考和解读,人脑所能承载的量是极其有限的。所以,无论是“传统分析”,还是“大分析”,均需要将原始按照分析思路进行统计处理,得到概要性的统计结果

    供人分析。两者在这个过程中是类似的,区别只是原始量大小所导致处理方式的不同。     第二:在对统计学知识的使用重心上两者存在较大的不同    传统分析”使用的知识主要围绕“能否通过少量的抽样来推测真实世界”的主题展开。“大

    浏览 451赞 141时间 2022-12-26
  • cathy101012

    • 区别:大是互联网的海量挖掘,而挖掘更多是针对内部企业行业小众化的挖掘,分析就是进行做出针对性的分析和诊断,大需要分析的是趋势和发展,挖掘主要发现的是问题和诊断。

    • 释义:

    1. 大:指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大时代》 中大指不用随机分析法(抽样调查)这样的捷径,而采用所有进行分析处理。大的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)Veracity(真实性) 。

    2. 分析:是指用适当的统计分析方法对收集来的大量进行分析,提取有用信息和形成结论而对加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,分析可帮助人们作出判断,以便采取适当行动。
      分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际作成为可能,并使得分析得以推广。分析是数学与计算机科学相结合的产物。

    3. 挖掘:又译为探勘、采矿。它是库知识发现中的一个步骤。挖掘一般是指从大量的中通过算法搜索隐藏于其中信息的过程。挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

    浏览 463赞 152时间 2021-12-03

大数据、数据分析和数据挖掘的区别是什么?