大数据是一个多主词,请在下列义项上选择浏览(共1个义项)
大数据
数据经济的基础概念和制度
作为数据的类型,大数据是用来描述大型数据集的术语。
定义

作为数据的类型,大数据是用来描述大型数据集的术语。

大数据是指以指数级增长且能被相关组织收集的大型数据集。大数据被归纳出三个通常被称为“3V”的特点,具体指:体积(数据量),速度(收集和分析数据的速度),和种类(结构化或非结构化的格式或类型的数据,如事务或行为)。

大数据一定有来源,可以追溯或关联特定的主体,是基于人、物和组织在特定时间和地点从事的行为、发生的活动或事件等而实时记录形成的数据;从其最初形态上,大数据是网络、传感器、智能终端或设备对各种主体和客观现象的采集和记录的结果,而不是人创作、制作或加工的结果。大数据是原材料性质的数据,碎片化的数据价值极低,但通过汇集一定量的数据进行关联分析,可以挖掘分析特定对象的特性、规律或趋势,由此形成区别于传统的人类创制成果(信息产品、科学文化产品),成为另一类知识来源。

作为一种数据形态,大数据有两个基本特征:其一,它不是人类观察、测量、计算所形成的对自然和社会现象的客观描述或记录,而是利用信息和通信技术(网络设备、传感器、智能设备等)生产出来的描述特定对象和客观现象的数字化记录;其二,它不是人类自身识读分析的对象(材料),或者由于人类直接识读分析的可能性极低而逐渐演进为大数据分析,使人类具有处理和分析海量数据所能力,这便是大数据挖掘分析技术(本质为数据的智能分析,更流行的说法是人工智能)。

从技术的角度,大数据是以数据化方式观察和分析由人、组织、物和客观世界的一种工具。利用各种工具采集和收集数据,设计各种算法模型分析数据,服务于科学研究、社会治理和企业经营活动即是大数据技术的应用。在大数据时代,原来由人观察世界所收集形成的数据可以忽略不计了,大数据成为我们这个时代数据的主流。

为了更清晰描述数据时代的数据,数据实际上应当区分元数据(metadata)和数据(data)。这里的数据实际就是人创制的有意义的信息的数字化表现,一个信息片段,测量或观察数据,事件描述或故事等等。简单地讲,数字化的信息(数据)就是人可以视读、分析和应用的数据。在网络普及和万物互联时代,任何网络呈现的信息内容背后都有数据予以描述,于是产生了元数据。元数据是描述数据,揭示数据关系的数据,有助于确定数据的性质和特征(参见百科:元数据)。元数据是大数据分析、人工智能应用的基础,是最为重要的数据资源。

 

 


参考资料
基本信息
  • 大数据
  • Big data
词条统计
  • 浏览次数
    3652次
  • 最近更新
    2021年01月05日