1概念 大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,具有全样而非抽样、效率而非精确、相关分析而非因果分析的特点。2特征即 4V 特点,包括数据规模大(Volume)、数据种类多(Variety)、数据处理速度快(Velocity)、数据价值密度低(Value)。3数据结构包括结构化数据、半结构化数据和非结构化数据。4处理流程数据采集、数据预处理(数据集成、数据清洗、数据归约、数据变换)、数据处理与分析、数据可视化应用。5关键技术包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统等。6考点大数据的概念和特征:重点考查对大数据 4V 特征的理解和记忆,以及与传统数据的区别。数据结构类型要求能够区分结构化、半结构化和非结构化数据。处理流程了解大数据处理的各个环节,特别是数据预处理的相关操作。应用场景:结合实际案例,如智慧城市、数字政务等,考查大数据在不同领域的应用价值。






