学院动态
首页 > 学院动态 > 正文
大数据分析与处理平台
时间:2021-03-22

大数据分析主要通过各种算法和数据分析工具对海量的数据进行处理和分析,挖掘出数据之间的相关性以及各种有用的信息,协助用户做出更好的决策。本期推文给大家介绍一下大数据分析的一些常用工具。

PART-01

Hadoop

2021 NEW PLAN

Hadoop是一个能够对大量数据进行分布式处理的软件框架。Hadoop以一种可靠、高效、可伸缩的方式进行数据处理。Hadoop是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop是可伸缩的,能够处理PB级数据。Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。

PART-02

Storm

2021 NEW PLAN

Storm是自由的开源软件,一个分布式的、容错的实时计算系统。Storm可以非常可靠的处理庞大的数据流,用于处理Hadoop的批量数据。Storm很简单,支持许多种编程语言,使用起来非常有趣。Storm的处理速度惊人:经测试,每个节点每秒钟可以处理100万个数据元组。Storm有许多应用领域:实时分析、在线机器学习、不停顿的计算、分布式RPC(远过程调用协议)、ETL(Extraction-Transformation-Loading)等等。

PART-03

SPSS

2021 NEW PLAN

SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析等几大类。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。

PART-04

Tableau

2021 NEW PLAN

tableau是一个可视化数据分析平台,致力于帮助人们查看并理解数据,帮助任何人快速分析、可视化并分享信息。它的程序很容易上手,各公司可以用它将大量数据拖放到数字“画布”上,转眼间就能创建好各种图表,任何人都可以使用这种可视化分析,拖放即可查找趋势和异常值,轻而易举的深入挖掘数据,使用汇总等快速表格分析功能得出更宏观的映像。


PART-05

FineBI

2021 NEW PLAN

FineBI是一种自助式BI专用大数据分析工具,是一种用于大数据分析的完善产品。它有多种多样的嵌入数据图,大家可以拖动想要分析的数据到作业区,以制作数据图。此过程不需要编码。FineBI能用以快速分析工作流程的数据信息,制作汽车仪表板或构建大屏显示器。它更适合企业,可以与互联网大数据综合服务平台和各式各样多层次数据库查询一体化,因此在企业中得到普遍应用。

本期图文:陆林花曾家鹏(师)

本期编辑:人工智能学院黄婉婷

本期责编:欧阳林艳(师)