数据探索--华为FusionInsight--华为开发者社区

数据探索
功能特点

自助取数

用户从数据中心通过检索、自助加工等方式,自助式、可视化、方便快捷地获取、查看、下载和分享需要的数据集。

快捷式应用

通过开放的数据查询服务、预置的页面控件、声明式的控件开发能力,为客户新业务分析专题、个性化的查询及展现需求提供简单易用的应用开发、应用部署工具。

一站式探索

基于高性能的数据查询、丰富的可视化控件,针对业务问题诊断提供统计类分析能力,针对业务发展提供了根因分析、预测等挖掘类分析能力,一站式完成业务问题的分析。

人性化推荐

采集用户在数据获取、探索分析中的操作日志,通过机器学习获取到用户的使用习惯、操作规律,为用户数据获取、探索分析提供推荐服务。

功能视图
功能描述
  • 智能数据探索收起
    • 数据集探索
    • 通过数据获取特性提取数据集后,用户可以直接拖入待分析的数据,查看和切换系统自动生成分析图表,快速便捷地探索数据的规律。

    • 智能分析推荐
    • 系统预置图形自动推荐原则。用户可以图形,再根据数据特点推荐适合的过滤条件、分析方法和可视化图形

    • 多种能力探索
    • − 过滤

      在可视图形(包含地图)上使用过滤来查看需要关注的数据。

      − 下钻

      可以新增级别,在多种图形(包含地图)上通过面包屑的方式逐级查看数据。

      − 排序

      图形和表格控件支持升序、降序排列。

  • 可视化数据分析展开
    • 通过数据获取特性提取数据集后,用户可以根据需要自主选择分析和展示的工具,通过简单的拖拽实现对数据集的可视化分析。

    • 数据集分析
    • 支持从数据模型取数和特征取数获取的数据集进行可视化分析,可以针对多个数据集进行分析。可以对已经完成的探索分析结果,继续进行可视化数据分析。

    • 过滤条件设置
    • 图形化控件支持设置过滤条件,拖放数据项时设置。

      设置过滤条件

    • 多种分析能力
    • − 过滤

      在可视图形上使用过滤来查看需要关注的数据。

      − 排序

      图形和表格控件支持升序、降序排列。

  • 多种可视化图形展开
    • 面向业务人员的探索分析支持的展示图表如表所示。

      • 图形类型
      • 图形样例
      • 柱状图
      • 堆叠柱状图
      • 条形图
      • 堆叠条形图
      • 折线图
      • 饼图
      • 散点图
      • 气泡图
      • 面积图
      • 交叉图
      • 矩形树图
      • 二维表
      • 地图

      面向业务人员的探索分析支持的展示图表

  • 数据提取展开
    • 当前业务运营部门的数据提取多依赖于IT支撑部门通过后台编码的方式获取。数据提取流程繁琐,临时需求得不到及时响应,数据提取后往往无法直接供深入分析使用。同时,临时或繁多的数据提取需求也给IT支撑部门带来沉重的支撑压力。

      随着日益增长的数据量,灵活多变的分析需求,数据提取越来越难以满足业务运营人员的诉求。

      “数据提取”模块,帮助业务运营人员摆脱对IT支撑部门的依赖,可通过图形化界面自助获取需要的数据。

    • 基于数据模型取数
    • 基于大数据分析平台中已有的数据资产定义及数据资产间关联关系定义,提供数据模型检索、关联关系、过滤和输出能力的数据提取。

      − 模型检索

      支持基于模型树选择模型,也可以通过全文检索的方式,检索模型的名称、描述、字段名称、字段描述信息。

      − 模型关联

      设置数据模型之间的关联关系,将数据组织到一起,以便获取关联的数据字段信息

      − 数据导入

      支持直接将待处理的数据导入平台,进而提取数据和分析数据。支持.txt和.csv的格式的文件。

      − 数据预览

      在设置模型间的关联关系、模型的输出字段及过滤条件后,可以预览数据。预览数据的过程中支持停止当前预览任务。支持样本数据和原始数据的预览功能。

      − 数据过滤

      过滤功能用于进行数据的筛选,提炼出对当前业务场景有意义的数据。提供高级过滤功能,用户可以灵活的设置优先级,组合多个过滤条件之间的关系,如“并且”、“或者”。

      − 数据集生成

      根据设置好的过滤条件和输出字段,可以从后台生成数据集。当设定了时间为周期数据时,支持按照周期对数据进行刷新。

      − 输出字段设计

      获取模型指定列的明细数据,同时也支持对数据进行一定的汇总和计算,选出用户感兴趣的数据。

    • 基于特征取数
    • 跨多个域按照业务实体来组织和构建特征层的元数据,业务人员基于特征层实现特征的数据过滤、特征字段输出能力。

      − 特征过滤

      特征过滤的表达式支持组合后进行“并且”、“或者”的计算。支持设置特征过滤表达式的优先级。

      − 特征输出

      支持宽表的特征输出。以用户特征为例,支持用户号码作为主键输出用户的画像。

      − 特征推荐

      对于热门、业务人员本人常用的特征,自动推荐到导航区域展示。

      − 新特征计算

      支持基本的行级的运算。如加减乘除、取绝对值、取整、取余、四舍五入、填充、裁剪、替换、大小写转换、时间、字符串转换

    • 数据集共享
    • 基于数据模型和特征中设置的过滤条件和输出字段生成数据集,可下载或导入导出数据集,并分享给用户和角色。

      − 数据集导入导出

      支持将数据集的配置信息,即基于模型和特征的取数规则导出到本地,根据需要导入并获取数据集。

      − 数据橄榄和分布

      取数完成的数据集,支持查看数据的详情和分布情况,包括最大值、最小值、平均值、空记录数、有值记录数和方差,支持简单的柱状图展示数据分布情况。

      查看数据分布

      − 数据下载分享

      提取完成的数据集支持下载到本地。数据集支持分享给其他用户和角色,被分享的用户和角色有查看和下载数据的权限。

      − 数据集监控

      可在“系统管理 > 数据集监控”页面查看数据集的执行状态。

  • 应用开发展开
    • 应用开发模块提供在线的、所见即所得的、图形化的报表设计界面,用户无需任何SQL基础,即可依据业务诉求,随意组合维度和度量,设计出想要效果的可视化报表。

  • 报表应用开发展开
    • 支持在线数据建模到可视化效果设计完整的报表开发过程,包括:

    • 基础元数据定义
    • 元数据建模面向不同的物理数据源。通过配置数据源,将图片展示引擎和业务数据库相连。

    • 报表数据建模
    • 报表建模提供在线的、WEB化的数据建模能力。选取目标数据库中所需数据对象,在物理数据库和报表之间建立一层数据模型,供设计报表时使用。

    • 可视化效果设计
    • 系统预置丰富的可视化图标控件,在设计报表时您可以选择不同的图表,以获得更直观的数据显示效果。

      可视化效果设计

  • 仪表盘设计展开
    • 仪表盘能够可视化地展现用户关心的、具有重要影响力的数据,有助于用户对业务数据进行判断、监控并支持经营决策,从而有效地提升信息系统的实时信息处理能力。

      设置过滤条件

  • 多维分析展开
    • 可以帮助客户及时定位出业务数据发生异常变化的根源,找到业务指标上升和下降的真正原因,协助用户进行业务调整工作。

  • 资源管理器展开
    • 资源管理器作为管理应用资源的容器,是查看和创建应用资源的统一入口。

  • 应用发布展开
    • 用户对数据集进行探索分析后,可将固化的分析结果发布到应用市场,分享给其他角色和用户。

    • 发布
    • 将固化的分析结果发布到应用市场。仅支持将探索分析的结果发布到应用市场。

    • 分享
    • 将已发布的应用分享给其他角色和用户。

    • 导入导出
    • 将应用配置,即探索分析配置信息导出到本地,根据需要导入并获取应用数据。