UDP 是百分点集体的一个平台级产品, 目前已经服务多家客户, 本项目的目的是提供相关的资源及其操作流程, 以方便产品演示使用
UDP Demo 项目的目标是提供一个可操作的过程来对部署好的 UDP 系统进行验证,这里的验证会覆盖 UDP 主要的功能,对于如何部署、使用则不会做介绍
- 在验证之前或者过程中,请详细参阅 UDP 团队提供的
部署手册
,使用手册
- 需要对本文档提到的
验证矩阵汇总
进行逐一验证并进行反馈 - 本文档提供了核心的场景描述,用户需要根据
场景介绍
提到的内容进行操作,并及时反馈操作中遇到的问题
- 请仔细走完下面的场景,并及时反馈
- 每个模块的操作参考
使用手册
- 注意: UDP 的用户分为管理员和非管理员(又分为租户管理员和非租户管理员)两类,验证不同的功能的时候,需要以不同用户登录
模块 | 子模块 | 说明 | 检查结果 |
---|---|---|---|
队列同步 | 修改 hadoop yarn 队列,通过后台脚本可以将队列信息同步到 UDP 中,然后租户的配置中,在选择队列时,是可以查看到新的队列信息的 | ||
租户管理(管理员) | 用户管理 | 注意,新增用户不能在禁用用户列表[swordfish 部署文档](https://github.com/baifendian/swordfish/wiki/deploy] 中的 prohibit.user.list 配置 |
|
租户管理 | 参考 使用手册 |
||
日志审计 | 用户登陆,以及系统中的写操作都应该会有详细记录 | ||
租户管理(非管理员) | 租户信息 | 参考 使用手册 |
|
用户管理 | 参考 使用手册 |
||
项目管理 | 我的项目 | 参考 使用手册 |
|
项目管理 | 参考 使用手册 |
||
模型开发 | 模型数据源 | 忽略当前环境没有的数据源,如 postgres | |
主题域 | 参考 使用手册 |
||
逻辑模型 | 参考 使用手册 |
||
物理模型 | 参考 使用手册 |
||
表管理 | 参考 使用手册 |
||
数据开发 | 数据源设置 | 忽略当前环境没有的数据源,如 postgres | |
资源管理 | 参考 使用手册 |
||
函数管理 | 参考 使用手册 |
||
即席查询 | 要测试到自定义函数 | ||
流任务开发 | 覆盖所有的任务类型 | ||
工作流开发 | 覆盖所有的任务类型 | ||
运维中心 | 概览 | 参考 使用手册 |
|
工作流调度 | 调度周期要测试到 月、周、天、分钟,并观察是否定时运行 | ||
工作流日志 | 参考 使用手册 |
||
流任务日志 | 参考 使用手册 |
||
数据视图 | 概览 | 参考 使用手册 |
|
数据地图 | 参考 使用手册 |
||
数据管理 | 数据库管理 | 参考 使用手册 |
|
权限管理 | 需要测试到库、表、字段级别的所有权限粒度,结合即席查询查看权限是否生效 | ||
数据质量 | 参考 使用手册 |
下面数据集来源于互联网,用户可以自行下载
温度
表
属性 | 类型 | 描述 |
---|---|---|
dt | date | 日期 |
average_temperature | double | 平均气温 |
average_temperature_uncertainty | double | 平均气温浮动大小 |
city | string | 城市 |
country | string | 国家 |
latitude | string | 纬度 |
longitude | string | 经度 |
year | int | 年份 |
获奖记录
表
属性 | 类型 | 描述 |
---|---|---|
year | string | 年份 |
ceremony | int | 典礼 |
award | string | 奖项 |
winner | int | 获得者 |
name | string | 获奖者名字 |
film | string | 电影 |
- 请仔细走完下面的场景,并及时反馈
- 下面的场景, 以 u_bloxy 账号运行, 所在项目为 p_bloxy, 租户为 t_bloxy
说明: 演示整个建模、建表的过程, 以及执行一些数据探查、质量校验, 整个过程中, 可能会遇到权限问题, 需要解决相关的授权
说明: 演示整个工作流的基本使用, 以及调度配置
说明: 演示流任务的基本使用
说明: 演示 "可视化" ETL 的基本使用
场景 | 子场景 | 说明 | 检查结果 |
---|---|---|---|
场景一 | 模型开发 | ||
数据上传和查询 | |||
数据质量 | |||
场景二 | 工作流及调度配置 | ||
场景三 | 构建 Spark 流任务 | ||
构建 Storm 流任务 | |||
场景四 | 可视化 ETL 任务 |
- 工作流发布失败,提示依赖资源未发布
在数据开发 -> 资源管理
将依赖资源进行发布
- 导入数据失败,HDFS或者Hive表无权限
在数据管理 -> 权限管理
里申请相关 Hive 表和 HDFS 路径的权限