Skip to content

Latest commit

 

History

History
33 lines (26 loc) · 609 Bytes

Todo.md

File metadata and controls

33 lines (26 loc) · 609 Bytes

实验列表

  • spark hello word(done) 见RDDTest

  • 普通过滤

    • 属于/不属于(done)
  • top n 过滤

  • 新增列

  • 类型改变

  • 自定义数据源,数据源(文件,内存)

    • 自定义RDD(done)
    • 把内存数据源放到spark里面进行运算(done)
    • 数据库数据源
      • mysql
  • 集群环境使用

  • 阶段性任务

    • 功能
    • 性能
      • 集群引入
      • 索引引入
      • 压力测试
    • 功能
      • 功能的完善性
      • 功能的扩展性
      • 功能的稳定性
    • 辅助
      • 辅助信息
      • 性能分析实例