Skip to content

参数说明(中文版本)

Hengzhe Zhang edited this page Feb 22, 2022 · 1 revision
参数名称 解释 建议策略
演化算法类参数
n_gen 演化代数 演化代数越大,拟合效果越好,拟合时间越长
n_pop 种群大小 种群大小越大,拟合效果越好,拟合时间越长
cross_pb 交叉概率 建议大于0.9
mutation_pb 变异概率 建议小于0.1
select 可选'AutomaticLexicase'或'Tournament-数字' 数据量超过一万条情况下可以使用Tournament以减少运算时间
遗传编程类参数
gene_num 每个遗传编程个体包含的特征数量 特征越多,拟合效果越好,拟合时间越长
boost_size 集成模型的数量 影响不大
max_depth 特征树的最大高度 特征树越高,越可能搜到更高阶的特征,但是会降低可解释性
base_learner 可选Random-DT、DT和RidgeCV 建议都尝试一下,Ridge和DT能处理的数据场景不太一样
Clone this wiki locally