特征处理实际是整个建模过程中耗时最多,实际也是最重要最有意义的部分,所谓巧妇难为无米之炊。当我们有了米该如何淘呢?那么变量分箱则是实现’模型稳健性’+’业务实用性’的一大杀器。
我最喜欢的分箱方法:对x直接建决策树,参考其分割点,结合业务背景微调成为想要的cutoff。
示例R代码如下:
1 | library(partykit) |
以上为工作中总结出的代码,屡试不爽,具体原理和和科学分析,且听下回分解…
hetal
特征处理实际是整个建模过程中耗时最多,实际也是最重要最有意义的部分,所谓巧妇难为无米之炊。当我们有了米该如何淘呢?那么变量分箱则是实现’模型稳健性’+’业务实用性’的一大杀器。
我最喜欢的分箱方法:对x直接建决策树,参考其分割点,结合业务背景微调成为想要的cutoff。
示例R代码如下:
1 | library(partykit) |
以上为工作中总结出的代码,屡试不爽,具体原理和和科学分析,且听下回分解…