素年锦时

技术的伟大之处,就在于把抽象的知识与思想,予以具象化、可视化。

评分卡建模(三)逻辑回归模型建立与模型评估

scordcard logistic Regression and result verification

1 关于逻辑回归 计算的目的不在于数字,而在于洞察事物。 经过了漫长的数据预处理和特征工程过程,终于到了数据建模阶段。正如上面那句话:计算的真正目的不在于数字,而在于洞察事物。这句话其实也可以非常好地诠释我们为何要建立模型了。我们建立模型的目的就是为了洞察数字背后蕴含的事物。 适用于评分卡的模型比较多,如逻辑回归、线性回归、决策树等。逻辑回归是最常用的一种模型,这大概与它的算法...

评分卡建模(二)特征工程

scorecard's feature_engineering

引言 通常而言,特征变量要经过从长变量列表(long list) 到短变量列表(short list)的过程。其实这个过程的核心就是特征工程了。 长列表就是在评分卡模型开发之前,数据源提供方将与业务相关的数据中所有变量列为一个长变量列表,供建模时选用。顾名思义,这个长变量列表会非常长,里面的变量甚至有成百上千个,实际进行评分卡建模时不可能全部使用。这个时候就会根据实际业务对特征变量进行分...

评分卡建模(一)数据分析与数据预处理

基于Kaggle Give Me Some Credit 项目

A loading computer is an effective and useful tool for the safe running of a ship. However, its output can only be as accurate as the information entered into it. — MAIB, SAFETY FLYER Hoegh...

使用Github Pages建独立博客

jekyll 搭建博客教程

原作者beiyuu.com的博客,搭建github pages时参考了一下,写的挺详细,保留了,并在此向原作者表示感谢 Github很好的将代码和社区联系在了一起,于是发生了很多有趣的事情,世界也因为他美好了一点点。Github作为现在最流行的代码仓库,已经得到很多大公司和项目的青睐,比如jQuery、Twitter等。为使项目更方便的被人理解,介绍页面少不了,甚至会需要完整的文档站,Gi...