例如,特征 A 和特征 B 的二次多项式交互为 A^2, A * B, B^2。sklearn.preprocessing:虽然这不是一个完全自动化的特征工程库,但 scikit-learn 的 preprocessing 模块提供了许多有用的预处理方法,如特征缩放、类别特征编码等。
其中,“梯度提升”这个概念,最早由 Friedman 在论文 Greedy Function Approximation: A Gradient Boosting Machine中提出,至今仍是经典算法之一。
论文题目:Mapping of machine learning approaches for description, prediction, and causal inference in the social and health sciences。