现在互联网公司还有做特征工程的工作吗?

您所在的位置:网站首页 component可数嘛 现在互联网公司还有做特征工程的工作吗?

现在互联网公司还有做特征工程的工作吗?

2023-04-15 07:38| 来源: 网络整理| 查看: 265

我分别在银行,电商和游戏行业待过,也都做过数据挖掘,算法这块的工作。目前来说,特征工程的工作还是必须要做的,而且占据的工作量仍然是比较大的。甚至还有一些公司专门有用户画像算法工程师的岗位。

从数据的形态来讲,贴源层或者埋点类的数据是不好在业务场景中直接使用的。运营人员在筛选客群时也是需要有客群标签的。这就需要公司有配套一个比较好的用户画像体系。这个画像体系怎么来的?你不能指望数仓人员去做,毕竟他们对业务并不敏感,从我个人在三家公司待过的感受来看,他们做出来的各种聚合标签通常很难满足业务需要的。还是需要数据分析师,数据挖掘师等在解决业务问题中不断积累沉淀的。好的画像很难凭空产生。这块算不算特征工程呢?其实也算的。而且这种一般都是具有高度业务含义的标签,通常我也会把这些标签放到模型里。

针对算法工程师来说,我们经常需要针对特定的场景建模,常规的标签体系是无法涵盖这些特定需求的,也就意味着我们经常需要基于该场景去进行特征工程。这一块的衍生并不强行要求具备高度的业务含义,所以在指标挖掘上可以采用相对暴力的衍生方法。当然,如果能独具匠心的设计出一些非常好的指标,那就更好不过了。

如果从算法发展历史来看,传统机器学习时代其实是非常强调要有好的特征的,以及特征之间的交叉也是要设计好的。到了深度学习时代,以推荐算法为例,一般会将特征的交叉工作交给模型,很少再自己耗费太多脑细胞去设计各种复杂特征了。这块包括基本的DNN隐性特征交叉,以及各种显性特征交叉的模型结构(如dcn,deepfm,autoint等),还有以阿里din系列为代表的兴趣提取方法。即使如此,深度学习其实也没放弃最初的特征工程。

总的来说,特征工程这块其实在任何公司都还是需要的。只不过目前不会像传统机器学习时代那么夸张的去做标签了。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3