公司在Boss上主动联系的我,岗位是风险建模岗。部门属于第三方部门,主要业务有两块:车贷 反欺诈模型与保险反欺诈模型。目前在作的是如何从不可信的二分类标签数据集中更好地区分好客户与 坏客户。
约好面试时间是周三下午两点,到了之后先给了几张纸。第一张是基本信息,期望薪资,职业规划等。 第二页第三页都是笔试题,题量还挺大的。我作了大概有一个小时,同一个会议室还有另一个人来应 聘同一岗位。他来得早,做完比我早一点,就进去面试了。
- 第一题:建模的一般流程是什么?
- 第二题:如何处理缺失值?
- 第三题:逻辑回归算法需要不需要对数据标准化?有什么影响,实际使用中会存在什么问题?
- 第四题:T0时间买入一头小牛,从第五年开始每头牛开始产下一只小牛,问20年后,共有多少只 头牛?用Python代码实现。
- 第五题:最优级KS分箱及原理及实现。
- 第六题:示例代码使用后可能有什么问题?先对数据集分层抽样10份,再用随机森林来训练,得到 特征重要性,再求和。
- 第七题:WoE和IV的定义公式,计算示例特征的WoE与IV。
- 第八题:什么是参数与超参数,例举神经网络中的超参数。
- 第九题:模型性能的评估指标有哪些?选一个详细说明。
一个年纪在35岁左右的小哥来面试的我,对我太客气了,说他面博士有点紧张。
他带着我的简历,先问我现在的实习情况,是要在那边长待还是怎么的。然后是我的基本情况自我介绍。
然后是就笔试的卷子提问。
- 1. 为什么要标准化?如果不标准化会怎么样?如果不关心模型的性能,只是粗略的看一下模型结果,可以不标准化吗?
- 2.交叉熵损失公式?如果不记得可以讲下Gini系数公式。
- 3.看你有情绪分析的项目经验,使用过GRU吗?从几个门来讲一下LSTM的原理。
- 4.L1与L2正则化知道吗?讲一下。为什么可以用来特征选择?
- 5.逻辑回归的损失函数?
- 6.第四题没做是不会吗?
- 7.第五题确定吗?
- 8.第六题没做是不会吗?代码在干什么能看懂吗?
- 9.如果有这样一个问题:有个二分类的数据集,有些标签实际上是错误的,怎么改善这个数据集的标签呢?
面试时问到了一基础原理及些公式,没答上来。比如:LSTM的门原理,交叉熵公式,Gini系数公式, 逻辑回归的损失函数,woe公式,IV公式等。
应该对各种模型的公式推导加强一下,还有各种损失函数等,总之基础!!!其次要修改简历,没把握 的就少写的。除了上述机器学习的内容,深度学习的部分针对不同的岗位决定写不写,复习深度学习的 内容。