个人描述

5年互联网金融行业机器学习实战经验,从无到有建立过线上o2o消费分期风控架构, 搭建贷后资产评估体系和智能催收架构,稳定准确预估不同账龄资产包价值。能根据不同的业务模式和数据情况进行业务建模

教育经历

M.S. 数据挖掘

2013.09 - 2016.01
中国科学技术信息研究所
  • 担任研究生会主席
  • OSGi的大规模语义计算平台
  • 两篇中文核心一篇EI论文。
  • 知识组织和机器学习方向

B.SC. 信息安全

2009.09 - 2013.06
中南大学

计算机相关课程:数据结构,操作系统,数据库,计算机网络。

信息安全相关课程:密码学,信息学,病毒攻防。

工作经历

算法专家

2017.02 - 至今
北京智融时代信息技术有限公司

不良资产处置策略负责人。团队8人:3架构,3算法,2分析。2018.07 ~ 至今

  • 对于多源数据采用CBM方式建模,保证子模型模块的扩展性和稳定性。
  • 提供AutoML框架Diego,提供自动的预处理、调参、模型融合,把单模型 base auc提高了4个点。
  • 对催收序列进行了序列建模,利用自编码器很好地编码了催收强度序列,极大提高了1日回款预测准确率,提升了各阶段AUC。

分期商城项目风控负责人。团队4人:3算法,1分析。2017-11~2018-06.

  • 对于多数据源提出Cluster-Based-Model,验证了1.数据源聚类情况;2.各聚类数据集分模型训练后进行融合的结果优于base;3.验证随机下线数据源带来的稳定性影响。
  • 业务早期探索了小样本学习、业务线间模型迁移,利用SquareGAN进行样本生成,在业务上线初期达到了其他业务线同等模型能力。

续贷用户风控算法。 2017-02 ~ 2017-10

  • 利用doc2vec将用户订单进行语义编码和订单序列的语义表达
  • 通过语义关系进行用户分群建模(关键点:订单属性的选择影响表达和聚类;用户表达序列的不定长)

其他产出

  • 参与机器学习框架Conan的开发。职责:0.基础数据结构优化 1.树分桶 2. 多层EnsembleNet 3.自动调参 4.LUS采样
  • faker_flask: 快速api接口服务搭建。后迁移到新项目alfa,async flask-like api。
  • 搭建基础数据框架:基于oss的特征异步存取、任务管理框架、支持DAG的任务流框架airforce,实现模型自动更新。
  • 贷后策略流服务:负责催收分案、案件流转、话术推荐、征信实体抽取、甲方案件评估

机器学习工程师

2016.01 - 2017.02
北京闪银奇异信息技术有限公司
  • 负责开发维护o2o业务的打分策略和模型,通过特征工程和引入bayes优化进行gbdt的自动调参,提高了4个点的AUC,去除了80%人工信审,降低首逾
  • 开发和维护运营商/短信接口,利用实体抽取、关系抽取等,优化信审报告。
  • 基于社群的中介挖掘,反欺诈召回高于原人工、规则2倍,召回客户群组坏账率30+%

机器学习工程师

2015.06 - 2016.01
北京至信普林信息技术有限公司
  • 大成基金全球产业指数建模,特种工程和指数方向模型。离线最高浮盈130%,回测小于5%。项目成功验收。
  • 信元手机保障产品项目:信元用户画像;scrapy的app爬虫;对用户app描述进行文本分类。一层分类F值能达到0.98,较差的能达到0.78+, 均值0.85。项目验收

Projects

diego - 一个支持快速搭建自动学习任务的框架。只需要创建自动学习研究(Study),同时生成相关子实验(Trials),然后运行,便能的得到一个机器学习模型。采用Scikit-learn式的API进行实现.
qqmusicbox - qq音乐命令行版本