在互联网大数据时代,全社会信息化程度越来越高,无处不在的网络将人和设备连接在一起,用户的一切行为都是可追溯和分析的。
而互联网信贷具有小额、分散、高频、无抵押和利息跨度比较大的特点,所面对的客户一般是年轻一族,消费观念超前、无信用记录。如何利用大数据精找到精准的客群,优化逾期率,也成为金融风控的重中之重,也贯穿了客户生命周期的始末。而精准的客群,离不开精准的用户画像。
什么是用户画像
用户画像,即将用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。
通过这些常规的标签,我们可以构建出以上的画像,大致知道该用户的生活状态、收入和支出水平是否稳定。
此外,相信有丰富建模经验的童鞋都会用一些趋势上的分析方法来增加模型的维度,比如:
l随着手机号使用年数的增加,客户稳定性增加,违约风险逐步降低;
l过去12个月内所有类目本地生活消费等级越高,违约风险越低;
l最近12个月网络游戏消费金额越多,违约风险越高;
l最近12个月内财经媒体访问天数越多,违约率风险越低;
l习惯在深夜进行网络消费的人群,违约风险更高;
l……
除此之外,随着智能手机和互联网的发展和普及,用户下载使用的手机APP也能为我们提供大量真实的数据,帮助我们构建更全面的用户画像,并获得不同画像的行为预测,为企业信贷护航。
看到这,估计好学的小伙伴心里会有疑惑,这么好用的数据,要怎么获取?怎么去服务于业务?手机APP那么多,用户数据那么大,有什么算法可以高效提取吗?
给心里已经想到这些问题的小伙伴们点个赞,不要着急,请接着往下看:
如何获取用户的手机APP数据?
当前手机App数据主要包括:App安装包名称、App中文名、App安装列表、App安装序列。为便于区分,常把App中文名记为app_name,App包名称(package)记为pkg_name。其中pkg_name是App的唯一ID,app_name则因为下载渠道、版本更新、数据采集等因素影响导致不唯一。
已经有了App数据,接下来就是思考怎样提取特征?提取特征有几种思路:1)使用分词(比如jieba、TextRank)、word2vec训练词向量等文本处理算法来提取特征。
2)通过对APP分类后,可以根据不同的时间阶段中用户下载各类APP的数量及占比来进行分析。
3)根据APP名称的关键词和历史逾期表现进行分类
4)概率建模
那么,手机APP那么多,用户数据那么大,有什么算法可以高效提取吗?卖个关子,感兴趣的小伙伴请回顾 2020年9月26号 的番茄学院星球课堂直播,Tony老师将把自己在手机APP特征工程中的知识和经验毫无保留分享给大家,欢迎一起来学习吧!
要课程视频的同学可添加番茄风控学院班主任微信:xiaofan20206666,小番私发~
我们坚持为大家带来输出系列风控干货内容,更多金融风控内容及相关资讯,欢迎广大风控爱好者关注:番茄风控大数据
上一篇:我理解的大数据