• 回答数

    4

  • 浏览数

    287

小熊饼干
首页 > 医药类考试 > 如何成为一名合格的风控算法工程师?

4个回答 默认排序
  • 默认排序
  • 按时间排序

摧破肝胆

已采纳
1分钟前发布 -【如何成为一名合格的风控算法工程师?】http://www.sdrsks.org/ask 11月12日讯: 如何成为一名合格的风控算法工程师?“风控算法工程师”这个职位按字面意思可以拆成3个词:风控、算法、工程师,对应的能力就是业务知识、算法理论、编程能力。如果经过一定时间的学习和培养你在这三个方面还有特别明显的短板,那很难称之为“合格”。1. 业务知识熟悉业务知识是基本功。了解业务才能够建立实际可用的模型,目前还不存在解决所有问题的万能算法,还是回到现实,从业务学习开始。互联网金融领域有着非常丰富的业务场景,同时它和传统银行业务场景差别非常大。用户没有面签不直接见面,依赖的数据是弱数据、大数据,是数据和技术驱动的业务场景,但这并不代表你不需要去理解业务的内涵。每一个现实场景就是一个应用题,作为算法人员需要理解题干,从场景中抽象出需要解决的问题,将它翻译成算法问题,然后再使用合适的算法去解决它。很多时候对业务问题的理解和抽象,相当于在设定模型开发的大纲。比如在白条场景中,我们想要预测授信用户的信用风险,我们首先就需要考虑以下问题:我们要观察多久的订单?逾期多少天才算坏用户?逾期定义中是否需要考虑金额限制?好用户怎么定义?需不需要考虑样本不均衡的问题?为了保证模型的稳定性如何进行窗口验证比较科学? 针对业务的一些变动,比如订单制和账单制的调整,我们如何去修正模型的目标变量?总之基本的信贷概念和业务模式是必须去了解的,有助于你设计开发大纲。除了大纲,风控模型的开发也需要知道业务细节。这在Y变量定义,X变量加工,模型评估都会涉及。以Y变量定义为例,一般金融行业会把样本分为四部分:G(好用户);B(坏用户);I(不确定用户);E(剔除用户)。实操中对这四个群体通常会有不同定义的微调。有的时候是从算法角度考虑,但更多时候是从业务需求角度考虑。预测用户未来的白条消费金额,止付用户就会被划入E类用户;预测欺诈用户,因为样本很少,信用风险用户也被划入了B类坏用户。X变量除了根据业务知识挑选数据源外,更多时候业务知识指导特征构造。这里我插一句,不要轻视特征工程,特征工程仍然是非常重要的内功,不是你搞一个深度学习框架就可以解决一切。金融行业的业务复杂通常和时间挂钩,必须掌握业务概念的细节。对于白条业务,就有下单,到账,应还款,实际还款,最低还款,逾期,退款等一系列细节概念,它们都是在一个时间轴上的,特征加工很讲究这些细节。只有清楚这些概念,而且知道这些行为如何产生和被记录,才能够构造相关的有效特征。好的特征不但可以提高模型效果,也便于从业务上把握模型的跨时间有效性。业务场景很多时候还决定了你模型效果评估的方式,因为业务很灵活,可以做到有取有舍。有些场景需要模型是为了在误杀尽可能少的情况下抓住更多的坏人;有些场景需要模型需要有更好的排序能力但并不注重绝对值预测;有些场景需要模型需要有很准确的数值预测。了解场景,挑选合适的评估方式,才能够构造出合适的模型,当然争辩是免不了的。2.算法首先,算法很多,没有人能够面面俱到,重在基本功。对于转行的同学,推荐两本入门的基础读物:周志华的“西瓜书”和李航的“蓝皮书”。作为算法工程师,对算法本身在公式的层面并不一定像考试那样需要死记硬背。比如工作中不会有人问你LBFGS算法对于海森矩阵是怎么估计的的(即便在面试中背出来都未必是加分项)。但是,LR的基本公式,SVM的基本原理还是需要去熟练掌握。对各个算法的优缺点、适用范围以及可能失效的场景需要了熟于胸,某种程度上算法掌握深度和灵活度跟场景以及场景下数据很有关系。企业工作时风控算法工程师的典型工作是在面对场景需求进行建模,理论深度是有一定必要的。因为实际工作没有时间让你研究理论,但是需要你掌握理论。算法工程师搭建算法模型的时候,往往没有充分的时间去扫参调优,于是这会导致与在学校的时候建模发paper是完全不同的工作模式。需要考虑的可能更应该是算法的鲁棒性,即算法模型在数据和计算环境一定幅度的波动下,仍然能够保持稳定的工作。不然的话,支持线上工作的算法模型一旦崩溃,轻则是大半夜不定的报警短信把你招到公司改bug,重则是造成重大财产损失——想想某业务本来大体只会授信一半的用户,结果被奔溃的模型完全放行了……这将会是什么画风?因为没有太多的时间扫参数空间,所以最好对于各个常用模型的“性能”以及主要工作的参数空间有一个清晰的概念。这意味着,你不能像以前在学校一样,对于每个模型都用效果最佳的参数,而需要“常见”的参数,去实现基本的业务功能,日后业务方有需要再去优化。工程上,过度的算法“洁癖”和“强迫症”都会耽误很多事情。特征工程还得再强调一遍,虽然它看上去不像理论那么高大上,但其实很多时候模型效果还就得靠那么一点特征工程作为作料。在算法里面我们更强调特征工程的一些处理手法和技巧,比如点击流数据的处理方法,怎么设置窗口,一些缺值数据的处理技巧,噪声数据的去除等,都能提升模型的效果。而且这其实有其近乎“艺术”的一面,正所谓“戏法人人会变,各有其奥妙不同”。评价指标要选好,评价指标的坑很多,并不是说当你建好了模型之后,算一算precision、AUC、KS、F-measure就好了。要对这些指标的原理,特别是局限性了然于心。再强调一遍,特别是他们的局限性!甚至有时候你可能需要自己组合设计一些指标,来更好适应你的问题。关于深度学习框架,目前各大厂小厂都在积极尝试,但是尚且没有全面推开在金融领域,我们在某些环节使用这些技术,同时也在向业务方普及这些技术。深度学习作为趋势,日后广泛应用是一定的,所以我们坚定看好它。传统概率论和数理统计方面的知识也不能丢。即便我们不去参与贝叶斯派和频率派的撕逼,古典概型在考虑问题的时候也很有用。另外还有诸如随机变量及其分布、随机过程、大数定理、中心极限定理等等。毕竟,金融产品的普遍是建立在人们对“未来”的预期上的,而这一过程则需要基于概统来理解。3.编程首先,总的来说,算法工程师需要的是处理大数据和实施高性能计算。这在工程层面有多种实现方案,下面简单罗列一下常见的部署场景,大家可以各自去攀相应的科技树:• 在数据层面,sql必不可少。可以说SQL是数据的魔法石,让数据流动,转化,融合,迸发出巨大的威力。对于sql的熟练使用,以及一些小技巧的应用,能够给下一步的特征工程省很多事。在这个过程中,数据倾斜是要尤其关注的,拉数据或者计算过程中进程一直被卡在99%是一件很尴尬的事儿。• 目前主流的编程语言越来越集中于python和R。有新闻上说,有的中学已经在开始普及python了。所以至少最好能有所了解。这包括一些常用的库,如pandas、sklearn等。当然,其他语言也可以有,C++在我们非常追求性能时会去考虑,JAVA也会在我们提供服务的时候使用。• 关于高性能的并行计算,Spark是一中常见的构架,它包含一个数据挖掘的库MLlib。• GPU(集群)是实现更高性能并行计算的另一个流行的方案,同时考虑到一些CNN、RNN模型的使用,所以学习注入TensorFlow、Caffe等等算法框架是很有必要的。当然对于风控来说这是比较高阶的应用。• 在建模过程中,对数据的简单统计分析进行可视化是非常必要的。数据直观的展示出来之后,有些问题/方案就一目了然了。在这方面,python的可视化工具、R、Matlab等各有各的优势,大家可以按习惯取用。• 最后,作为基础,写shell脚本的基础是必须的,要有一定的linux知识。其次,特别是大型金融科技公司对编码要求已经和互联开发没有什么本质区别,因此要求在编程的过程中,工程考虑是一定要有的思维习惯。这里的“工程考虑”并不仅仅是指算法的性能方面,还有考虑你自身的数据结构、表关系依赖关系、计算环境、服务器性能、可用资源等等,很多问题需要与研发或者平台的同学仔细沟通才能够提供一个真正的风控算法服务。因为风控的敏感性,网上其实很少有相关的资料。尤其是现在金融科技公司中的新技术和传统银行技术差别较大,使得这个行业带有一定的神秘性。其实,风控算法工程师和推荐系统算法工程师、搜索算法工程师等等没有太本质的区别,个人认为仍然属于互联网+下的算法工作,但是同金融科技这个新生业务产生了交集,对人才有了更复合的要求:同传统风控人员相比,它更强调了算法能力和工程能力,同普通算法人员相比,它更强调了金融业务理解能力。从招聘的情况看,市场上目前具备这种综合素质的人才很少,是一个很有发展前景的职业。
34 评论

翻过的亲切

已采纳
如何成为一名专业歌手?如何走这条路?需要什么条件吗?我觉得才华和机遇缺一不可。成为专业的歌手必须要有专业的知识和技能,要有幅优秀的嗓音,还要精通音谱,最好是去专业学校里培训,为出道打下良好的基础。如果你是业余爱好,可以先尝试去酒吧驻唱,磨砺台风,而且也有很多机会能遇到伯乐。成为一个歌手还要有好的身材和漂亮的脸蛋,毕竟要经常出入公众场合,只有外在条件好,公众才会喜欢你,关注你。做街头艺人也不错,可以磨炼一下自己的临场发挥能力,面对很多的观众,可以自信的一展歌喉,还可以入驻网络社交平台全民K歌和唱吧投稿,让更多的人听到你的歌声,积累更多的粉丝以提高知名度。成功的机会可遇而不可求,有熟人带就更好,以免走更多的弯路,如果没有熟人引路,建议通过知名度高的选秀比赛的方式,获得认可和知名度,不断挑战自我,不断积累经验,比如家喻户晓的2004年的超级女生,就有很多脱颖而出的佼佼者。每个人都有个舞台梦,但这条路不容易,坚持到最后的人却寥寥无几,要持之以恒才有机会,相信你,舞台是留给有准备的人,是金子总会闪闪发光的,加油吧。
16 评论

雙子ひ星

已采纳
武汉哪里可以正规学月嫂?武汉学金牌月嫂去哪里?贝安馨月嫂培训学校:金牌月嫂培训班,专业月嫂培训17天,组团报名享优惠。现在网络报名可免费学5天,更可免费学精品月子餐课程。月嫂培训完成,颁发高级母婴护理师证,全国通用,推荐就业。武汉月嫂培训课程大纲金.牌母婴护理师月嫂(师资)培训大纲第 一天:如何成为一名高端母婴护理师第二天:产妇产褥期身体机能的变化与护理第三天:产妇产后体能与形体恢复第四天:产妇恶露观察第五天:制定个性化科学化的产妇营养餐第六天:产褥期疾病观察及护理第七天:新生儿常见病的观察与护理第八天:新生儿的喂养第九天:早产儿、双胞胎等特殊婴儿的护理第十天:新生儿护理计划第十一天:乳房护理第十二天:母婴护理疑难解答及上户日志填写实操考核第十三天:月子餐实操及理论考试精品月子餐课程4天,食材由学校提供。
55 评论

浅笑依然

已采纳
临床医学大一解剖学什么?人体解剖学分为系统解剖学和局部解剖学,分别是两个学期学习的。对于人体解剖而言,三维思考的能力是非常重要的,毕竟我们看到的课本很多时候是平面,各种模型,还有现在很多三维解剖的APP都可以作为辅助,我现在用得少了,搜了一下,手机上还是不少免费APP可以用系统解剖学就是按照人体系统来学习,比如心血管系统、呼吸系统、生殖系统、神经系统、运动系统、消化系统等来学习的,是全面宏观地学习人体解剖概念;局部解剖是按照人体各个部位分区来学习的,比如头面部、颈部、胸部、腹部、上肢和下肢、背部来学习的,是了解一个局部区域分布的神经+血管+肌肉+淋巴+功能的课程我在读期间学习解剖学是分为课堂学习和解剖课学习的,一般都是安排一整个时间段来学习,比如理论课是上午两个小时,解剖学习4~5个小时,而且理论课和解剖课一般不会间隔超过两天,因为有些知识会被遗忘。扎实的解剖功底是一个医学生开展临床其他知识学习的基础,也是开展临床工作的基本要求,在科研上也有很重要的帮助。学会自己手绘是一项非常重要的技能,等做临床以后思考手术入路,和病人谈话都能用得上:因为我很喜欢人体解剖学,所以对这门课程很期待,每次上理论课前我都会先花半小时浏览一遍本章节的内容大概,在一些比较难理解的地方做标记,在上课的时候老师肯定也会以难点重点讲解。比如颈动脉窦的解剖,老师就不仅降解了颈动脉窦的解剖位置,功能发挥和容易受到损害的特点,还结合了临床病例来授课,是非常引人深思的。颈动脉窦在颈部两侧颈内动脉起始处,外膜有压力感受性神经,也就是颈动脉窦压力感受器,可以感知压力变化,参与血压调节。在这里老师还专门介绍了两个与颈动脉窦相关的疾病:颈动脉窦综合征(carotid sinus syndrome,CSS)——以突发性头昏、乏力、耳鸣以至晕厥的临床综合征;颈动脉窦过敏——领口紧、系领带或扎蝴蝶结、突然扭头、按压或刺激颈动脉窦后,反射性引起迷走神经高度兴奋,导致心跳过缓或心跳暂停、血压下降、脑部瞬间缺血而晕厥的症状。这种解剖知识与疾病紧密结合的教学方式很吸引人,我的解剖书上记录了很多老师们介绍的各种疾病,相当于提前学习了临床知识。在上解剖操作课前,我们都要提前复习一个小时的解剖知识,因为解剖课上有宝贵的大体老师授课,我们要珍惜来之不易的学习机会,这是对大体老师无私奉献的尊重和爱护,也是对未来的患者负责。第一次见大体老师是什么感觉?每一次解剖课我们都要在老师指导下观看解剖教学视频,然后复习课本重点难点,才开始实际操作。每一次课程大概4-6小时。解剖学习是一个医学生长期要重复的课程,因为有很多患者是在正常解剖基础上有变异情况,要根据患者实际情况更新自己的知识,避免患者手术过程中因为医生的解剖知识不过关而发生危险。因为我是神经外科专业的医生,所以颅底解剖的学习很多。因为对解剖知识的热爱,我后来还在出国学习的时候学习了一段时间的颅底解剖知识。在这里分享给大家:倩Sur:在美国TOP颅底解剖教研室做尸头解剖 | 周倩一个医学生的学习过程是漫长而复杂的,如何成为一名优秀的医学生呢?我想将我的学医经历和心得分享给学弟学妹们,希望你们能有所收获!学医入行指南:湘雅女博士给学弟妹的避坑建议
28 评论

相关问答

  • 什么软件可以照出脸骨架?

    什么软件可以照出脸骨架?目前没有。骨骼扫描软件是一款非常具有娱乐性质的趣味扫描手机软件,可以在手机上模拟出医学上的骨骼扫描图,还有逼真的骨骼异常图官方介绍X光全身透视扫描仪,当你用手机对着身体某些部位时你的手机会变成一台X光扫描仪,透过屏幕可以看到体内组织异常现象。X光全身扫描是一个恶作剧程序仅用于娱乐用途,

    煎饼果果子 4人参与回答 2024-11-12
  • 光荣李征怀孕值班是哪一集?

    光荣李征怀孕值班是哪一集?是第三十六集。郑朝山慌慌张张地赶回家中,趴在桌子上睡着的秦招娣听到动静醒了过来,此时时间正好是晚上的九点,就是秦招娣和卫夫人约好见面的时间。秦招娣觉得郑朝阳有些不一样,郑朝山解释回来的时候路口发生一起车祸,伤者特别像秦招娣被救护车拉走了。剧情简介:郑朝阳提起给王忠和徐小山的家中送抚恤金和奖状的事,两家老人都只要奖状,打死不要抚恤金,在他们心中孩子为国尽忠是无上光荣的。郑朝

    i景观空间打开 20人参与回答 2024-11-12
  • 春节期间可以探望病人吗?

    春节期间可以探望病人吗?春节期间可以探望病人。但是所带的礼品是有一定的讲究的,既然送礼就要送到心坎里,不要送一些病人忌讳或华而不实的东西。       对于患肾炎的病人,不宜送含动物蛋白质的食物,如肉、鱼、蛋等。        对于患糖尿病的病人,不能送各种糖果、甜点心、水果、果子汁等含糖食品。   

    南独酌酒 20人参与回答 2024-11-12
  • 中医是什么?

    中医是什么?中域教育为你解答:中医是能治病的医学(医乃仁术)。除此之外,中医还是国学(中医是国学的一个重要分支,最接地气,最能为人民服务),是哲学(是关于生命的哲学),是道(是天地大道,中医最强调天地对人的影响,所谓天地规律,即是道的体现),是价值观(中医最具正能量,且最环保,最合乎自然法则),中医也是生活方式(是一种积极、向上、快乐、放松、宽容、平和、慈悲、感恩的生活方式)很多人提起中医首先想到

    左手释然 20人参与回答 2024-11-12
  • 中西医临床考研国家线2021?

    中西医临床考研国家线2021?303分。中西医临床医学考研需要参加全国硕士研究生统一招生考试,先通过初试,才有资格参加复试。最终,院校根据考生的初试和复试成绩,进行择优录取,毕业获得硕士学位证书和硕士学历证书。  中西医临床医学考研初试的考试科目有思想政治理论、英语和中医综合或西医综合。中医综合包括中基、中诊、中药、方剂、中内、针灸等内容。西医综合包括生理、病理、生化、诊断、内科、外科的内容。各项

    微风咏叹 4人参与回答 2024-11-12