您好,欢迎来到锐游网。
搜索
您的当前位置:首页基于大数据的中小企业信贷风险评估方法

基于大数据的中小企业信贷风险评估方法

来源:锐游网
龙源期刊网 http://www.qikan.com.cn

基于大数据的中小企业信贷风险评估方法

作者:毛雅琛 周晓萌

来源:《消费导刊》2015年第10期

摘要:本文通过研究采用大数据分析的方法对中小企业借贷风险进行评估,研究如何将现阶段互联网的最新技术手段应用于中小企业金融风险评估体系,首先强调中小企业信贷风险评估的重要性,之后分别阐述了商业银行、信贷风险、中小企业的相关定义,并引入大数据分析的相关方法,提出区别于传统信贷风险评估体系的,基于大数据的中小企业信贷风险评估方法,并具体阐释大数据分析在金融风险评估中的方法步骤,力求使商业银行在风险可控的基础上尽可能多地满足中小企业在快速发展中的资金需求。 关键词:中小企业 大数据 金融信贷风险

随着我国金融改革的深化、国内金融市场逐步开放以及国际金融环境的不断变化,商业银行在数量增加的同时竞争也变的日趋激烈,如何高效的控制信贷风险和扩大业务范围成为商业银行面临的首要问题。而我国目前商业银行普遍风险管理机制落后,管理水平还达不到要求,因此长期以来商业银行在发放贷款的过程中为了规避风险尽可能的贷款给大型国企和央企而经常忽视中小企业。

商业银行传统的信贷管理体制已经不能满足中小企业在长远发展过程中的资金融通。对目前的金融管理体制进行改革并相继出台一系列政策措施鼓励现有商业银行向中小企业贷款也是大势所趋。其关键是需要研究出科学的信贷风险评估模型和完善的中小企业信贷风险评估体系,及时准确的判断有贷款需求的中小企业的信用情况,既能降低风险又能提高商业银行的竞争力。所以研究商业银行中小企业信贷风险评估这一课题就显得尤为重要。 一、中小企业信贷风险评估的重要性

根据2014年4月20日,第十二届中国国际中小企业博览会新闻发布会上的数据可知,我国目前约有中小企业6666万户,我国50%的税收、60%的国内生产总值、70%的发明专利、80%的就业岗位,都是由中小企业提供的。从数量和规模上看,99%的企业都属于中小企业的范畴。

从上述数据可以看出中小企业是促进我国经济快速发展的重要因素之一,在我国经济发展中发挥着举足轻重的作用,为我国的经济发展做出了不可磨灭的贡献。为此,国务院在2012年4月19日以国家发展改革委员会的名义颁发了《加强小微企业融资服务支持小微企业发展的指导意见》,此外,国务院还先后颁布了《国务院关于进一步促进中小企业发展的若干意见》和《中华人民共和国中小企业促进法》,表明国家对中小企业发展的持续关注。

龙源期刊网 http://www.qikan.com.cn

中小企业在社会中既有着不可替代的经济地位又有着熏要的政治地位,要想促进中小企业更好更快地发展,使其为社会做出更大的贡献,首先必须要解决长期困扰中小企业的融资难的问题。而目前向商业银行贷款仍然是解决中小企业资金问题的主要途径。但是,由于中小企业受规模小、技术水平低、公司治理不健全、经营管理水平不高、财务数据严重缺乏、信用程度不强、市场竞争能力较弱、没有足够的抵押担保物等条件的限制,即使目前是商业银行的重要信贷对象,但商业银行为了自身利益尽量规避风险并不乐意给一些中小企业发放贷款,从而导致了大部分中小企业的贷款需求不能得到满足。

研究商业银行中小企业信贷风险评估,能够在一定程度上给中小企业提供资金借贷支持,有利于促进中小企业的稳健及长远发展。现在的中小企业数量多、发展快、资金需求量大,能很好的带动商业银行信贷业务的发展,但同时也要求商业银行必须具备相当的信贷融资实力和风险评估能力。

二、商业银行、信贷风险、中小企业相关定义

商业银行是指通过多种金融负债来筹集资金并且经营对象为多种金融资产,以营利为目的的一种金融机构。传统的商业银行的主要业务是存贷款业务,而存贷的利息差是其主要利润来源。一般的商业银行不具备发行货币的权利,随着经济的发展商业银行的业务范围也有所拓宽,除了吸收存款、发放贷款外还包括票据贴现和中间业务等。目前我国的商业银行主要有国有商业银行、股份制商业银行、城市商业银行和农村商业银行等。

商业银行信贷风险是狭义上的信用风险,它是指债务人(企业、个体)等在向银行取得一定的贷款额度后,在银行的还款期限届满之前,借款人因经营不善或其他原因所造成的向银行违约而导致银行发生损失的可能性。商业银行的资产类业务中信贷业务仍然是其最主要的业务,目前我国的商业银行中信贷业务约占到80%,所以在商业银行面临的风险中信贷风险仍然是主流。商业银行是一种以盈利为目的的金融机构,其经营目标与一般企业相同都是追求企业利润最大化,所以为了提高经济效益,商业银行耍尽量降低或者规避这种信贷风险。 中小企业(Small and Medium-sizedEnterprises)指的是与相同行业中的大型企业相比时,无论是经营规模、资产规模还是人员规模都相对比较小的经济组织或单位。中小企业的经营特点如下:(1)适应能力强、数量多、分布广泛且生产经营方式灵活;(2)资本与技术的有机构成低,竞争力差;(3)篱理体制落后、不规范,抵御风险能力差。 三、大数据分析的相关方法

大数据(Big Data)是近年来非常热门的一项数据处理技术,国际知名科技公司IBM把大数据概括成3个V,即数量大(Volume)、种类多(Variety)和数据产生速度快

(Velocity)。这些特点也反映了大数据潜藏的巨大价值(Value),4个V也高度概括了大数据的基本特征。目前对大数据比较一致的定义是:大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。

龙源期刊网 http://www.qikan.com.cn

数据采集:ETLI具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

数据存取:关系数据库、NOSQL、SQL等。 基础架构:云存储、分布式文件存储等。

数据处理:自然语言处理(NLP,Natural Language Processing)是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(NLU,Natural Language Understanding),也称为计算语言学。 统计分析:假设检验、显著性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析(最优尺度分析)、bootstrap技术等等。

数据挖掘:分类(Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinity grouping or association rules)、聚类(Clustering)、描述和可视化、Description and Visualization)、复杂数据类型挖掘(Text,Web,图形图像,视频,音频等)。

模型预测:预测模型、机器学习、建模仿真。 结果呈现:云计算、标签云、关系图等。 四、大数据分析在金融风险评估中的方法步骤 步骤一:

广泛收集待评估中小企业的日常流水、银行交易、历史借贷等数据,其数据格式可以为数值化数据、图表数据、带有时间信息的交易流水、还有数值信息的图表、含有数值信息的照片或扫描件等。大数据的采集往往使用Redis和MongoDB这样的NoSQL数据库。 步骤二:

使用MongoDB构建基于非结构化数据的非关系型数据库。MongoDB是一个能够整合关系型数据库和非关系型数据库的产品,他支持的数据结构非常地松散,是类似json的bson格式,因此可以储存较为复杂的结构类型,非常适用于上述复杂结构类型的中小企业借贷风险评估所使用的数据存贮。MongoDB另一个特点是,它支持的查询语言非常的强大,其语法特点

龙源期刊网 http://www.qikan.com.cn

非常类似于C++等面向对象的语言,几乎可以实现类似关系型数据库单表查询的绝大部分功能,而且还支持对非关系型数据建立索引。本论文中所使用的MongoDB服务端为Ubuntu平台,酷睿i5四核处理器,4G DDR3内存,256GB SSD硬盘。值得一提的是,推荐MongoDB在64位系统平台上运行,原因是如果其在32位模式运行时所支持的最大文件尺寸为2GB。 步骤三:

将现有待使用的中小企业评估数据寻入MongoDB中,并建立数据模型,其模型可以包含一组数据库、一个DataBase、一组collection(集合)、一个集合可以包含一组Document(文档),一个文档包含一组Field(字段),每个字段都必须是一个key/valuepair,其中key必须为字符串类型,value可以包含如下的类型:基本类型(如int、float、string等)、一个Document或数组类型。 步骤四:

建立符合科学评估方法的、基于多项式的风险评估算法,通过上述已经构建好的非结构化及半结构化类型的数据库,系统可以自动导入相关重要评估元素,基于多项式的算法通过给每一个元素科学地赋予权重最终形成基于多方投票的Ada-boost评估算法。

评估分析主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,以满足大多数常见的分析需求,在这方面,一些实时性需求会用到EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存储Infobright等,而一些批处理,或者基于半结构化数据的需求可以使用Hadoop。统计与分析这部分的主要特点和挑战是分析涉及的数据量大,其对系统资源,特别是1/0会有极大的占用。 步骤五:

通过迭代算法最终形成建议的借贷策略。通过算法设定迭代运行并调整每次迭代所赋予的权重。在现有数据上面进行基于各种算法的计算,从而起到预测的效果,从而实现一些高级别数据分析的需求。比较典型算法有用于聚类的Kmeans、用于统计学习的SVM和用于分类的Naive Bayes,主要使用的工具有Hadoop的Mahout等。该过程的特点和挑战主要是用于挖掘的算法很复杂,并且计算涉及的数据量和计算量都很大。 五、结语

本文首先强调了中小企业信贷风险评估的重要性,之后分别阐述了商业银行、信贷风险、中小企业的相关定义,并引入大数据分析的相关方法,结合中小企业自身的特点,将最先进的计算机技术与传统的金融业相结合,提出区别于传统信贷风险评估体系的——基于大数据的中小企业信贷风险评估方法,并具体阐释大数据分析在金融风险评估中的方法步骤,通过研究采用大数据分析的方法对中小企业信贷风险进行评估,研究如何将现阶段互联网的最新技术手段应用于中小企业金融风险评估体系,使商业银行在风险可控的基础上尽可能多地满足中小企业

龙源期刊网 http://www.qikan.com.cn

在快速发展中的资金需求。为中小企业信贷风险评估提供新的可能性,在一定程度上解决了传统评估体系的局限性和中小企业与商业银行之间信息不对称及数据整合难度大等多重问题。 在金融业,数据就是业务本身,只有掌控数据,才有可能赢得市场。大数据的出现既为金融业带来了机遇,也带来了挑战。从潜在的机会看,数据量的增加为企业提供了精确把握用户群体和个体网络行为模式的基础,如果能够充分利用,就可以个性化、精确化和智能化地进行广告推送和服务推广服务,创立比现有形式性价比高数倍甚至数十倍的全新商业模式。同时,企业也可以通过对大数据的把握,挖掘数据更深层的价值,开发出更贴近用户的新产品和新服务,探索出降低运营成本的方法和途径。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- ryyc.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务