中國人民銀行征信管理局局長 萬存知
互聯(lián)網(wǎng)誕生在美國,但在中國應(yīng)用最為廣泛。金融科技脫胎于互聯(lián)網(wǎng),走在最前沿的依然是美國和中國。金融科技包括大數(shù)據(jù)、云計算、區(qū)塊鏈、人工智能等技術(shù),其中大數(shù)據(jù)作為一切技術(shù)運轉(zhuǎn)的最基本單元,也是一切技術(shù)發(fā)展的“燃料”和“能源”。大數(shù)據(jù)的創(chuàng)新與發(fā)展為征信體系建設(shè)做出了重要貢獻,但也產(chǎn)生了一些新的風(fēng)險和矛盾。對于此,我們需要把握好大數(shù)據(jù)發(fā)展與風(fēng)險防范之間的平衡,引導(dǎo)大數(shù)據(jù)在征信業(yè)務(wù)中的合規(guī)運用,發(fā)揮征信金融重要基礎(chǔ)設(shè)施作用,更好實現(xiàn)建立覆蓋全社會征信系統(tǒng)的總體目標(biāo)。
大數(shù)據(jù)的基本概念
大數(shù)據(jù)指的是數(shù)量、種類、更新速率呈指數(shù)增長的數(shù)據(jù)及處理這些新型數(shù)據(jù)的處理技術(shù),大數(shù)據(jù)的產(chǎn)生與發(fā)展應(yīng)用了先進的數(shù)據(jù)分析手段,其出現(xiàn)重新定義大量以前難以定義和使用的數(shù)據(jù),拓展了數(shù)據(jù)的應(yīng)用范圍,數(shù)據(jù)的使用更加靈活和深入,數(shù)據(jù)之間聯(lián)系也更為緊密。
大數(shù)據(jù)包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù),又稱行數(shù)據(jù),是指通過關(guān)系型數(shù)據(jù)庫進行儲存和管理,由二維表結(jié)構(gòu)來邏輯表達和實現(xiàn)的數(shù)據(jù),通常以數(shù)字、字母、文字等字符體現(xiàn),具有一定的規(guī)律性,數(shù)據(jù)格式和內(nèi)容有嚴(yán)格限制。非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)不規(guī)則或者不完整,沒有預(yù)先定義的數(shù)據(jù)模型,或者沒有按照預(yù)先定義的方式組織的信息,如電子郵件、文本文件、音頻文件、圖片和視頻、圖片和短信以及潛在未定義的數(shù)據(jù)來源。
大數(shù)據(jù)具有4V的特征:大量(Volume),即數(shù)據(jù)量巨大;多樣(Variety),即數(shù)據(jù)種類繁多;高速(Velocity),即數(shù)據(jù)處理速度快;價值(Value),即數(shù)據(jù)被賦予了更高的價值。
大數(shù)據(jù)在征信體系建設(shè)中的應(yīng)用 大數(shù)據(jù)以其獨特的4V特征,為促進征信體系建設(shè)方面發(fā)揮的積極作用。
1.大數(shù)據(jù)帶來了數(shù)據(jù)量級的指數(shù)增長。有一個經(jīng)常被引用的估算,2011年,全球數(shù)據(jù)規(guī)模為1.8ZB,并以每天至少產(chǎn)生2.5EB數(shù)據(jù)量的速度增長,預(yù)計到2020年,將會有40ZB的數(shù)據(jù)量被創(chuàng)造出來。而在國內(nèi)數(shù)據(jù)市場中,淘寶每天有上千萬家商戶在不斷的產(chǎn)生信息,微信的月活躍用戶已超過10億,京東金融每天產(chǎn)生的數(shù)據(jù)量超過200TB。這些都表明大量的數(shù)據(jù)正在產(chǎn)生和積累,而且數(shù)據(jù)量正在非常迅速地增長,這種增長在征信系統(tǒng)中表現(xiàn)的尤為明顯。
我國已建成世界上收錄人數(shù)最多、數(shù)據(jù)規(guī)模最大、覆蓋范圍最廣的金融信用信息基礎(chǔ)數(shù)據(jù)庫(下稱“數(shù)據(jù)庫”)。截至2018年9月末,人民銀行運維的數(shù)據(jù)庫中,個人系統(tǒng)累計收錄信貸信息30億多條、非信貸信息66億多條,為9.7億多自然人建立統(tǒng)一的信用檔案,接入法人機構(gòu)3453家,日均查詢477萬余次;企業(yè)系統(tǒng)累計收錄信貸信息3.5億多條、非信貸信息5100多萬條,為2560多萬戶企業(yè)和其他組織建立了信用檔案,接入法人機構(gòu)3351家,日均查詢29萬余次。
2.大數(shù)據(jù)豐富了信息的類別,信息來源更加廣泛。大數(shù)據(jù)的發(fā)展致使多種類型的替代數(shù)據(jù)(Alternative Data)在信貸領(lǐng)域中出現(xiàn),替代數(shù)據(jù)包括個人的支付、交易、消費、社交、上網(wǎng)痕跡、網(wǎng)絡(luò)搜索、生活軌跡等,來源也由傳統(tǒng)的金融機構(gòu)發(fā)展到政府部門、公共事業(yè)單位、互聯(lián)網(wǎng)公司、科技公司等,現(xiàn)已被越來越廣泛的應(yīng)用于信貸支持。
從國外發(fā)展上看,國外征信機構(gòu)廣泛探索利用替代數(shù)據(jù)支持信貸,如通過采集電信、有限電視、租賃等賬單支付數(shù)據(jù),移動設(shè)備、電子郵件、社交媒體等網(wǎng)絡(luò)數(shù)據(jù)及社會關(guān)系信息對無信用記錄者和薄信用記錄者提供征信服務(wù)。
從國內(nèi)發(fā)展上看,國內(nèi)征信機構(gòu)也加大了對替代數(shù)據(jù)的采集力度。目前,數(shù)據(jù)庫除了實現(xiàn)對銀、證、保領(lǐng)域借貸信息的共享外,還采集了社保、公積金、環(huán)保、欠稅、民事裁決與執(zhí)行等替代數(shù)據(jù)。此外,百行征信按照“共商、共建、共享、共贏”原則,已與241家機構(gòu)簽署信用信息共享合作協(xié)議,涵蓋網(wǎng)絡(luò)借貸信息中介機構(gòu)(P to P)、網(wǎng)絡(luò)小額貸款公司、消費金融公司、汽車金融公司、融資租賃公司、民營銀行、助貸機構(gòu)、金融科技公司等,并將逐步覆蓋到水電氣話等公用單位及運營商掌握的,能影響個人信用狀況的替代數(shù)據(jù)。
3.大數(shù)據(jù)加速了信息的集中,縮短了信息流動的時間。大數(shù)據(jù)的高速更大程度上發(fā)揮了征信功能的作用。數(shù)據(jù)的產(chǎn)生速度和流動速度越快,數(shù)據(jù)的集中度越高,征信系統(tǒng)就能快速甚至實時的做出對客戶償債意愿和償債能力的判斷,在保證信息時效性、提升信貸效率的同時,也能更好防范金融領(lǐng)域中的各類風(fēng)險。
高速的數(shù)據(jù)輸入、處理、輸出速度使征信機構(gòu)的數(shù)據(jù)更新與交互時間由1月、1周、1天,變?yōu)?小時,1分鐘乃至實時。如當(dāng)前數(shù)據(jù)庫已經(jīng)支持實時更新,能實時對客戶做出分析評價,也能及時完成大量的異議及各類數(shù)據(jù)的更正,保證征信系統(tǒng)高速高質(zhì)量運轉(zhuǎn)。此外,征信機構(gòu)還與銀行開展了7×24不間斷的數(shù)據(jù)實時傳輸、更新,確保數(shù)據(jù)時效性的同時也大大縮短了放貸時間,在線上將企業(yè)從貸款申請到發(fā)放貸款的時間由傳統(tǒng)的10天左右壓縮至10分鐘左右,拉近了征信機構(gòu)、放貸人和借貸人之間的距離。
4.大數(shù)據(jù)挖掘出了數(shù)據(jù)的深層內(nèi)涵和關(guān)系,為數(shù)據(jù)創(chuàng)造了新的價值。大數(shù)據(jù)與隨之而來的新型數(shù)據(jù)處理技術(shù)能夠深入挖掘已有數(shù)據(jù)的價值,也能提高以前低價值的數(shù)據(jù)的價值,還可通過發(fā)掘數(shù)據(jù)之間的內(nèi)在聯(lián)系賦予數(shù)據(jù)新的價值。
在征信系統(tǒng)建設(shè)中,征信機構(gòu)通過對信貸信息和替代數(shù)據(jù)價值的挖掘,提供征信增值產(chǎn)品與服務(wù),多維度評價客戶信用狀況,為缺少信用記錄的客戶提供信用評價,幫助其獲得正規(guī)金融服務(wù),增加貸款可獲得性。征信機構(gòu)對挖掘數(shù)據(jù)價值的模式主要有以下三種。
一是橫向采集關(guān)聯(lián)數(shù)據(jù)。如通過廣泛采集政府部門、公用事業(yè)單位所掌握的企業(yè)工商登記、納稅、財務(wù)報表、社保公積金繳納、水電氣繳費、知識產(chǎn)權(quán)等信息,分析研究其內(nèi)在關(guān)聯(lián)并提供征信服務(wù)。
二是縱向垂直整合信息資源。如通過對供應(yīng)鏈上下游企業(yè)之間應(yīng)收應(yīng)付信息的整合和確權(quán),以供應(yīng)鏈金融為載體,建立供應(yīng)鏈上大型企業(yè)和中小微企業(yè)間的信用傳導(dǎo)機制,開拓出征信業(yè)務(wù)新模式。
三是深入挖掘數(shù)據(jù)內(nèi)涵。如通過深入挖掘稅務(wù)信息價值,與商業(yè)銀行合作開發(fā)深度基于稅務(wù)數(shù)據(jù)的征信產(chǎn)品,提供更具針對性的征信服務(wù)。
通過這三種征信業(yè)務(wù)模式,征信機構(gòu)因地制宜開展征信服務(wù),為銀企雙方牽線搭橋、增進互信,解決了小微企業(yè)跨越“第一次”申貸門檻問題,對化解小微企業(yè)融資難、融資貴有著積極的作用。
此外,通過大數(shù)據(jù)挖掘負(fù)面信息也能起到防范欺詐風(fēng)險,降低信貸風(fēng)險的作用。
大數(shù)據(jù)存在的問題
1.個人隱私和商業(yè)秘密得不到有效保護。我國現(xiàn)有法律對于大數(shù)據(jù)行業(yè)并無明確定義,對使用大數(shù)據(jù)的機構(gòu)沒有明確的規(guī)范和管理方式,這既容易導(dǎo)致大數(shù)據(jù)行業(yè)由于缺乏監(jiān)管而產(chǎn)生違法采集、過度采集、濫用個人信息和商業(yè)機密的問題,致使個人隱私和商業(yè)秘密無法得到有力保護,也不利于大數(shù)據(jù)行業(yè)的健康有序發(fā)展。
2.數(shù)據(jù)安全問題頻發(fā),數(shù)據(jù)跨境監(jiān)管難。當(dāng)前,由于外部黑客入侵、內(nèi)部員工監(jiān)守自盜、機構(gòu)信息管理不健全等原因,數(shù)據(jù)行業(yè)信息泄露事件頻發(fā),互聯(lián)網(wǎng)公司Face-book、征信機構(gòu)Equifax的信息泄露事件都在全球造成了極大的負(fù)面影響。信息安全是國家安全戰(zhàn)略的重要組成部分,信息技術(shù)的高速發(fā)展、互聯(lián)網(wǎng)的快速普及和大數(shù)據(jù)的爆發(fā)式增長為個人提供極大便利的同時,信息安全的保護也面臨嚴(yán)峻挑戰(zhàn),征信行業(yè)擁有大量敏感度高、私密性強的個人信用信息,是國家的關(guān)鍵數(shù)據(jù)資源,一旦發(fā)生信息泄露,即可造成非常嚴(yán)重的后果。
此外,大數(shù)據(jù)行業(yè)的快速發(fā)展也導(dǎo)致數(shù)據(jù)跨境監(jiān)管難度上升,國家安全數(shù)據(jù)、個人隱私、商業(yè)秘密數(shù)據(jù)的跨境安全難以得到保障,歐盟的GDPR、美國和歐盟之間的隱私盾(Privacy Shield)協(xié)議都對數(shù)據(jù)跨境做出了相應(yīng)的規(guī)定,但我國對數(shù)據(jù)跨境流動暫未做出相關(guān)規(guī)定。
3.數(shù)據(jù)來源難以做到清晰、準(zhǔn)確、可控。當(dāng)大數(shù)據(jù)應(yīng)用于征信時,面臨著數(shù)據(jù)來源良莠不齊,數(shù)據(jù)不完整、質(zhì)量沒保障等問題,數(shù)據(jù)準(zhǔn)確性、及時性、完整性難以得到保證。數(shù)據(jù)量的龐雜和數(shù)據(jù)源單位安全管控限制,導(dǎo)致數(shù)據(jù)大多來源于網(wǎng)絡(luò)爬取,沒有固定的數(shù)據(jù)合作關(guān)系,數(shù)據(jù)呈碎片狀態(tài),沒用使用規(guī)則,數(shù)據(jù)的準(zhǔn)確性、完整性、系統(tǒng)性和穩(wěn)定性差,標(biāo)準(zhǔn)化和格式化水平低,非格式化數(shù)據(jù)隨機性大,所以大數(shù)據(jù)“垃圾進、垃圾出”的說法甚為流行,產(chǎn)品與服務(wù)的公正性也得不到保證。
4.大數(shù)據(jù)行業(yè)的市場共享機制尚未成型。當(dāng)前大數(shù)據(jù)行業(yè)沒有形成統(tǒng)一的數(shù)據(jù)處理與分享規(guī)則,掌握數(shù)據(jù)的機構(gòu)眾多,各自有各自的數(shù)據(jù)來源,在缺乏統(tǒng)一標(biāo)準(zhǔn)化的專業(yè)術(shù)語、技術(shù)標(biāo)準(zhǔn)及行為規(guī)范的情況下,事實上形成了一個個信息孤島,不利于實現(xiàn)信息全覆蓋市場格局的形成,更不利于大數(shù)據(jù)市場統(tǒng)一秩序的形成。
下一步工作思考
大數(shù)據(jù)是一把優(yōu)勢和劣勢都非常明顯雙刃劍,要一分為二地看待,既要發(fā)揮大數(shù)據(jù)的在促進經(jīng)濟金融活動更快更有效運轉(zhuǎn)方面的優(yōu)勢,也要解決好大數(shù)據(jù)在個人隱私、信息安全等方面的劣勢。 發(fā)展大數(shù)據(jù)產(chǎn)業(yè),重點是將大數(shù)據(jù)產(chǎn)業(yè)納入監(jiān)管范疇,才能更好發(fā)揮大數(shù)據(jù)促進征信系統(tǒng)建設(shè)的作用。
尊重信息主體權(quán)益和信息安全是大數(shù)據(jù)自由流動的前提。要平衡好商業(yè)化應(yīng)用所需的數(shù)據(jù)自由流動與信息主體權(quán)益保護之間的關(guān)系,協(xié)調(diào)好信息提供方、信息采集加工方(征信機構(gòu)等)、信息使用方等各方的利益訴求,確保信息主體權(quán)益得到尊重和維護的同時,探索通過一種無差異自愿的合作機制,將各方有機聯(lián)結(jié)起來,形成穩(wěn)定的良性互動的路線圖,建立健全信息共享的體制機制。
積極介入個人數(shù)據(jù)保護、數(shù)據(jù)跨境流動、數(shù)據(jù)網(wǎng)絡(luò)安全等法律法規(guī)和國際標(biāo)準(zhǔn)的制定,加強征信體系建設(shè)中的信息保護制度建設(shè),強化信息安全保護能力,提升信息安全管理水平,建立完善數(shù)據(jù)泄露通知制度和應(yīng)急補救預(yù)案,實現(xiàn)數(shù)據(jù)來源的清晰、準(zhǔn)確、可控,確保數(shù)據(jù)在安全、合規(guī)的前提下自由流動。
繼續(xù)發(fā)揮大數(shù)據(jù)應(yīng)用于征信體系建設(shè)中的優(yōu)勢,助力普惠金額,解決小微企業(yè)融資難、融資貴等問題。大數(shù)據(jù)具有4V特征,能夠幫助解決傳統(tǒng)征信無法解決的問題,滲透到傳統(tǒng)征信無法滲透的地方。因此,發(fā)揮征信的作用,以征信機構(gòu)作為數(shù)據(jù)傳遞的紐帶,通過大數(shù)據(jù)拓寬信息的來源和征信產(chǎn)品的應(yīng)用,多維度展示個人和小微企業(yè)的信用及風(fēng)險狀況,才能更好幫助缺少信用記錄的個人和小微企業(yè)獲取貸款,推動了普惠金融的發(fā)展,解決小微企業(yè)融資難、融資貴問題,實現(xiàn)信用信息的全生命周期全覆蓋。
相關(guān)推薦
即使對于那些已經(jīng)習(xí)慣于不斷變化的CIO們來說,2011年都是令人眼花繚亂的一年。在這一年中,移動計算風(fēng)起云涌,大數(shù)據(jù)處理大行其道,社交媒體和網(wǎng)絡(luò)爆發(fā)出催生社會變革的駭人力量。而且,BYOD(bringyourowndevice)和VOC(voiceofthecustomer)的趨勢也證明了用戶體驗正在重塑IT的角色定位。這些技術(shù)同樣改變了傳統(tǒng)的語境。隨著IT組織和業(yè)務(wù)團隊都認(rèn)識到相互之間密不可分的依賴性,“IT和業(yè)務(wù)的適配”最終讓位于“IT和業(yè)務(wù)的整合”或者“商業(yè)技術(shù)”。在2011年,先前關(guān)于云計算的各種宣傳和鼓吹逐漸成為令CIO們痛苦的事實,后者不得不絞盡腦汁在云計算和企業(yè)安全之間達成平衡。
引言:這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進程。———哈佛大學(xué) 社會學(xué)教授加里•金云計算技術(shù)還未完全覆蓋全部主流市場,大數(shù)據(jù)的浪潮已經(jīng)撲面而來,正如加里•金教授所言,無論是國內(nèi)還是國外,無論是學(xué)術(shù)界還是商界,大數(shù)據(jù)在云計算的基礎(chǔ)上已經(jīng)開始粉墨登場了。大數(shù)據(jù)