網上有很多關于pos機風控未知返回碼,離不開的OCR的知識,也有很多人為大家解答關于pos機風控未知返回碼的問題,今天pos機之家(www.www690aa.com)為大家整理了關于這方面的知識,讓我們一起來看下吧!
本文目錄一覽:
pos機風控未知返回碼
序言:
OCR(Optical Character Recognition,光學字符識別),是指針對印刷體字符,采用光學方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工。
在金融機構信貸場景的風控流程中,尤其是線上信貸產品,無論是面向C端個人,還是面向B端中小微企業,OCR技術是金融機構方在產品業務流程中經常采用的手段,可以應用于業務場景中的風控指標識別、用戶信息認證、財務數據錄入等環節,有效提高業務流程中數據信息獲取與傳輸的效率。
現結合金融信貸領域的常見業務場景,介紹下OCR技術在個人、中小微企業信貸產品風控流程中的解析應用,如個人卡證識別、企業執照識別、征信報告識別、財務票據識別等。
一.身份證識別
當用戶對線上信貸產品進行申請時,首先需要填寫個人基本信息并上傳身份證,而身份證信息的識別與獲取,正是通過OCR方式實現,可以精準識別身份證正反兩面的信息,并返回相關指標字段。如圖1為身份證正反面樣例,OCR識別后會生成對應的數據報文,部分樣例如圖2所示。
編輯
圖1 身份證正反面樣例
編輯切換為居中
圖1 身份證正反面樣例
編輯
圖2 身份證OCR數據報文
編輯
圖2 身份證OCR數據報文
從返回報文中解析提取出我們需要的字段,儲存至數據庫對應的用戶基本信息表,具體指標如圖3所示。
編輯
圖3 身份證字段指標
根據用戶的基本信息字段,可以進行相應風控流程的策略核驗,或加工模型變量字段,現舉幾個例子進行說明:
將“姓名”和“身份證號”進行用戶二要素核驗認證(調用三方數據接口);驗證身份證是否過期,將“失效日期”與當前日期進行比較;戶籍“地址”是否符合產品開展業務面向的省市區域范圍;由“出生”日期算出新字段“年齡”,核驗是否滿足年齡準入條件等。 二.銀行卡識別 在用戶申請產品的流程中,銀行卡信息也是必填內容之一,在很多線上信貸產品的業務流程中,銀行卡信息的讀取和存儲,是通過用戶上傳銀行卡照片,然后經OCR識別解析的。OCR可以對常見銀行卡的卡號、有效期、發卡行、卡片類型等關鍵字進行識別,其樣例如圖4所示,OCR返回的部分數據報文如圖5所示。編輯切換為居中
圖4 銀行卡樣例
編輯
圖5 銀行卡OCR數據報文
從返回的銀行卡數據報文中,可以解析提取出需要字段,具體指標如圖6所示。
編輯
圖6 銀行卡字段指標
根據銀行卡的解析字段,結合用戶身份的基本信息,可以通過調用三方數據接口進行銀行卡三要素實名認證(姓名、身份證號、銀行卡號),或四要素核驗實名認證(姓名、身份證號、銀行卡號、手機預留號碼),這些規則都是產品風控流程中的前置準入條件。
三.企業營業執照
對于中小微企業信貸產品,營業執照是必須提交的材料之一,在線上申請流程中,用戶通過在平臺上傳企業營業執照,系統會進行OCR識別,解析其中必要字段存儲到數據庫中,然后應用到風控策略或模型的決策中。OCR可以結構化識別各種類型版式的營業執照,并返回企業名稱、社會信用代碼、地址、法人、類型、成立日期、有效期至、經營范圍等關鍵字段信息。企業營業執照的樣例如圖7所示,OCR返回的部分數據報文如圖8所示。
編輯
添加圖片注釋,不超過 140 字(可選)
圖7 營業執照樣例
編輯
圖8 營業執照OCR數據報文
從返回的營業執照數據報文中,可以解析提取出詳細字段,具體指標如圖9所示。
編輯
圖9 營業執照字段指標
根據營業執照的解析字段,我們可以將其應用到產品的風控流程中,現舉幾個例子進行說明:
將“企業名稱”、“社會信用代碼”進行企業二要素核驗認證(調用企業三方數據接口,如企查查、啟信寶等);將“企業名稱”、“社會信用代碼”、“法定代表人”進行企業三要素核驗認證(調用企業三方數據接口);核驗“有效期至”是否過期,當取值為“長期”時則直接有效,當取值為日期時,則與當前日期進行比較;通過“成立日期”與“當前日期”取差值,加工新字段“經營年限”,驗證是否符合產品關于企業年限的準入條件;企業“地址”取“省市”字段,驗證是否符合產品關于地域范圍的準入條件;“注冊資本”、“經營年限”等字段可以在企業評分模型中進行應用。四.人行征信報告
在金融信貸領域中,對于個人端或中小微企業端信貸產品,人行征信數據是風控體系中特別重要的數據維度,人行征信報告的數據信息可以真實地反映出客戶的基本信息和風險信息。因此,很多金融機構對申請用戶的風險評估,很依賴人行征信報告的獲取與解析。隨著OCR應用場景的不斷成熟與擴展,現在很多金融機構采用線上解析個人或企業的人行征信報報告。
對于人行二代征信報告,具體結構化信息包括個人基本信息、信息概要、信貸交易信息明細、公共信息明細、查詢記錄等。通過OCR對人行征信報告進行解析,可以實現以上各個模塊信息的識別。人行征信報告樣例如圖10 所示,圖中右側為通過OCR系統生成的結構化文本,可以很清晰的展示出相關指標。同時,返回的數據報文部分樣例如圖11-14所示。
編輯切換為居中
圖10 人行征信報告樣例
編輯切換為居中
圖11 征信報告OCR數據報文-基本信息
通過OCR返回的基本信息相關字段有多個指標,包括姓名、身份證號碼、性別、出生日期、婚姻狀況、手機號碼、學歷、學位、通訊地址、戶籍地址、國籍、就業狀況、電子郵箱、工作單位等,涵蓋了用戶比較全面的基本信息特征。對于比較重要的字段,如姓名、身份證號碼等,在風控流程的策略規則模塊中,可以將這些指標與前邊用戶填寫或上傳身份證解析的同含義字段進行再次核驗。例如,比較身份證的“姓名”和人行征信報告的“姓名”是否一致,這樣可以進一步驗證材料的真實性。同時,很多字段都可以進一步加工成策略規則應用于風控前置規則中,比如年齡與學歷是否相符、工作單位與通訊地址是否符合邏輯、身份證號碼與戶籍地址是否匹配等。
編輯切換為居中
圖12 征信報告OCR數據報文-信貸交易
編輯切換為居中
圖13 征信報告OCR數據報文-逾期信息
編輯切換為居中
圖14 征信報告OCR數據報文-查詢記錄
圖12-14是通過OCR返回的信貸交易、逾期信息、查詢記錄等信息,這些維度的字段信息價值很高,無論在策略規則的制定,還是在風控模型的開發,很多指標的區分度表現較好,比如逾期機構數、逾期金額、逾期天數等,可以很好的反映出客戶的信用風險程度。
在風控策略規則的應用中,通過OCR返回的征信報告某些字段,可以直接用于規則決策,比如當用戶近6個月逾期機構數大于某個值,或近12個月逾期天數大于某個值時,可以直接將其拒絕。在數據建模過程中,如A卡申請模型、B卡行為模型、C卡催收模型等,以上信貸交易或查詢信息的特征指標,對模型擬合效果的貢獻度也會表現較好。同時,對于OCR返回的征信基本字段中,可以進一步衍生加工新的指標,這樣可以擴大特征變量范圍,為策略制定或模型開發提供更多的特征選擇。
五.小結
在信貸場景的產品業務流程中,OCR解析已經成為金融機構方在客戶申請環節獲取數據信息的一種常用方式。OCR通過文本識別返回數據指標的過程,可以很大程度上提高業務流程的審批效率,對于風控體系的指標獲取、策略應用等環節提供了較為便利的方法與途徑。
對于OCR在信貸風控流程中的應用,除了以上介紹的身份證、銀行卡、企業營業執照、人行征信報告這幾種常見情況,還有其他應用場景,比如財務報表識別、發票識別、房產證識別、駕駛證識別等。雖然解析過程原理一樣,但應用場景都有所區別,比如在中小微企業信用貸、物流金融、房抵貸等業務類型。
對于本文介紹的OCR解析人行征信報告內容,由于報告包含的內容較多,對應解析出各個維度的字段也比較多,因此另外提供了通過OCR解析返回的人行征信報告的詳細數據報文,具體附件請參考本次我們上傳到知識星球上的附件。
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
~原創文章
...
end
以上就是關于pos機風控未知返回碼,離不開的OCR的知識,后面我們會繼續為大家整理關于pos機風控未知返回碼的知識,希望能夠幫助到大家!
