0
中國的金融科技概念已經火了超過10年了。從2007年“拍拍貸”誕生,2013年“余額寶”上線,2016年底招商銀行上線“摩羯智投”,直到2017年,眾安在線、趣店、和信貸、拍拍貸、簡普科技等集體上市。大部分人提到金融科技還是第一時間想到“P2P”、“網貸”和“智能投顧”,中國的金融科技一直在消費金融環節發力,而忽略了金融行業企業級服務的科技創新。
如何能夠真正的提高金融行業效率,用科技真正的重構金融行業,而不是僅僅將傳統線下的模式搬到線上去執行。根據 IOSCO(國際證監會組織)在2017年2月發布的《金融科技研究報告》,美國從2015年前后已經開始通過大數據、云計算、人工智能、區塊鏈這些新的IT技術來改變傳統的金融信息采集來源、風險定價模型、投資決策過程、信用中介角色等,金融科技已經進入到3.0時代。
在國外,金融科技的風口已經從面向個人的消費金融環節轉向了企業級服務的環節,如面向前臺業務的智能研究、智能投資領域,以及面向中后臺業務的文檔智能化領域等。
2017年3月,摩根大通開發了一款金融合同解析軟件COIN。這款軟件上線半年多,經測試,原先律師和貸款人員每年需要360000小時才能完成的工作,COIN只需幾秒就能完成。而且,不僅錯誤率大大降低,它還不用放假。
2017年4月獲標普國際領投的B輪5000萬美元融資,估值達5億美元的智能投研機構Kensho,被譽為“華爾街之狼”。公司產品Warren試圖通過構建事件數據庫及知識圖譜的綜合圖表模型,解決投資分析中“速度、規模、自動化”三大挑戰。公司客戶包括金融機構和商業媒體,未來有望拓展至美國政府部門。
這其中應用到的核心AI技術包括機器學習、深度學習、智能語言處理、計算機視覺等。同時,各類披露的金融文檔已呈現為富格式文本(Richly Formatted Data)的形式,包含篇章結構、文字段落、數據表格等各類形式;并且金融是一個文檔、數據密集型的行業,信息需要從各個渠道被收集、整合、關聯;故自然語言處理(NLP, Natural Language Processing)與計算機視覺深度(CV, Computer Vision)的融合則成為金融科技3.0時代最重要的技術。而筆者認為,現在能夠真正將NLP+CV技術實現應用場景化的金融科技公司,才是下一步真正顛覆中國金融行業業務模式及運營規則的獨角獸。
本文就來盤點一下目前中國市場上所有核心技術為NLP+CV的提供企業級服務的金融科技創業公司,關注重點不是公司的宣傳概念,而是實實在在落地的產品。
以下公司信息均來自公司官網和公開媒體報道,下文中體驗的產品均為公司免費公開試用的2C版產品。雖然2C產品的體驗并不能完全等同于2B產品,但不可否認的是,2C免費產品的高質量足以支撐2B付費產品的高質量(以下公司排名按名稱首字母順序)。


在以上14家公司中,筆者對每家的可試用的產品均進行了實操體驗,同時結合公司的創始背景、融資情況,將這些公司劃分為三類。第一類型的公司優勢明顯,要么已經深耕所在的細分領域,要么是空白細分領域的先鋒;第二類型的公司產品偏向智能數據和分析工具服務商;第三類型的公司產品功能尚不明確或者公開信息不全。
第一類型:未來的獨角獸
在第一類型的公司中,阡尋科技較其他幾家公司成立時間早,其智能投研產品的應用已經較為成熟;庖丁科技專注于提供金融語義理解智能化解決方案,是金融文檔實時、精確、全自動結構化領域的先入者;VC SaaS致力于創投企業辦公云平臺的開發;鼎復數據和文因互聯都強調其知識圖譜的構建。
1. 阡尋科技
阡尋科技是由東吳證券與中國證券市場及自然語言領域泰斗級人物白碩先生所率領的團隊共同發起設立,成立之時就備受業界關注。公司官網上對自己的的描述是是一家專注于金融科技領域的高科技金融科技集團,致力于通過包括人工智能在內的信息科技手段重構中國金融業態。2015年成立至今,公司目前的產品有股票對話機器人——阡寶、可定制自動化研究報告、能自動捕獲事件,沿產業鏈圖譜傳導量化其影響,實時預警的智能投研系統以及實時監測市場的智能資訊。
由于自動報告、智能投研系統以及智能資訊均不對外免費試用,筆者僅試用了股票對話機器人——阡寶,需要關注微信公眾號并注冊賬號之后試用。阡寶中的信息維度全面,圖表展示豐富,結論的觀點性較強,人機互動性良好。操作截圖如下:


2. 庖丁科技
庖丁科技是一家將金融市場知識多維度深層次結構化的人工智能高科技公司,致力于讓計算機能夠真正讀懂金融語義,理解業務知識,切實幫助資本市場全產業鏈各參與機構提升盡調,審計,研究,投資等工作效率或最終增加業務收入的實際問題。公司的三位創始人分別是來自AI領域的科學家、成功的互聯網行業連續創業者和金融行業資深從業人士,這種跨界組合也并不多。
庖丁科技推出了兩個可供使用和測試的產品:AutoDoc和PDFlux。
其一期核心產品是全球首款金融文檔智能產品——AutoDoc,產品能夠對金融文檔中的勾稽關系進行檢查、核對財務數據和指標、數據的變動和比例以及錯別字。該產品在官網注冊登錄后即可試用。
筆者通過公開渠道下載了pdf的《中國中冶:2017年公開發行可續期公司債券(第二期)募集說明書》上傳,試用之后的結果非常令人吃驚。產品在15分鐘之后,找出了293頁的公開文件中的15個沖突,并自動生成了附帶標注的word文檔,將pdf中表格和圖表也進行了完美的轉換。以下是試用截圖: 


以下是轉換后的帶標注的word文檔: 

第二個可試用的產品是PDFlux,產品的功能是將pdf文檔中有線框和無線框表格轉化為Excel。進入www.pdflux.com網站登錄后免費試用。
筆者通過公開渠道下載了pdf的《南京銀行:2016年年度報告》上傳,該工具將pdf文檔中的表格進行了完美的轉換,沒有出現任何常見的格式錯亂、無框表格無法識別的情況。雖然功能看似簡單,但是筆者還真沒有在市面上試用過體驗效果這么好的產品,試用截圖如下:


3. VC SaaS
VC SaaS致力于開發創投業辦公工具,根據媒體報道公司已經開發出平臺2.0版本,是貫穿投前、投中、投后全流程的云辦公平臺。同時公司在也開始涉及行研報告領域,自建數據爬蟲并有眾多的數據采集源,通過公開渠道進行數據采集并進行自然語義處理(NLP),最終通過這些數據產出不同的行業報告和數據報告。但目前的行業和數據報告公開信息能找到的非常少。
辦公平臺的頁面及收費標準: 

4. 鼎復數據
公司的官網簡介是為金融機構的資產端業務提供研究數據、數據處理工具以及智能投研平臺的科技公司。公司的產品比較明確,是股票二級市場的投資研究平臺。其中包含了個股信息查詢、鼎復金融搜索引擎、PDF解析工具、公司/產品/人物圖譜。
筆者試用了鼎復金融搜索引擎和其PDF解析工具。金融搜索引擎和其他創業公司的金融信息搜索選股試用差別不大;值得一提的是PDFree工具,能夠智能抽取PDF中的表格, 轉換為Excel。這就需要用到AI技術。筆者通過公開渠道下載了一份《私募基金管理人登記及私募基金產品備案月報(2018年第1期)》上傳,工具能夠將明顯有邊框的表格完美的轉換成Excel,但是無邊框的表格和圖形目前還不能夠識別和轉換。 


公司官網上自行公布的準確率如下:

5. 文因互聯
文因互聯是一家智能金融技術與服務提供商,主要提供自動化公告摘要、自動化研報摘要、自動化報告寫作、金融查詢機器人、金融搜索等智能金融核心工具。
目前文因互聯的產品有文因助手——自動報告+金融問答,以及文因搜索。但是文因助手的自動化報告撰寫無法進行試用,所以此處不表。文因搜索的功能也是公司及行業公開信息的匯總及分析,使用截圖如下: 

第二類型:Wind +
下面要說大部分創業公司的2C產品較為簡單,仍是深度數據挖掘,未見數據間明顯的關聯性和預測,產品功能類似智能版Wind。Wind是金融人士最常用的金融數據和分析工具服務商,只是背后數據的來源更多的依靠大量人工進行采集,以下的金融科技公司或是將這些采集工作交給了更多的人工智能,或僅是在現有數據上進行了可視化分析,產品較為同質化,市場競爭激烈。
這類公司中有AlphaFA知著、IBDATA、企名片、數庫科技、通聯數據、因果樹。公司產品的區別主要在于所搜集的公司數據是一級市場還是二級市場,產業鏈的深度和廣度。同時針對查詢公司或者行業的基本面的結論依賴背后金融模型,這些智能分析的結果是好是壞,最后還需人腦來鑒別。
1. AlphaFA 知著
公司的核心產品是企業及行業信息整合的搜索引擎,筆者從官網上注冊試用后情況和體驗如下:
畫面簡潔流暢,可以搜索上市公司相關基本面信息和行業信息,包括企業基本情況、財務數據分析、企業發展趨勢分析和企業綜合分析。主要的核心技術還是數據挖掘、整合和常見的金融模型的組合。
比如筆者查詢金融科技行業相關信息,AlphaFA知著就可以顯示有9家主板上市公司,7家中小板上市公司,14家創業板上市公司,0家新三板公司,其中基礎層38家,創新層15家。行業凈利潤平均數在2016年為6091.48萬元等歷史信息。2C端的產品未看出與其他金融數據服務商有很大差別。
2. IBDATA
公司官方網站上介紹公司產品為信批搜索、深度搜索、項目盡調、投研應用。除了投研應用之外,其它產品開放試用。但深度搜索和項目盡調注冊程序較為繁瑣,需要微信后臺客服人工驗證申請信息。筆者試用了信批工具,僅能夠查詢到上市公司公開披露的信息。

3. 企名片
企名片的FinOS系統,官網號稱能夠提供更加豐富的一級市場企業數據、二級市場公告和財報結構化數據、國內外企業基本面數據,滿足金融機構和專業人士個性化的數據導出服務和行業研究需求。
筆者登錄后的體驗為產品非常簡單,僅是將創業公司的基本信息、融資歷史、公司團隊、相關競品、工商信息進行匯總。核心的技術還是在數據挖掘,并未見到更多的智能語義理解,信息之間的關聯。

4. 通聯數據
通聯數據背靠大企業萬向集團,百度百科中顯示中國企業500強第127位,是不差錢的創業公司。公司的產品有基本面研究平臺——蘿卜投研;量化投資平臺——優礦;對接資金方和管理人的FOF/MOM管理平臺——通聯魔方;以及金融科技最常見的智能投顧。
蘿卜投研本質上使用體驗與上述AlphaFA知著以及IBDATA沒有差別,都是公司基本面數據匯總,信息很全面,或許差別主要面向企業用戶能體驗到的金融模型算法后的一些結論。優礦更類似于一個量化投資平臺的討論社區。通聯魔方比較像是基金經理和買基金的人的一個交易平臺以及基金實時信息的一個匯總,還是偏向傳統的金融銷售。
蘿卜投研(紅框中功能不開放試用):

優礦:

通聯魔方: 
5. 數庫科技
數庫科技是一家基于機器學習算法的大數據量化分析公司,致力于為用戶提供智能化的數據服務。公司成立于2009年,公司的核心技術是通過數庫獨家的挖掘以及分析工具,可以使非結構化、半結構化的數據結構化;使原本無序沒有關聯的數據產生關聯性,進而實現數據智能化,為個人投資、金融機構投研提供精準而又全面的技術服務。
數庫科技專注的數據是行業和產業鏈的,爬蟲得到的數據需要被結構化之后再次整合。目前公司的產品有SAM行業分析工具,和基于SAM而衍生的產業鏈的分析工具。但產品并不開放試用,故筆者無法給出試用體驗,暫且只能將它排在第二類的公司中。
6. 因果樹
因果樹的官方網站上對產品的介紹是創投信息數據庫、產業鏈數據洞察系統、數據智能定制解決方案。他們的主打核心技術是自有智能標簽體系和企業關聯圖譜,能將企業準確的分門別類,有助有投資者分析。產品可快速搜索出創投公司的相關信息: 
第三類公司產品功能尚不明確或者公開信息不全。
1. 阿博茨
阿博茨公司的名字來源于ABC的中文拼音,A代表AI、B代表Block chain區塊鏈、C代表Cloud云技術。所以公司的發展方向有些分散讓人摸不著頭腦。2016年公司開發了區塊鏈的應用產品——同心互助,卻在2017年關閉區塊鏈相關的業務轉向人工智能,2018年3月楊永智在接受媒體報道時談及此事時,解釋為“第一還沒有找到時間點,Timing,第二還沒有找到那個除了數字貨幣之外的Application是什么。”除此之外,關于公司的兩款金融科技產品,為提升金融專業人士投資研究效率的“Modeling.ai”,以及數據預測產品“Eversight.ai”,相關信息都來源于媒體報道,官網無關于該產品的信息和試用入口。
2. 青椒科技
在青椒科技的相關媒體公開報道中,公司是一家金融科技公司,三個主要業務是:金融信息智能處理、人機交互交易系統和智能投顧+資管。核心產品是針對二手材料開發了智能研報處理系統,每天抓取研報,按照算法模型處理后,生成各種綜合簡報和圖譜。但在筆者調研過程中,發現相關信息都來源于媒體報道和創投信息網站,卻無法找到官方網站和產品試用入口。
3. 香儂科技
香儂科技是一家面向金融領域的人工智能公司,旨在用人工智能算法分析、提取、整合海量金融信息。公司剛剛在2018年1月獲得天使輪融資,目前沒有看到任何關于產品的信息。公司官網上顯示公司主要業務是創投信息數據庫、產業鏈數據洞察系統、數據智能定制解決方案,對比前面盤點的第二類型的公司來說,業務并沒有特別之處。
以上就是針對14家核心技術為NLP+CV的金融行業企業級服務的創業公司的盤點情況。金融一直都是走在科技前端的行業,而能夠真正將NLP+CV技術實現應用場景化的這些金融科技公司,筆者相信,最終將會走的更遠,成為金融科技3.0時代的獨角獸,甚至能拓展至全行業中去。
雷鋒網雷鋒網雷鋒網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。