金融信息数据库,挖掘数据深层价值

时间:2022-10-30 09:01:28

金融信息数据库,挖掘数据深层价值

金融信息数据库产业是指对金融和产业信息进行收集加工和组织成为计算机可读介质,并根据用户需要,通过网络通信及其它现代化手段对信息进一步挖掘、利用和传递的产业。随着商业信息技术的飞速发展,商业信息服务手段发生了根本性变革,金融信息数据库也成为新经济发展中必不可少的一环。金融信息数据库在为制定我国相关产业政策、区域产业结构的调整、科学技术水平的提高、区域核心竞争力的提升等诸多方面都可起到有力的支撑保障和促进作用。但我国金融信息数据库规模小、水平低、服务落后。我国亟需要对大量的新兴产业进行相关数据库的建立,并满足研究和政策制定的需要。

金融信息数据库价值显现

随着经济的发展,日益增多的金融分析、金融交易、企业决策或者其他商业活动让社会各界对金融信息服务的需求应运而生。此时,一个跨技术、媒体、咨询的行业就呈现出来,那就是金融信息数据库产业。他们或者提供权威及时的金融信息,或者从金融终端、网络广告上着手,或者以网络服务见长。总之,今天的金融信息数据库产业,正在凭借具有的信息优势努力生存发展着,也成为新经济领域必不可少的服务商。

因为在社会信息化程度不断提高的今天,商业信息资源的开发和利用,不仅可以全面分析行业、市场、企业等多层面的信息,还能通过权威的数据和科学的分析,让用户把握行业的发展方向、格局和政策环境,帮助客户评估行业的投资价值。所以说金融信息数据库不仅是整个社会信息资源开发利用的基础,也是现代信息服务业的重要支柱之一。

很多人觉得金融信息数据库值钱的是数据。但实际上,历史数据是不值钱的,因为历史数据比较容易被拷贝,只有实时和最新的数据才值钱。从内容生产方面,无论是国内和国外的金融信息数据库,都志在提供随时更新且具有历史深度的数据,也就是说金融信息数据库的本质是建立实时数据数据库。如果有原始的数据,还需要按照一定的数据规则将数据呈现出来,便于别人利用和加工,这就是数据处理的规则。这个需要很长时间的消化和积累,也算是行业的一个重要门槛。所以业内专家说,金融信息数据库这个行业的技术含量在于持续生产数据的能力,以及对数据处理的规则。

目前国际上比较完善的金融信息数据库包括BVD数据库、CRSP数据库、Compustat数据库、美国彭博资讯公司等。

比如BVD作为全球金融行业内最知名的专业信息库供应商,BVD数据可所包含是数据信息量大,并且还支持在线随时更新。

在数据结构方面,BVD这可以为用户提供各式各样的数据服务。其子库均提供全球的金融数据(包括当前数据和历史数据)。在数据宽度方面,上市企业库可以提供各企业5到20年的财务数据、未来三年内的RPS盈利预期;银行库提供各银行长达16年的历史数据和分析比例;全球宏观库提供1980年到2030年五十年间的历史、当前与未来的预期数值;全球并购分析库可以提供1997年以来各国并购案数据四十多万件。在数据深度方面,企业财务数据库除了可以提供多年的财务数据外,甚至可以提供资产负债表、损益表等明细。同时还可以提供多至全球180多个国家、地区的实时更新的国家战网分析报告。

成立于1982年的美国彭博资讯公司是目前全球最大的财经资讯公司。彭博仅用了22年的时间,就将它的金融数据市场的销售收入超越了具有150年历史的、世界上最大的资讯公司――路透集团。BLOOMBERG PROFESSIONAL(R)(彭博专业)服务及彭博的媒体服务整合在一个平台上为全球各地的公司、新闻机构、金融和法律专业人士提供实时行情、金融市场历史数据、价格、交易信息、新闻和通讯工具。彭博的媒体服务包括在全球拥有130家新闻分社和2,000名新闻专业人员的彭博新闻社 (BLOOMBERG NEWS(R))、每天24小时以7种语言在全球通过10个不同的频道播放财经新闻的彭博电视台 (BLOOMBERG TELEVISION(R)) 以及在全球范内在 XM、Sirius 及 WorldSpace 卫星电台和纽约 WBBR 1130AM 提供即时新闻的彭博电台 (BLOOMBERG RADIO(SM)。另外,彭博还出版了针对专业投资人士的 BLOOMBERG MARKETS(R) 杂志和 BLOOMBERG PRESS(R) 书籍。

美国的CRSP数据库是全球金融业成立比较早、体系比较健全的数据库之一,它主要提供美国金融市场的具体数据,因此在证券领域极具权威性。CRSP数据库在1959年由芝加哥大学商学院研究生院建立,全称为证券价格研究中心,它的数据来源包括纽约交易所、美国证券交易所和纳斯达克证券交易所的上市股票交易信息。CRSP的数据库信息更新很快,它提供C、FORTRAN、SAS、ACESS等文件格式的数据,很大程度上满足了教学、研究的需求。

美国的Compustat数据库则是美国信用评级公司标准普尔研发出来的。它提供全球80多个国家中的5万多家上市企业司、北美地区企业和7千多家亚洲的上市企业的75000只证券的基本企业信息和市场数据,该证券市值占到了全球总市值的90%以上。标准普尔公司研发的数据库专业性很强,他们提供的软件可以对不同企业进行财务、行业等数据分析,之后根据结果制作出各种应用报表和动态图表。

中国金融信息数据库发展迅速

纵观全球,国际金融中心背后必有金融信息服务业巨头,如纽约有彭博社,伦敦有路透集团。目前全球金融信息市场规模近五百亿美元,如此丰厚的市场蛋糕引得战国群雄纷纷逐鹿。目前美国有金融信息数据库生产商有1000多家,数据库4000多个,对于中国市场来说,大量的商业活动、投融资都需要数据的支撑,以便于分析和做出决策。国内做的比较好的有Wind数据库、恒生聚缘数据库、锐思数据库、CSMAR数据库、中国统计局数据库、巨潮数据库、巨灵数据库等。

目前,万得资讯(Wind)系列产品在国内基金和证券公司的覆盖率也已逾八成。万得资讯总部位于上海陆家嘴金融中心,在香港、北京、深圳、成都、沈阳、武汉等地设有分支机构。据悉,万得资讯的客户涵盖证券、基金、保险、银行、QFII、ZF机构、高校等1500多家企业,在金融机构的客户占有率达90%左右。高盛、美林、摩根大通、里昂、野村、瑞士信贷第一波士顿等几十家国际知名金融机构都是Wind资讯的忠实客户,大量的中英文媒体、研究报告、学术论文等同样多次引用Wind资讯的数据。

中国的国泰安(CSMAR)数据库是国泰安公司研发的,主要针对高等院校、社会科研机构、金融证券机构,适用于中国当前金融情况、经济状况,它是研究型的专业金融、经济数据库。国泰安数据库涉及面广,涵盖信息量大,它包括上市企业、股票市场、期货市场、债券市场、外汇、黄金市场等等各方面的经济数据。国泰安提供了两种不同的服务方式:第一是根据特定需求提供需求数据,这种方式的优点就是不需要客户熟悉整个数据库,简单快捷;第二就是提供所有的相关数据文件,用户可以根据需要随时提取数据库中的信息。

成立于2007年12月14日,是国内领先的以及产品类别最全面的互联网金融信息服务提供商,主要提供国内资本市场提供金融资讯、数据分析和软件系统服务。代表产品有:网上行情交易系统、决策家、深度分析系统(Level-2)、大机构、小财神、手机金融信息等。公司采用“平台免费、增值服务收费”的方式,以免费的网上行情交易客户端和网站为平台,通过互联网和移动通信网络向证券市场投资者提供及时、全面的金融资讯、数据及分析服务。

东方财富公司则以东方财富网站为依托平台,旗下代表网站有东方财富网()、天天基金网(.cn)和股吧(.cn)等。目前,公司下属东方财富系列网站,为用户提供免费信息服务和付费的金融数据服务。从日均覆盖人数(UV)和日均浏览页面数(PV)来看,东方财富网均排在国内财经门户网站第一位,股吧和天天基金网则成为个人投资者进行股票和基金投资必不可少的理财工具。

增长迅猛的中国金融信息服务市场也正为全球金融信息服务巨头所虎视眈眈。在外强环伺的市场环境中,金融信息数据库本土企业也正茁壮成长。我国本土企业跨界数据、媒体、咨询,盈利模式也多种多样,包括金融终端、网络广告、无线财经和其它业务等四类。主要上市公司中,主要以提供金融终端服务,东方财富网和金融界目前以网络服务见长。

大量新兴产业数据库依然缺失

中国正在创新培育方式,加快发展新兴产业的浪潮中。我国也就信息产业、节能环保、生物产业、新能源、新能源汽车、高端装备制造业和新材料等重点新兴产业做了全面部署。我国宏观层面的战略性新兴产业规划颁发后,需要各个行业的企业去逐步地落实、落地,这就需要大量的数据分析来帮助企业掌握目前行业发展的动态。

经过笔者查询,目前市场上可以提供服务的有中经网产业数据库、中国产业信息网数据库、产业数据库中商产业研究院数据库、中宏产业数据库、广东省产业发展数据库文化产业数据库、战略性新兴产业数据库、易观智库产业数据库等。这些数据库可以向客户提供部分数据和咨询服务。

比如中宏产业数据库整合了来自国家统计局、国家发改委、海关总署、各行业主管部门和各行业协会等单位的统计资料,中宏产业数据库包含了中国的十大支柱工业产业群,即能源、冶金、机械、汽车、电子、石化、轻工、纺织、医药、建材,和五大服务业支柱产业群,即交通、房地产、通信、旅游、商贸。该数据库更新度有较长的延迟,主要受限于我国各个政府部门统计的时间差。

国研网基于长期以来的信息服务经验并借助广泛的信源渠道,于2011年8月份推出专业权威、全面系统的“战略性新兴产业”数据库。“战略性新兴产业数据库”主要针对七大战略性新兴产业发展中的热点、重点、发展趋势以及政策导向等进行动态跟踪、情报收集与研究分析,力求全方位、多视角、深层次地记录各产业的市场运行态势。目前该数据库主要针对文字类情报进行收集整理,未来可能对数据结构进行提升。由于数据处理是个系统工程,包括筛选、整理、分析等标准环节,对数据结构化提出了更高要求。

Zdatabase是清科研究中心旗下一款覆盖中国创业投资及私募股权投资领域比较全面和及时的专业数据库。该数库可为众多的有限合伙人、VC/PE投资机构、战略投资者,以及政府机构、律师事务所、会计师事务所、投资银行、研究机构等提供一定的信息服务。用户可以对某时间段的中国范围内的投资事件、上市事件、并购事件、募资事件、投资机构、企业库、投资人物等数据进行查询。此外其还会进行推荐VE、推荐PE、推荐天使等商业推介服务。另外,清科研究数据库还专门针对风险投资,私募股权,创业者相关投资、私募、并购、上市数据库进行专栏板块设计,以满足投资机构、企业、投资人物的不同需求,对于TMT、传统行业、清洁技术、生技健康等行业市场事件也会有定期的总结。

当然,除了以上的数据库,很多研究者、学者也在应用政府的数据进行分析。但从研究分析的角度来看,中国的很多行业数据质量非常不好,而且很多都是缺的,特别是大量新兴产业数据库依然缺失。

一些专家表示,这可能与以前很多行业部门没有做这些系统数据的收集有关。也正因为如此,目前市场上可见的一些数据库,行业数据都是卖得非常贵,尤其是和上市公司非常密切的行业竞争对手数据。笔者也了解到,普通的一本行业分析报告,价格都在6000-20000元之间,如果需要定制那么价格更为昂贵。为了节省开支,很多分析师都是使用购买行业协会的数据来做研究,因为虽然行业协会的统计数据精确度不够,但是有起码的数据做参考,越来越多的分析员感觉到连Wind这种数据库基本不能满足现在的行业数据分析需求。

笔者在实际应用中也发现很多问题,比如要查阅“智能家居”,只有几个数据库能反应,而且数据信息不完整。还有就是更新度很差。比如要查询中国出入境旅游人数和目的地的数据,国家旅游局网站在2017年2月的数据只更新到2016年下半年,其他数据库的数据难以满足研究的及时需要。还有就是很多信息根本无法查到,特别是一些时间跨度比较大的行业,比如2000年到2016年的中国光伏产品进出口的数据,很难查询到,这可能跟一般的统计部门根本无法进行收集有关。

另外某些信息缺乏可靠性。我国大部分的数据都是根据一些部级的,具有权威性的资料进行采集,这些数据主要存在于年报、年鉴、年度统计报告中,时效性一般要延迟半年到一年。所以大部分数据库在更新和完善情况上有着明显不足,时效性短,缺乏可靠性。还有就是缺少自动校对功能。很多数据库系统开发时间较短,功能不完善,其中尤其缺少自动校对功能模块,很多由人工收集和整理计算,由于人工收集精度较低,极易出现错误。

产业金融数据库开发,未来的金矿

数据作为高级生产力,伴随着各领域数据的价值的挖掘,一些新的商业模式也开始产生影响,如基于数据的互联网保险、基于数据的互联网金融、基于数据的供应链金融等。如今,大数据这个词已经无处不在。无论是大企业、小企业、传统行业、新兴行业,每一家公司都加入了大数据的浪潮,好像有了大数据就能解决所有问题。

我们对大数据重要性的痴迷,往往会产生误导。因为拥有了大数据,并不表示能从数据中能获取有价值的东西,尤其对于管理者、创新者来说,数据量和规模不是关键的因素,找到正确的数据才是关键。

对于具体的企业家来说,他们需要的更不是大数据,而是“小数据”,具体来说,是具有指导意义的精准数据。比如目前全球经济增长动力不足,加上特朗普的贸易保护政策,世界各国对跨境贸易的往来正呈现紧缩的趋势,随着“一带一路”战略的实施,越来越多的中国企业渴望“走出去”。但是相关的数据能帮助企业家来决策吗?“一带一路上的资源分布与投资环境如何”、“一带一路经济区的现代物流体系如何”、“一带一路沿线的产业园区有哪些”、“一带一路目前的铁路规划够经过哪些城市”等等关键信息还是非常模糊,目前根本没有数据库涉足该领域。目前也没有中国数据库企业对“一带一路”所涉及的这些信息进行整理和深度挖掘。如果有企业做“一带一路金融信息数据库”,一定会成为整个行业的需求和供给亮点。

此外在电信、金融、医疗、精准营销、交通、工业等领域,都需要专业而不是宏观的数据库来支持细分行业的发展。就如同Uber的成功并不是依靠他们所采集的大量数据一样, Uber的成功来自非常不同的东西,小的、但是正确的数据:车辆调度数据。这些“小数据”既来自行业公司的收集,也来自整个社会的贡献。这些“小数据”也是真正值得行业挖掘的金矿,因为只有针对性极强的“小数据”才可以真正对接技术与产业、公司与产品、需求与供给以及人才与管理。这些都是未来产业金融数据库开发中的重点。

所以姆⒄估纯矗一幅“小数据”未来的美好画卷将徐徐展开。虽然从整体上看,我国产业金融信息数据库都有规模小、水平低和服务落后等问题。当今中国的金融数据库体系还非常不完善,应用范围低,缺少一些功能性模块,实用性较差,主体结构大部分还是模仿发达国家的先进数据库,缺乏创新能力,缺乏创造力。但这也预示着该行业的发展潜力。中国的相关企业需要加强对金融数据库的自主研发和应用工作,加强自主技术创新能力,在摸索中求发展,在前进中长经验,从而满足各行业生产信息化建设日益扩大的需求。

上一篇:探寻石墨烯产业化路径 下一篇:信息化环境下初中数学函数教学的策略简述