|
|
 |
 |
|
据挖掘在证券行业中的应用 |
|
胡乐群 |
一、前言
面对经济全球化和和全球经济信息化的发展趋势,以信息化带动工业化,发挥后发优势,实现社会生产力的跨越式发展既是战略上的必由之路,亦是策略上的可行之法。其核心是加速信息高科技的发展及其产业化,提高信息技术在经济和社会诸领域的应用水平,最终推动经济和社会的发展。
自八十年代投资人工智能(AI)研究项目失败后,人工智能转入实际应用时提出了一个新兴的、面向商业应用的研究课题——数据挖掘。目前,越来越多的管理人员正在利用数据挖掘工具,解决所遇到的至关重要的商业问题和决策问题,如企业经营方向的定位、管理模式的确立、营销的决策、内部生产力的促进、成本的控制和企业核心竞争力的获取等。
数据挖掘首先是需要在商业环境中收集了大量的数据,然后运用挖掘的知识对企业已有的数据进行分析,具有不同的应用形式。例如:
(1)作为企业经营分析研究工具 (Research)
(2)嵌入企业运营系统提高过程控制(Process Improvement)
(3)作为市场营销分析工具(Marketing)
(4)作为客户关系管理CRM工具(Customer Relationship Management)
创智BI研究小组以商业问题为导向,深入研究了数据挖掘在证券、银行、电信、保险等数据密集型行业的应用。同时,针对证券行业CRM应用,及时推出了“先机证券”产品,以期协助证券公司在分析客户、了解客户、开发客户,细分市场的基础上确定企业的经营策略,建立企业的竞争优势和增强企业整体盈利能力。
本文将从数据挖掘技术谈起,结合行业特点和实际应用,提出并分析证券行业需求,给出创智“先机证券”的解决方案,并进一步展望数据挖掘在证券行业的发展前景。
二、数据挖掘技术的概念和实用价值
1.数据挖掘的概念
所谓数据挖掘,是从海量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。也就是根据预定义的商业目标,对大量的企业数据进行探索和分析,揭示其中隐含的商业规律,并进一步将其模型化的先进有效技术过程。数据挖掘是一门交叉学科,它集成了许多学科中成熟的工具和技术,包括数据库技术、统计学、机器学习、模型识别、人工智能、神经网络等等。
数据挖掘能做以下六种不同事情:分类 (Classification) 、估值(Estimation)、 预测(Prediction) 、相关性分组或关联规则(Affinity grouping or association rules) 、聚类(Clustering)、描述和可视化(Description and Visualization)
(1)分类
分类即区分数据类别。首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。
(2)估值
估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出,同时分类的类别是确定数目的,估值的量是不确定的。
(3)预测
通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。预测其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。
(4)相关性分组或关联规则
通过分析数据或记录间的关系,决定哪些事情将一起发生。
(5)聚类
聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚类不依赖于预先定义好的类,不需要训练集。
(6)描述和可视化
即对数据进行归约、概化或图形描述等。
2.数据挖掘的使用价值
数据挖掘技术源于商业的直接需求,因此它在各种商业领域都存在广泛的使用价值。
★客户分析
随着“以客户为中心”的经营理念的不断深入人心,分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。通过对积累的交易数据进行分析,可以按各种客户指标(如自然属性、收入贡献、交易额、价值度等)对客户分类,然后确定不同类型客户的行为模式,以便采取相应的营销措施,促使企业利润的最大化。 |
| |
|
赛迪网 |
| |
| |
|