数据挖掘系统
一、数据挖掘系统的结构

二、数据挖掘系统的设计
1. 数据挖掘系统怎样与数据源系统的集成
(1)不耦合:是指数据挖掘系统不利用数据源系统的任何功能;
(2)松散耦合:是指利用数据源系统的某些功能。
(3)半紧密耦合:是指将数据挖掘系统连接到数据源系统,在数据源系统中实现并存储一些基本数据挖掘计算和中间结果;
(4)紧密耦合:是指数据挖掘系统平滑地集成到数据源系统,数据挖掘系统作为数据源系统的一个功能组件,数据挖掘任务根据数据源系统的功能进行优化与实现。
2、数据挖掘系统指定目标数据集
指定目标数据集就是说明与数据挖掘任务相关的数据、用户感兴趣的数据或者要进行挖掘的数据。
3、数据挖掘系统指定数据挖掘任务
指定数据挖掘任务就是说明用户感兴趣的知识类型或者要挖掘得到的知识类型。
目前,知识类型包括特征规则、比较规则、分类规则、关联规则、聚类规则和预测规则等。
4、数据挖掘系统的解释与评价模式
一个数据挖掘系统可以挖掘出数以千计的模式,并非所有的模式都是用户感兴趣的。
因此数据挖掘系统应该提供帮助用户评估模式的功能,目前常用的手段是通过用户设置兴趣度阈值来选择感兴趣的模式,没有兴趣度度量,挖掘出来的有用模式很可能会淹没在用户不感兴趣的模式中。
5、数据挖掘系统利用领域知识
在数据挖掘中,领域知识可以指导数据挖掘过程及模式的评估。
最多的领域知识是概念分层,利用它可以进行数据概化和数据归约,提高挖掘效率。领域知识一般由系统用户、领域专家提供。
6、数据挖掘怎样呈现知识
数据挖掘的结果需要呈现给用户,因此数据挖掘系统应该提供多种直观、易于理解的知识表示功能。
通常采用图、表等可视化方式将结果提交给用户,有时还需要提供交互功能,便于用户指导进一步挖掘。
三、常用的数据挖掘系统及其发展
1、常见的数据挖掘系统
目前市场上有多种较为成熟的数据挖掘系统(产品)供人们用于数据挖掘任务设计,归纳起来,分为以下三类:
一般分析目的数据挖掘系统
、 针对特定功能或产业的数据挖掘系统
、 整合决策支持/OLAP/数据挖掘的大型分析系统。
2、数据挖掘系统的发展

