2011年度  第6期


标题:基于SQL的属性约简算法的改进
作者:田迪 刘建平
作者单位:浙江理工大学信息电子学院,浙江 杭州 310018
关键字:粗糙集,属性约简,属性依赖度,结构化查询语言(SQL),医疗数据挖掘
摘要:对医疗数据进行挖掘能够对现有病历数据库中的数据进行自动分析并且提供有价值的医学知识。针对信息系统S=(U,C∪D,f,V),提出一种精简条件属性集C的求核方法,然后在此基础上针对以下这个问题,即临床病历数据库中存在大量重复样本和冗余属性,从而影响医疗诊断的精度和速度这个问题,建立基于信息论的粗糙集理论模型和SQL语言之间的关系,提出了基于SQL语言的条件信息熵属性约简算法。仿真结果表明,该算法实现简单,运行效率高,使得基于SQL语言的条件信息熵属性约简算法实用性更强,为粗糙集理论更广泛地应用于具体医疗数据挖掘提供了一种方法。