欢迎访问 计算机与信息技术学院(大数据学院)
当前位置: 首页 » 师资队伍 » 教授 » 曹付元
  • 曹付元



  • 电子邮箱:cfy@sxu.edu.cn


  • 研究方向:数据挖掘与机器学习

  • 个人简介
  • 发表论文
  • 主持或参与项目

曹付元,男,1974年5月生,博士,教授,博士生导师,山西大学计算机与信息技术学院(山西大学大数据学院)副院长。2010年山西大学计算机与信息技术学院计算机应用技术专业毕业,获博士学位,同年晋升为副教授。2011年12月至2013年12月在中科院深圳先进技术研究院从事博士后研究。2014年8月至2015年8月在加拿大Simon Fraser大学进行学术访问。目前的主要研究方向是块数据聚类、演化聚类、聚类集成、子空间聚类等。近年来,先后主持国家自然科学基金面上项目1项、中国博士后基金项目(一等资助)1项、山西省自然科学基金项目2项、山西省高校科技研究开发项目1项;作为主要成员参与了国家863计划项目2项、国家自然科学基金项目2项(重点基金1项)、国家973计划前期研究专项项目1项。先后在《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Fuzzy Systems》、《Information Sciences》、《Pattern Recognition》、《Neurocomputing》、《Computers and Mathematics with Applications》、《Knowledge-Based Systems》、《Expert Systems with Applications 》、《计算机研究与发展》等国际国内重要学术刊物和国际会议PAKDD上发表学术论文30余篇。完成的博士学位论文《面向分类数据的聚类算法研究》获2010年度山西省优秀博士学位论文奖和2011年度中国人工智能学会优秀博士学位论文奖。

[1] Fuyuan Cao, Joshua Zhexue Hang, Jiye Liang, Xingwang Zhao, Yinfeng Meng. An Algorithm for Clustering Categorical Data with Set-valued Features, IEEE Transactions on Neural Networks and Learning Systems, 2018, (DOI:10.1109/TNNLS.2017.2770167).

[2] Xingwang Zhao, Fuyuan Cao, Jiye Liang. A sequential ensemble clusterings generation algorithm for mixed data, Applied Mathematics and Computation, 2018, 335:264–277.

[3] Yinfeng Meng, Jiye Liang, Fuyuan Cao, Yijun He. A new distance with derivative information for functional k-means clustering algorithm, Information Sciences, 2018, 10.1016/j.ins.2018.06.035.

[4] Fuyuan Cao, Joshua Zhexue Huang, Jiye Liang. A fuzzy SV-k-modes algorithm for clustering categorical data with set-valued attributes, Applied Mathematics and Computation, 2017, 295:1–15.

[5] Fuyuan Cao, Liqin Yu, Joshua Zhexue Huang, Jiye Liang. k-mw-modes: an algorithm for clustering categorical matrix-object data, Applied Soft Computing, 2017, 57:605-614.

[6] Fuyuan Cao, Joshua Zhexue Huang, Jiye Liang. Trend analysis of categorical data streams with a concept change method, Information Sciences, 2014, 276:160–173.

[7] Xingwang Zhao, Jiye Liang, Fuyuan Cao. A simple and effective outlier detection algorithm for categorical data, International Journal of Machine Learning and Cybernetics, 2014, 5(3):469–477.

[8] Fuyuan Cao, Jiye Liang, Deyu Li, Xingwang Zhao. A weighting k-Modes algorithm for subspace clustering of categorical data, Neurocomputing, 2013, 108:23-30.

[9] Liang Bai, Jiye Liang, Chuangyin Dang, Fuyuan Cao. The impact of cluster representatives on the convergence of the K-Modes type clustering, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(6):1509-1522.

[10] Liang Bai, Jiye Liang, Chuangyin Dang, Fuyuan Cao. A novel fuzzy clustering algorithm with between-cluster information for categorical data, Fuzzy Sets and Systems, 2013, 215:55–73.

[11] Fuyuan Cao, Jiye Liang, Deyu Li, Liang Bai, Chuangyin Dang. A dissimilarity measure for the k-Modes clustering algorithm, Knowledge-Based Systems, 2012, 26:120-127.

[12] Jiye Liang, Xingwang Zhao, Deyu Li, Fuyuan Cao, Chuangyin Dang. Determining the number of clusters using information entropy for mixed data, Pattern Recognition, 2012, 45(6):2251–2265.

[13] Jiye Liang, Liang Bai, Chuangyin Dang, Fuyuan Cao. The k-means-type algorithms versus imbalanced data distributions, IEEE Transactions on Fuzzy Systems, 2012, 20(4):728-745.

[14] Liang Bai, Jiye Liang, Chuangyin Dang, Fuyuan Cao. A cluster centers initialization method for clustering categorical data., Expert Systems with Applications, 2012, 39(9):8022-8029.

[15] Fuyuan Cao, Jiye Liang. A data labeling method for clustering categorical data, Expert Systems with Applications, 2011, 38(3):2381-2385.

[16] Liang Bai, Jiye Liang, Chuangyin Dang, Fuyuan Cao. A novel attribute weighting algorithm for clustering high-dimensional categorical data, Pattern Recognition, 2011, 44(12):2843-2861.

[17] Fuyuan Cao, Jiye Liang, Liang Bai, Xingwang Zhao, Chuangyin Dang. A framework for clustering categorical time-evolving data, IEEE Transactions on Fuzzy Systems, 2010, 18(5):872-882.

[18] 梁吉业, 白亮, 曹付元. 基于新的距离度量的K-Modes聚类算法, 计算机研究与发展, 2010, 47(10):1749-1755.

[19] 杨红菊, 韩建栋, 曹付元. 采用位平面直方图特征向量的图像检索方法, 计算机工程与应用, 2010, 46(21):165-167.

[20] Fuyuan Cao, Jiye Liang, Guang Jiang. An initialization method for the K-Means algorithm using neighborhood model, Computers and Mathematics with Applications, 2009, 58:474-483.

[21] Fuyuan Cao, Jiye Liang, Liang Bai. A new initialization method for categorical data clustering, Expert Systems with Applications, 2009, 36(7):10223-10228.

[22] 杨红菊, 张艳, 曹付元. 一种基于颜色矩和尺度纹理特征的彩色图像检索方法, 计算机科学, 2009, 36(9):274-277.

[23] 姜广, 曹付元, 张倚驰, 高嘉伟. 基于SQL的粗糙集属性约简方法, 计算机工程, 2008, 34(11):69-71.

[1] 面向关联关系数据的概念学习方法研究. 国家自然科学基金面上项目, 2016.01-2019.12, 主持人

[2] 面向中医电子病历大数据分析及示范应用. 山西省重点研发计划项目,2018.10-2021.12,主持人

[3] 面向跨领域数据的概念融合方法研究. 山西省留学基金项目,2016.01-2018.12, 主持人

[4] 大数据分割与融合方法研究. 山西省留学择优资助项目,2017.01-2019.12, 主持人

[5] 面向分类型块数据的聚类算法研究. 山西省自然科学基金项目, 2015.01-2017.12, 主持人

[6] 面向块数据的用户行为模式聚类算法研究. 中国博士后科学基金面上项目(一等资助), 2012.03-2013.12, 主持人

[7] 面向符号属性数据的聚类算法研究. 山西省自然科学青年基金项目, 2010.01-2012.12, 主持人

[8] 基于软计算的数据挖掘技术研究与实现. 山西高校科技研究开发项目, 2007.01-2009.12, 主持人

[9] 面向企业的智能数据分析平台. 太原市科技局项目,2007.04.-2008.03, 主持人

[10] 面向超市数据挖掘系统的研究与实现. 山西大学青年基金, 2005.04-2007.10,主持人