admin管理员组

文章数量:1550655

论文传送门

我们提出了一种新的范式——称为PK聚类——来帮助社会科学家在社会网络中创建有意义的聚类。存在许多聚类算法,但大多数社会科学家发现它们难以理解,并且工具没有提供任何指导来选择算法,或者考虑到科学家的先验知识来评估结果。我们的工作引入了一个新的集群范例和一个可视化分析用户界面来解决这个问题。它基于以下过程:1)将科学家的先验知识捕获为一组不完整的聚类,2)运行多个聚类算法(类似于聚类集成方法),3)通过每个算法与先验知识的匹配程度来可视化所有排序和总结的算法的结果,5)评估用户选择的算法之间的一致性,6)允许用户查看细节并迭代更新获得的知识。我们用一个最初的功能原型来描述我们的范例,然后提供两个使用的例子和来自社会科学家的早期反馈。我们相信,我们的聚类范例提供了一种新颖的建设性方法来迭代地构建知识,同时避免被经常随机选择的黑盒聚类算法的结果过度影响。

传统聚类不令人满意,主要原因有:

  • 这迫使他们一个接一个地尝试大量的黑盒算法,调整对他们来说毫无意义的参数;
  • 即使一个参数对他们有意义,比如要计算的聚类数,k-means聚类中的k,他们也不知道什么值会产生好的结果,只能试错;
  • 即使他们可以根据他们的先验知识来费力地评估所有聚类算法的结果,但是没有一个现有的系统允许用户这样做,导致用户放弃并盲目地接受他们尝试的第一个算法的结果。

本文的贡献:

  • 一种新的交互式聚类范例
  • 原型。用13种不同族的聚类算法应用不同的参数配置实现PK聚类;
  • 两个案例研究

本文标签: KnowledgemixedIntegratingPriorNetwork