admin管理员组

文章数量:1533099

2024年6月19日发(作者:)

推荐五个免费开源数据挖掘软件(Orange、RapidMiner

等)

Orange

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功

能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览

数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整

的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,

模式评估和勘探的功能。其由C++和 Python开发,它的图形库是由

跨平台的Qt框架开发。

RapidMiner

RapidMiner, 以前叫 YALE (Yet Another Learning Environment),

其是一个给机器学习和数据挖掘和分析的试验环境,同时用于研究了

真实世界数据挖掘。它提供的实验由大量的算子组成,而这些算子由

详细的XML 文件记录,并被RapidMiner图形化的用户接口表现出来。

RapidMiner为主要的机器学习过程提供了超过500算子,并且,其

结合了学习方案和Weka学习环境的属性评估器。它是一个独立的工

具可以用来做数据分析,同样也是一个数据挖掘引擎可以用来集成到

你的产品中。

Weka

由Java开发的 Weka (Waikato Environment for Knowledge

Analysis)是一个知名机器学机软件,其支持几种经典的数据挖掘任务,

显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。其

技术基于假设数据是以一种单个文件或关联的,在那里,每个数据点

都被许多属性标注。 Weka 使用Java的数据库链接能力可以访问SQL

数据库,并可以处理一个数据库的查询结果。它主要的用户接品是

Explorer,也同样支持相同功能的命令行,或是一种基于组件的知识

流接口。

JHepWork

为科学家,工程师和学生所设计的 jHepWork 是一个免费的开源

数据分析框架,其主要是用开源库来创建一个数据分析环境,并提供

了丰富的用户接口,以此来和那些收费的的软件竞争。它主要是为了

科学计算用的二维和三维的制图,并包含了用Java实现的数学科学库,

随机数,和其它的数据挖掘算法。 jHepWork 是基于一个高级的编程

语言 Jython,当然,Java代码同样可以用来调用 jHepWork 的数学

和图形库。

KNIME

KNIME (Konstanz Information Miner)是一个用户友好,智能的,

并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。

它给了用户有能力以可视化的方式创建数据流或数据通道,可选择性

地运行一些或全部的分析步骤,并以后面研究结果,模型以及可交互

的视图。 KNIME 由Java写成,其基于 Eclipse 并通过插件的方式来

提供更多的功能。通过以插件的文件,用户可以为文件,图片,和时

间序列加入处理模块,并可以集成到其它各种各样的开源项目中,比

如:R 语言,Weka, Chemistry Development Kit,和 LibSVM.

本文标签: 数据挖掘数据学习用户