K-means聚类算法|电子爱好者

admin管理员组
文章数量:1660164

计算欧几里得距离

# -*- coding: utf-8 -*-
import numpy as np
def euclid_distance(x1, x2):
    """计算欧几里得距离
    参数:
        x1 - numpy数组
        x2 - numpy数组
    返回值：
        distance - 浮点数，欧几里得距离
    """
    distance = 0
    #   请在此添加实现代码     #
    #********** Begin *********#
    import numpy as np
    distance = np.sqrt(np.sum((x1-x2)**2))
    #********** End ***********#
    return distance

计算样本的最近邻聚类中心

# -*- coding: utf-8 -*-
def nearest_cluster_center(x, centers):
    """计算各个聚类中心与输入样本最近的
    参数:
        x - numpy数组
        centers - numpy二维数组
    返回值：
        cindex - 整数，类中心的索引值，比如3代表分配x到第3个聚类中
    """
    cindex = -1
    from distance import euclid_distance
    #   请在此添加实现代码     #
    #********** Begin *********#
    #计算点到各个中心的距离
    n_clusters = len(centers)
    distance_list = []
    for cluster_index in range(n_clusters):
        distance_list.append((cluster_index, euclid_distance(x, centers[cluster_index])))
    #找出最小距离的类
    distance_list = sorted(distance_list, key=lambda s:s[1])
    cindex = distance_list[0][0]
    #********** End ***********#    
    return cindex

计算各聚类中心

# -*- coding: utf-8 -*-
def estimate_centers(X, y_estimated, n_clusters):
    """重新计算各聚类中心
    参数:
        X - numpy二维数组，代表数据集的样本特征矩阵
        y_estimated - numpy数组，估计的各个样本的聚类中心索引
        n_clusters - 整数，设定的聚类个数
    返回值：
        centers - numpy二维数组，各个样本的聚类中心
    """
    import numpy as np
    centers = np.zeros((n_clusters, X.shape[1]))
    #   请在此添加实现代码     #
    #********** Begin *********#
    for i in range(n_clusters):
        centers[i] = np.mean(X[y_estimated==i], 0)
    #********** End ***********#
    return centers

评估聚类效果

# -*- coding: utf-8 -*-
def acc(x1, x2):
    """计算精度
    参数:
        x1 - numpy数组
        x2 - numpy数组
    返回值：
        value - 浮点数，精度
    """
    value = 0
    #   请在此添加实现代码     #
    #********** Begin *********#
    import numpy as np
    value = float(np.sum(x1==x2))/len(x1)
    #********** End ***********#
    return value

组合已实现的函数完成K-means

# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd
from distance import euclid_distance
from estimate import estimate_centers
from loss import acc
from near import nearest_cluster_center
#随机种子对聚类的效果会有影响，为了便于测试，固定随机数种子
np.random.seed(5)
#读入数据集
dataset = pd.read_csv('./data/iris.csv')
#取得样本特征矩阵
X = dataset[['150','4','setosa','versicolor']].as_matrix()
y = np.array(dataset['virginica'])
#读入数据
n_clusters, n_iteration = input().split(',')
n_clusters = int(n_clusters)#聚类中心个数
n_iteration = int(n_iteration)#迭代次数
#随机选择若干点作为聚类中心
point_index_lst = np.arange(len(y))
np.random.shuffle(point_index_lst)
cluster_centers = X[point_index_lst[:n_clusters]]
#开始算法流程
y_estimated = np.zeros(len(y))
#   请在此添加实现代码     #
#********** Begin *********#
for iter in range(n_iteration):
    for xx_index in range(len(X)):
        #计算各个点最接近的聚类中心
        y_estimated[xx_index] = nearest_cluster_center(X[xx_index], cluster_centers)
    #计算各个聚类中心
    cluster_centers = estimate_centers(X, y_estimated, n_clusters)
#********** End ***********#
print('%.3f' % acc(y_estimated, y))

本文标签：算法 means

版权声明：本文标题：K-means聚类算法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1729851543a1215482.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

弥补延时消息的不足，RocketMQ 基于时间轮算法实现了定时消息！

6天前

大家好，我是君哥。在 RocketMQ 4.x 版本，使用延时消息来实现消息的定时消费。延时消息可以一定程度上实现定时发送，但是有一些局限。 RocketMQ 新版本基于

This generally means that another instance of this process was already running or is hung in the deb

6天前

Couldnt register ***.***.*** with the bootstrap server. Error: unknown error code. This generally means that another ins

数据挖掘的10大算法我用大白话讲清楚了，新手一看就懂

5天前

一个优秀的数据分析师，除了要掌握基本的统计学、数据库、数据分析方法、思维、数据分析工具技能之外，还需要掌握一些数据挖掘的思想，帮助我们挖掘出有价值的数据&#xff0c

一键Pip下载安装使用YOLO系列目标检测算法，YOLOv7都能Pip ! ! !

5天前

点击上方“码农的后花园”，选择“星标” 公众号精选文章，第一时间送达今天在浏览器中闲逛，无意中发现，为了方便使用YOLO目标检测算法的快捷使用&am

【动态规划】【二分查找】C++算法 466 统计重复个数

4天前

作者推荐视频算法专题本文涉及知识点动态规划汇总二分查找力扣:466 统计重复个数定义 str[s, n] 表示 str 由 n 个字符串 s 连接构成。例如，str[“abc”, 3]

举办《Llama3关键技术深度解析与构建Responsible AI、算法及开发落地实战》线上高级研修讲座

4天前

举办《Llama3关键技术深度解析与构建Responsible AI、算法及开发落地实战》线上高级研修讲座

【机器学习(五)】分类和回归任务-AdaBoost算法-Sentosa_DSML社区版

4天前

文章目录一、算法概念一、算法原理（一）分类算法基本思路1、训练集和权重初始化2、弱分类器的加权误差3、弱分类器的权重4、Adaboost 分类损失函数5、样本权重更新6、AdaBoost 的强分

【机器学习(二)】分类和回归任务-决策树(Decision Tree,DT)算法-Sentosa_DSML社区版

4天前

文章目录一、算法概念二、算法原理（一）树的构造（二）划分选择1、信息增益2、基尼指数3、卡方检验 （三）停

【机器学习(四)】分类和回归任务-梯度提升决策树(Gradient Boosting Decison Tree,GBDT)算法-Sentosa_DSML社区版

4天前

文章目录一、算法概念一、算法原理（一） GBDT 及负梯度拟合原理（二） GBDT 回归和分类1、GBDT回归1、GBDT分类二元分类多元分类 &am

PCL 点云配准 LM-ICP算法（精配准）

4天前

目录一、概述二、代码三、结果内容抄自CSDN点云侠：【2024最新版】PCL点云处理算法汇总（C长期更新版）。质量无忧，永久免费&#xff0

Java代码实现RSA算法加密解密文件功能

3天前

一、概述底层算法不做赘述，想要了解自行百度。 RSA属于非对称加密，非对称加密有公钥和私钥两个概念，私钥自己拥有，不能给别人，

FPN（feature pyramid networks）算法讲解

3天前

这篇论文是CVPR2017年的文章，采用特征金字塔做目标检测，有许多亮点，特来分享。论文：feature pyramid networks for object detection论文链接：https:arxivabs161

MD5算法研究 [转载]

3天前

MD5算法研究综述　　md5的全称是message-digest algorithm 5（信息-摘要算法），在90年代初由mit la boratory for comp

无聊科技正经事周刊（第3期）：美团的推荐算法，是在玩火吗？

1天前

这里记录每周值得分享的科技内容，周三发布。本刊开源（GitHub: senlypanweekly），欢迎投稿，推荐或自荐文章

【好书推荐8】《智能供应链：预测算法理论与实战》

18小时前

【好书推荐8】《智能供应链：预测算法理论与实战》写在最前面编辑推荐内容简介作者简介目录精彩书摘前言序言我为什么要写这本书这本书能带给你什么致谢 🌈你好呀！我是是Yu

从 Tesla 的 TTPoE 看资源和算法

15小时前

特斯拉的 ttpoe 出来有一段时间了，不出所料网上一如既往的一堆 pr 文，大多转译自演讲 ppt 和 Replacing TCP for Low Latency Applications&a

机器人导航算法——Costmap地图ROS源码解析

11小时前

文章目录前言一、move_base:Costmap程序的执行入口二、costmap初始化和维护三、costmap地图1.costmap膨胀层InflationLayer2.costmap障碍物obstacleLayer3.costmap静

ROS-基于已知地图的无人机路径规划算法仿真

11小时前

在上一篇文章中我们实现了基于PX4的无人机SLAM建图（Cartographer）仿真，最终得到了indoor3的地图。现在，基于这张建立好的地图进行

频偏纠正matlab实现,freq_estimate 这是一个好用的频偏估计算法的matlab仿真程序 - 下载 - 搜珍网...

2小时前

freq_estimatedft_est_freq_offset.asv freq_estimateFr_estimate.asv freq_estimateDSP_Scaling_Filter.m freq_estimateSel

优化算法中的零次优化详解

2小时前

零次优化公式算法收敛无梯度优化 m i n f ( x ) minf(x) minf(x) 无梯度方法适用于梯度难以得到、获得昂贵传统无梯度方法： 基于直接搜索的方法：坐标搜索&am

电子爱好者 - 最新技术资讯及电子产品介绍！

K-means聚类算法

更多相关文章

弥补延时消息的不足，RocketMQ 基于时间轮算法实现了定时消息！

This generally means that another instance of this process was already running or is hung in the deb

数据挖掘的10大算法我用大白话讲清楚了，新手一看就懂

一键Pip下载安装使用YOLO系列目标检测算法，YOLOv7都能Pip ! ! !

【动态规划】【二分查找】C++算法 466 统计重复个数

举办《Llama3关键技术深度解析与构建Responsible AI、算法及开发落地实战》线上高级研修讲座

【机器学习(五)】分类和回归任务-AdaBoost算法-Sentosa_DSML社区版

【机器学习(二)】分类和回归任务-决策树(Decision Tree,DT)算法-Sentosa_DSML社区版

【机器学习(四)】分类和回归任务-梯度提升决策树(Gradient Boosting Decison Tree,GBDT)算法-Sentosa_DSML社区版

PCL 点云配准 LM-ICP算法（精配准）

Java代码实现RSA算法加密解密文件功能

FPN（feature pyramid networks）算法讲解

MD5算法研究 [转载]

无聊科技正经事周刊（第3期）：美团的推荐算法，是在玩火吗？

【好书推荐8】《智能供应链：预测算法理论与实战》

从 Tesla 的 TTPoE 看资源和算法

机器人导航算法——Costmap地图ROS源码解析

ROS-基于已知地图的无人机路径规划算法仿真

频偏纠正matlab实现,freq_estimate 这是一个好用的频偏估计算法的matlab仿真程序 - 下载 - 搜珍网...

优化算法中的零次优化详解

发表评论

推荐文章

科普肉鸡

解决visual studio 各个版本运行慢、运行卡顿问题

计算机硬盘越大运行速度越大吗,电脑的内存越大越好吗？如果只加大内存，电脑反而会被拖慢！...

预训练PDF数据格式转换

WIFI之一：WIFI常识 &amp;&amp; ANDROID平台上调试APM6633 &amp;&amp; 基站定位原理

热门文章

联筑赚：我国盘扣式脚手架行业发展概况与展

Google遵循的软件行为准则

微信小程序-手机验证码短信登录接口（防薅方法）

QQ的第三方登录

Selenium QQ自动化登录

百科不全书之联想ThinkBook14锐龙核显版安装ubuntu18记录

网卡驱动黄色叹号，报错windows仍在设置此设备的类配置（代码：56）的解决方法

fnOS飞牛搭建私有NAS及有线网卡、无线网卡完整配置攻略

[博应用官网]电脑蓝屏了该怎么办？

能ping通，但无法上网，看网络高手是如何解决？

最新文章

三星U盘格式化后数据不见了？3个方法帮您找回珍贵文件

格式化后数据恢复全解析

华恒2410常见问题

Windows Mobile平台智能系统存储器ROM和RAM解释

移动硬盘加密

如何恢复U盘里格式化数据？别慌，有带图详细步骤！

ubuntu2

转载：基于AT91RM9200与LINUX2.6.26内核的嵌入式平台开发全过程

ArchLinux 2009.08 硬盘安装

计算机二级基础知识

u盘格式化后数据能恢复吗？这四款工具别错过！

u盘快速格式化后怎么恢复文件：深入解析与全面指南

授之以鱼不如授之以渔！五分钟教会您手工查杀***！

|--------硬件故障专题--------| 主板.CPU.硬盘.内存.显卡.声卡

s3c2410 一些移植常见问题

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

WIFI之一：WIFI常识 && ANDROID平台上调试APM6633 && 基站定位原理

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载