R语言+ChatGPT实现数据分析预测|电子爱好者

admin管理员组
文章数量:1530037

工作需要了解数据分析方面的相关知识，起初对于这方面第一反应就是Python，虽说Python对数据分析，画图等都有很好的方面，但在搜索Python相关内容时百度词条第一条就是Python与R的相关内容，起初觉得刚入行再去了解一门新的语言会很困难，但在接触过后发现R语言就是后端中的HTML，加上R拥有丰富的开源库资源编程异常简单，同时在B站了解过后，推荐配合使用AI进行辅助编程有奇效，写此篇用于笔记作用。

环境准备

R语言的环境配置非常简单，在R的官方网站（CRAN: Mirrors）进入镜像网址

选择China第一个，随后

选择Download R for Windows

如果你是第一次安装R，选择

install R for the first time

选择Download R-4.4.1 for Windows（82 megabytes，64 bit）按照提示下载完安装包无脑下一步完成安装即可。

RStudio

安装完R环境后你将获得一个，忽略它，自带的编辑器比较原始，R的编辑器通常采用RStudio进行相关的编辑。

进入官网（CRAN: Mirrors），下拉选择

选择2：Install RStudio等待下载完成即可，安装也是无脑下一步安装等待安装完成。

完成之后打开界面，得到的界面如图所示

其中脚本编辑区域需要点击file ->new file ->RScript建立脚本编辑区。在控制台区的Console中虽可以进行相关操作，单操作过程繁琐，因此建议使用RScript进行编写。

同时，在执行的过程中如果提示缺少包资源等，按照提示在Console中输入命令进行安装即可。

案例

本案例选择的数据集并不专业，字段繁多，仅用于展示使用。

由于R语言的语法相对简单且拥有大量的开源库，记住几行代码其余功能交由ChatGPT完成即可。

其中最常用的为设置工作空间和读取文件的操作。

#设置工作空间
setwd("C:\\Users\\jl\\Desktop\\DataAnalysis")
#读取文件
df1 <- read.csv("xxx.csv",row.names = 1)

注意：在复制路径后记得将路径中的单斜线“\”改为双斜线“\\”。

RStudio的运行方式不同于其它，需要用光标选中你要执行的代码片段，或者把光标放在需要执行的第一行代码后，点击脚本编辑区域右上侧的“Run”进行执行操作。

案例一：热图

在完成设置工作空间和文件读取的操作后将需求发送给ChatGPT，同时需要注意提问方式，使用AI最重要的就是需要会问。

例如：I created a data frame named df1 in R language, which has 527 columns and 1000 rows. All variables are numbers and all fields are strings. Now we need to extract IP3_15, IP2/178, IP3_225, IP3_226, and IP3_224 to draw a correlation heatmap. Please show the code.

（我用R语言创建了一个名为df1的数据帧，它有527列1000行。所有变量都是数字，所有字段都为字符串，现在需要截取 IP3_15，IP2_178，IP3_225，IP3_226，IP3_224绘制相关性热图，请展示代码。）

代码如下：

#--------------------------方格式热图------------------------------
setwd("C:\\Users\\jl\\Desktop\\DataAnalysis")
df1 <- read.csv("回转窑数据.csv",row.names = 1)
# 提取所需列
selected_columns <- df1[, c("IP3_15", "IP2_178", "IP3_225", "IP3_226", "IP3_224")]

# 计算相关矩阵
cor_matrix <- cor(selected_columns, use = "complete.obs")

# 加载 pheatmap 包
library(pheatmap)

# 绘制相关热图
pheatmap(cor_matrix, display_numbers = TRUE, main = "Selected Columns Correlation Heatmap")
# 计算相关矩阵
cor_matrix <- cor(selected_columns, use = "complete.obs")

# 将相关矩阵转换为字符串
cor_matrix_string <- capture.output(print(cor_matrix))

# 打印相关矩阵字符串
cat(cor_matrix_string, sep = "\n")

执行效果如图所示：

也可将方格式热图改为圆点式热图，值得注意的是RStudio直接将正方形的图形改为了上三角式来方便查看字段之间的相关性。

# 设置工作目录
setwd("C:\\Users\\jl\\Desktop\\DataAnalysis")

# 读取 CSV 文件
df1 <- read.csv("回转窑数据.csv", row.names = 1)

# 提取所需列
selected_columns <- df1[, c("IP3_15", "IP2_178", "IP3_225", "IP3_226", "IP3_224")]

# 计算相关矩阵
cor_matrix <- cor(selected_columns, use = "complete.obs")

# 安装并加载 corrplot 包
if (!require("corrplot")) {
  install.packages("corrplot")
}
library(corrplot)

# 绘制圆点式相关矩阵热图
corrplot(cor_matrix, method = "circle", type = "upper", 
         tl.col = "black", tl.srt = 45, addCoef.col = "black", 
         title = "Selected Columns Correlation Circle Heatmap")

执行效果如下图所示

案例二：折线图

同样将需求发送给ChatGPT，编辑代码：

# 设置工作目录
setwd("C:\\Users\\jl\\Desktop\\DataAnalysis")

# 读取 CSV 文件
df1 <- read.csv("回转窑数据.csv", row.names = 1)

# 提取所需列
selected_columns <- df1[, c("IP3_15", "IP2_178", "IP3_225", "IP3_226", "IP3_224")]

# 添加 ID 列作为行名称
selected_columns$id <- rownames(selected_columns)

# 加载 ggplot2 和 tidyr 包
if (!require("ggplot2")) {
  install.packages("ggplot2")
}
if (!require("tidyr")) {
  install.packages("tidyr")
}
library(ggplot2)
library(tidyr)

# 将数据转换为长格式以便 ggplot2 使用
df_long <- pivot_longer(selected_columns, cols = -id, names_to = "variable", values_to = "value")

# 绘制折线图
ggplot(df_long, aes(x = as.numeric(id), y = value, color = variable, group = variable)) +
  geom_line() +
  labs(x = "ID", y = "值", title = "所选字段的折线图") +
  theme_minimal()

展示效果：

同时RStudio也支持将折线图表制作为动态可交互式的，其代码部分为：

# 设置工作目录
setwd("C:\\Users\\jl\\Desktop\\DataAnalysis")

# 读取 CSV 文件
df1 <- read.csv("回转窑数据.csv", row.names = 1)

# 提取所需列
selected_columns <- df1[, c("IP3_15", "IP2_178", "IP3_225", "IP3_226", "IP3_224")]

# 添加 ID 列作为行名称
selected_columns$id <- rownames(selected_columns)

# 加载 ggplot2 和 tidyr 包
if (!require("ggplot2")) {
  install.packages("ggplot2")
}
if (!require("tidyr")) {
  install.packages("tidyr")
}
if (!require("plotly")) {
  install.packages("plotly")
}
library(ggplot2)
library(tidyr)
library(plotly)

# 将数据转换为长格式以便 ggplot2 使用
df_long <- pivot_longer(selected_columns, cols = -id, names_to = "variable", values_to = "value")

# 绘制折线图
p <- ggplot(df_long, aes(x = as.numeric(id), y = value, color = variable, group = variable)) +
  geom_line() +
  labs(x = "ID", y = "值", title = "所选字段的动态折线图") +
  theme_minimal()

# 将 ggplot2 图表转换为 plotly 图表
ggplotly(p)

展示效果如下：

同时值得注意的是，如果你对图片大小不满意可以点击图片上面的zoom单独将图片拉拽出来

其余交互还未进行探索。

案例三：打印相关性系数

同样的，只不过该结果显示在Console中。

# 设置工作目录
setwd("C:\\Users\\jl\\Desktop\\DataAnalysis")

# 读取 CSV 文件
df1 <- read.csv("回转窑数据.csv", row.names = 1)

# 仅保留数值列
numeric_columns <- sapply(df1, is.numeric)
df_numeric <- df1[, numeric_columns]

# 计算每个数值字段与 IP3_15 的相关性系数
correlation_with_IP3_15 <- sapply(df_numeric, function(x) cor(x, df_numeric$IP3_15, use = "complete.obs"))

# 将结果转换为数据框
correlation_df <- data.frame(Field = names(correlation_with_IP3_15), Correlation = correlation_with_IP3_15)

# 按相关性系数绝对值排序
correlation_df <- correlation_df[order(abs(correlation_df$Correlation), decreasing = TRUE), ]

# 打印相关性系数
print(correlation_df)

结果：

结束

此篇仅作笔记之用，漏洞还很多。

本文标签：分析预测语言数据 chatGPT

版权声明：本文标题：R语言+ChatGPT实现数据分析预测内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726696726a1081171.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

R语言+ChatGPT实现数据分析预测

环境准备

RStudio

案例

案例一：热图

案例二：折线图

案例三：打印相关性系数

结束

更多相关文章

ChatGPT提示词保姆级教程_提示词管理工具

ChatGPT的使用

AI音乐，8大变现方式——Suno：音乐版的ChatGPT - 第505篇

基于python，chatgpt，gpt-sovits进行b站直播ai语音自动回复弹幕部署

ChatGPT方法论“BORE“_bore分析法

ChatGPT访谈录之一（关于rfid和NFC的方方面面）

Coze - 有望超越ChatGPT的一款免费神级软件

27个ChatGPT的使用技巧Prompt

不输ChatGPT！盘点国产功能强大且免费的大语言模型Top6！_路线1路线2路线3国产

ChatGPT高效提问—prompt实践（白领助手）

Stanford Alpaca (羊驼)：ChatGPT 学术版开源实现

吐血整理 ChatGPT 3.54.0 新手使用手册~ 【2024.09.04 更新】

windows10系统语言字体显示乱码问题

qq三国挂机云服务器,暗渡云门2组服务器数据互通计划公布

windows远程android传输文件,电脑（LinuxWindows）使用SSH远程登录安卓（Android）手机实现无线传输和管理文件（图文详解）-Go语言中文社区...

在 Windows 上恢复出厂设置后恢复数据 - 恢复您的文件！

系统安装-000 基础二：UEFI+GPT和BIOS+MBR互换（免重装系统，无损数据）

迅雷，暴风影音，QQ这些软件是什么工具和语言编的?

【人工智能】人工智能、机器学习和数据工程 InfoQ 趋势报告 - 2021 年 8 月

一口气了解大模型相关通识，基础笔记！_大模型数据

发表评论

推荐文章

BT种子 &amp; 磁力链接 是什么？

浏览器工作原理（超级详解！！！！）

Win10系统更改或删除pin码的方法--win7w.com

Win7 Wininit.exe任意加载执行(漏洞)

win7热键

热门文章

pycharm今天报了unable to contact server

可以运行python的路由器_用python控制你的路由器

(BUU_[BJDCTF2020]BJD hamburger competition

【ChatGPT】借助ChatGPT自动制作PPT

双系统安装01--新安装win11与统信UOS1060

js获取浏览器宽高及获取浏览器可视宽高

解决“安装程序无法创建新的系统分区，也无法定位现有系统分区”问题方法

如何解决Chrome浏览器无法登录谷歌账号的问题

win7 快捷键，Thinkpad 组合键

视频编辑软件会声会影2025旗舰版即将来临

最新文章

idea永久使用

2021年山东省职业院校技能大赛 高职组 “信息安全管理与评估”赛项样题

JetBrains IntelliJ IDEA 优化教程

Parallels对Mac的损害大吗 pd虚拟机怎么设置内存和CPU 运行Parallels发热

Linux基本使用-vmware及centos安装-day01

2021年山东省职业院校技能大赛高职组“信息安全管理与评估”样题

IDEA简介及使用

2023.5.15老男孩网络安全集训营第一节

c#物联网_C# 开发工具比较

IDEA使用技巧

IntelliJ IDEA 2018安装与破解

2021最新IDEA初级入门详细教程流出，开发组小伙伴怒赞

1-1 IDEA的下载安装

r5处理器_【玩码】RedmiBook 三款齐发，标配最新锐龙 4000 系列处理器

idea部署tomcat并实现简单的web项目

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

BT种子 & 磁力链接是什么？

2021年山东省职业院校技能大赛高职组 “信息安全管理与评估”赛项样题

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载