当前位置: 首页 > news >正文

一个很简单的机器学习任务

一个很简单的机器学习任务

前言

基于线上colab做的一个简单的案例,应用了线性回归算法,预测了大概加州3000多地区的房价中位数

过程

先导入了Pandas,这是一个常见的Python数据处理函数库

Pandasread_csv函数把网上一个共享数据集(csv文件)读入DataFrame数据结构df_housing

这个文件是加州某个时期的房价数据集

DataFrame数据结构的head方法显示数据集中的部分信息

import pandas as pd
df_housing = pd.read_csv("https://raw.githubusercontent.com/huangjia2019/house/master/house.csv")
df_housing.head()

结果如下在这里插入图片描述

在这里插入图片描述

然后构建特征集x和特征集y

x = df_housing.drop("median_house_value",axis=1) #构建特征集x
y = df_housing.median_house_value #构建特征集y

现在把数据集一分为二,80%用于机器训练(训练数据集),剩下的留着做测试(测试数据集)

from sklearn.model_selection import train_test_split #导入sklearn工具库
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.2,random_state=0) #以80%/20%的比例进行数据集的拆分

接下来开始训练机器,首先选择模型的类型,也就是算法

然后通过其中的fit方法来训练机器,进行函数的拟合

拟合意味着找到最优的函数去模拟训练集中的输入(特征)和目标(标签)的关系,这是确定模型的参数

from sklearn.linear_model import LinearRegression #导入线性回归算法模型
model = LinearRegression() #确定线性回归算法
model.fit(x_train,y_train) #根据训练集数据,训练机器,拟合函数
y_pred = model.predict(x_test) #预测验证集的y值
print('房价的真值(测试集)',y_test)
print('预测的真值(测试集)',y_pred)

显示预测可以多少评分

print('给预测评分',model.score(x_test,y_test)) #评估预测分数

也可以画出来

import matplotlib.pyplot as plt
#用散点图显示家庭收入中位数和房价中位数的分布
plt.scatter(x_test.median_income,y_test,color='brown')
#画出回归函数(从特征到预测标签)
plt.plot(x_test.median_income,y_pred,color='blue',linewidth=2)
plt.xlabel('median Income')
plt.ylabel('median House Value')
plt.show()

在这里插入图片描述

可以看出各个地区的平均房价中位数有随该地区家庭收入中位数的上升而增加的趋势,而机器学习到的函数也同意体现了着一点

后记

学习产出记录

相关文章:

  • 技术视界 | 开源新视野: 人形机器人技术崛起,开源社区驱动创新
  • 消息队列知识点详解
  • 基于RK3588+FPGA+AI YOLO的无人船目标检测系统(一)概述
  • 每天五分钟机器学习:凸优化
  • SBTI科学碳目标认证有什么要求?SBTI认证的好处?
  • MES系统中标签模板设计框架与实现思路
  • C++常用函数合集
  • 考研单词笔记 2025.04.21
  • qt画一朵花
  • elasticsearch7.15节点磁盘空间满了迁移数据到新磁盘
  • 【系统架构设计师】信息安全的概念
  • 每天学一个 Linux 命令(30):cut
  • OpenFeign 使用教程:从入门到实践
  • 线性代数-矩阵的秩
  • jvm-获取方法签名的方法
  • redis常用的五种数据类型
  • 如何使用UE Cesium插件实现网页端无算力负担访问?
  • Spring MVC 一个简单的多文件上传
  • 用自然语言指令构建机器学习可视化编程流程:InstructPipe 的创新探索
  • iTwin Tools函数拆解
  • 国务院国资委:推动央企强化资金统筹,确保及时付款
  • 延安市委副书记马月逢已任榆林市委副书记、市政府党组书记
  • 体坛联播|皇马补时绝杀毕尔巴鄂,利物浦最快下轮即可夺冠
  • 农业未来十年展望:预计粮食单产水平将提高7.8%,达到421千克/亩
  • 美国多地举行抗议活动,特朗普经济政策支持率创新低
  • 一中国公民在日本滑雪场意外死亡,我领馆发布提醒