当前位置: 首页 > news >正文

Python数据可视化简介

Python数据可视化简介

Introduction to Data Visualization with Python

By Jackson@ML

1. 数据可视化

数据可视化(Data Visualization) 是数据分析师的重要关键技能,数据可视化对数据分析结果有非常重要的直观作用。

数据可视化允许将平凡的数字和数据信息转换为有视觉效果的、漂亮的图形和图表。这可以将复杂的数据,转换为易于理解和表达的信息,使其成为传达数据驱动故事不可获缺的工具。

2. 数据可视化工具

有多种多样的工具,用来数据分析和数据可视化。

首先,任何**BI(Business Intelligence)**工具都对数据有内置可视化功能;但如果想更好地控制和表达输出效果和预订设计,那么必须求助于高级编程语言。

适合做数据可视化的编程语言有:

  • Python
  • R
  • JavaScript
  • Julia
  • 其它语言

Python语言除了自身的标准库外,还伴随生态系统的大量丰富的第三方库

3. Python数据可视化库

Python语言及生态提供了功能强大的库,这些库用来完成交互式数据可视化,主要有以下几种:

1) Matplotlib

这是Python最基本的可视化库,用于创建静态的、动画的、和交互式可视化效果。它提供多种图的表现类型和定制选项。

Matplotlib还与Numpy高度集成,用于复杂数字计算并以不同格式输出可视化结果。下图是Matplotlib发布处, 即

在这里插入图片描述

2) Seaborn

在Matplotlib之上构建,Seaborn会简化创建漂亮的、信息化的统计图表。它对主题、调色板提供增强支持并且和Pandas紧密集成,用于结构化数据可视化。

3) Plotly

这是一个制作交互式、发布质量的在线图表。它可创建复杂的、交互的图表并且对Web友好,提供高水准交互性,例如缩放特征等,支持不同类型图表,包括3D和统计图。

4) Bokeh

Boheh聚焦浏览器输出,提供交互式的,Web类型的可视化。它适合创建适合的交互式图表、仪表盘和数据应用等。

5) GeoPandas

这是对Pandas库的扩展,用于处理地理空间数据,与Shapely和Flona等库集成,分别用于几何操作和文件访问。GeoPandas促进了空间数据和操作的可视化,使其成为基于地图的强大的可视化工具。

4. 可视化图表项目示例

1) 项目简述

下面,我们对一组数据编写代码,可望实现折线图(Line chart)。

这里使用的库是matplotlib。可使用plot( )函数,它接受输入并绘制Y轴与X轴图。

除了基本参数外,还可以定义其它参数,例如线条或标记的颜色等。几个主要的函数,包括:

  • Figure( ), 设置画布大小;
  • Title( ), 设置绘图标题;
  • Xlabel( ), 设置X轴标签;
  • Ylabel( ), 设置Y轴标签;
  • Show( ), 显示可视化图形。
2) 搭建和准备VS Code集成开发环境

a. 安装使用最新版Python 3.13.2
请参看文章:2025最新版Python 3.13.2安装使用指南,这里不再赘述。

b. 安装使用最新版Visual Studio Code
请参看文章:2025最新版Visual Studio Code安装使用指南,这里亦不赘述。

3) 创建和激活虚拟环境

在项目文件夹中,执行命令创建虚拟环境:

$ python3 -m venv .venv

激活该虚拟环境,执行命令:

$ source .venv/bin/activate
4) 安装Matplotlib库

在VS Code终端(Terminal)中,执行以下命令:

$ pip3 install matplotlib

在这里插入图片描述

5) 安装Seaborn

执行命令安装Seaborn:

$ pip3 install seaborn

在这里插入图片描述

6) 编写和运行代码

安装完毕后,导入matplotlib, seaborn库;并且,完成代码。

代码示例如下:

# import necessary libraries
import matplotlib.pyplot as plt
import seaborn as sns 
# load iris dataset from seaborn
iris = sns.load_dataset('iris')
iris.head()
# figure out the chart  
plt.figure(figsize=(10, 6))
plt.plot(iris['sepal_length'])
plt.title('Sepal Length')
plt.xlabel('Index')
plt.ylabel('Sepal Length (cm)')
plt.show()

得到以下效果的折线图。

在这里插入图片描述

技术好文陆续推出,敬请关注和点赞。

您的认可,我的动力!😃

相关阅读:

  1. 2025最新版Python 3.13.2安装使用指南
  2. 2025最新版Visual Studio Code安装使用指南
  3. 2025最新版PyCharm安装使用指南
  4. 2025最新版Anaconda Navigator安装使用指南

相关文章:

  • Linux期末速成
  • sass报错:[sass] Undefined variable. @import升级@use语法注意事项
  • 【个人总结】1. 开发基础 工作三年的嵌入式常见知识点梳理及开发技术要点(欢迎指正、补充)
  • SQL 优化工具使用之 explain 详解
  • Spring AI接入DeepSeek:快速打造微应用
  • 新老电脑安装黑群晖7.1.1教程
  • 5.日常英语笔记
  • Android 11.0 系统settings添加ab分区ota升级功能实现二
  • AlmaLinux使用Ansible自动部署k8s集群
  • 电子电气架构 --- 电器模通化设计
  • MoE演变过程
  • 设计模式13:职责链模式
  • 胶囊网络动态路由算法:突破CNN空间局限性的数学原理与工程实践
  • 力扣每日一题【算法学习day.127】
  • java如何连接数据库
  • 【设计模式精讲】六大设计原则 (SOLID)
  • 深度学习算法:从基础到实践
  • redis解决高并发看门狗策略
  • 【Pandas】pandas Series idxmin
  • 13-跳跃游戏 II
  • 怎样更加贴近中国消费者,运动品牌给出“本地化”选择
  • 涉李小龙形象商标被判定无效,真功夫:暂无更换计划
  • 美总统批准海底采矿,外交部:擅自授权开发损害国际社会共同利益
  • 2025全球智慧城市指数排名揭晓,阿布扎比跃升至第五位
  • 著名茶叶专家谢丰镐逝世,享年95岁
  • 中国海外宏洋集团:一季度经营溢利同比降48.6%,密切关注行业收并购机会等