MinIO 教程:从入门到Spring Boot集成
文章目录
- 一. MinIO 简介
- 1. 什么是MinIO?
- 2. 应用场景
- 二. 文件系统存储发展史
- 1. 服务器磁盘(本地存储)
- 2. 分布式文件系统(如 HDFS、Ceph、GlusterFS)
- 3. 对象存储(如 MinIO、AWS S3)
- 4.对比总结
- 5.选型建议
- 6.示例方案
- 三.MinIO基础概念
- MinIO的基础概念
- MinIO 纠删码 EC (Erasure Code)
- 三. MinIO 安装指南
- 1 单机部署
- 2 分布式集群部署
- 3 Docker 部署
- 四. MinIO 基础使用
- 1. 基础命令
- 1.1 安装与配置
- 2. 存储桶管理
- 2.1 创建存储桶
- 2.2 删除存储桶
- 2.3 列出存储桶
- 2.4 查看存储桶策略
- 2.5 设置存储桶策略
- 3. 对象管理
- 3.1 上传文件
- 3.2 下载文件
- 3.3 列出对象
- 3.4 删除对象
- 3.5 批量删除对象
- 4. 高级功能
- 4.1 同步数据
- 4.2 数据迁移
- 4.3 设置生命周期规则
- 4.4 查看服务器信息
- 4.5 用户管理
- 4.6 策略管理
- 5. 常用快捷命令
- 五. Spring Boot 集成 MinIO
- 1 添加依赖
- 2.在SpringBoot的配置文件中编写 MinIO 的配置:
- 3.编写 MinIO 配置类
- 4.编写 MinIO 的工具类
- 5.业务测试
- 六. 常见问题
一. MinIO 简介
1. 什么是MinIO?
MinlO是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口,非常适合于存储大容量非结构化的数据。例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,而一个对象文件可以是任意大小,从几kb到最大5T不等。
MinlO是一个非常轻量的服务 可以很简单的和其他应用的结合,类似NodeJS, Redis或者MySQL。
MInIO官网
- 核心特性:
- 支持海量非结构化数据(图片、视频、日志等)支持单个对象最大5TB。
- 轻量级(二进制文件仅数十MB)。
- 支持单机部署和分布式集群。
- 提供数据加密、版本控制、生命周期管理等企业级功能。
2. 应用场景
- 云原生存储(Kubernetes 集成)。
- 大数据存储(与 Hadoop、Spark 对接)。
- 多媒体资源存储与加速。
二. 文件系统存储发展史
1. 服务器磁盘(本地存储)
定义
- 直接挂载在服务器上的物理或虚拟磁盘(如 SSD、HDD),通过文件系统(如 ext4、NTFS)管理数据。
优点
- 低延迟:数据直接读写,无需网络开销。
- 高性能:适合频繁读写、小文件操作(如数据库事务)。
- 简单易用:无需复杂配置,开箱即用。
缺点
- 单点故障:硬盘损坏可能导致数据丢失。
- 扩展性差:受限于单机容量,无法横向扩展。
- 资源共享困难:数据无法跨服务器直接访问。
适用场景
- 单机应用(如小型网站、个人博客)。
- 高性能需求场景(如实时数据库、缓存服务)。
- 临时文件存储(如日志、临时缓存)。
2. 分布式文件系统(如 HDFS、Ceph、GlusterFS)
定义
- 通过网络将多台服务器的存储资源整合为统一命名空间,提供文件存储和共享能力(如 HDFS、Ceph、GlusterFS)。
- 它使文件可以跨越多个服务器或存储设备存储和访问。DFS 通过网络将多个存储资源组合成一个统一的文件系统,使用户和应用程序可以像访问本地文件一样透明地访问远程文件。
优点
- 横向扩展:可动态添加节点,支持 PB 级存储。
- 高可用性:数据多副本或纠删码冗余,容忍节点故障。
- 共享访问:多客户端可同时读写同一文件系统。
缺点
- 复杂度高:需管理元数据、数据分布和一致性。
- 性能瓶颈:元数据操作(如 HDFS 的 NameNode)可能成为瓶颈。
- 成本较高:需维护多节点集群,硬件和运维成本上升。
适用场景
- 大数据处理(如 Hadoop 生态、日志分析)。
- 需要共享存储的场景(如 Kubernetes 动态卷、虚拟机镜像存储)。
- 高吞吐需求(如视频流媒体、科学计算)。
3. 对象存储(如 MinIO、AWS S3)
定义
- 以对象(Object)为基本单元的存储系统,每个对象包含数据、元数据和唯一标识符(如 S3 的 Key),通过 RESTful API 访问。
优点
- 海量扩展:支持百亿级对象存储,自动管理数据分布。
- 高可用与持久性:数据跨多节点冗余(如 MinIO 的纠删码)。
- 云原生集成:兼容 S3 API,无缝对接云服务和工具链。
- 成本效益:按需付费,支持冷热数据分层存储。
缺点
- 高延迟:基于 HTTP 协议,不适合实时读写。
- 弱一致性:部分系统存在最终一致性(如 S3 的跨区域复制)。
- 文件系统语义缺失:不支持随机写入、追加操作。
适用场景
- 非结构化数据存储(如图片、视频、文档)。
- 云原生应用(如 Kubernetes 静态资源托管)。
- 大数据与 AI 数据湖(如 Spark 读取 Parquet 文件)。
- 备份与归档(如日志存储、合规性归档)。
4.对比总结
特性 | 服务器磁盘 | 分布式文件系统 | 对象存储 |
---|---|---|---|
数据模型 | 层级文件系统 | 层级文件系统 | 平坦对象(Bucket/Object) |
扩展性 | 有限(单机) | 横向扩展(多节点) | 海量扩展(自动管理) |
访问协议 | 本地文件系统 API | NFS/CIFS 或专用协议 | RESTful API(S3 兼容) |
延迟 | 极低 | 中等(受网络影响) | 较高(HTTP 开销) |
适用数据 | 结构化、小文件 | 大文件、流式数据 | 非结构化、海量数据 |
维护成本 | 低 | 高(需管理集群) | 中等(云服务免运维) |
5.选型建议
-
优先选择对象存储:
- 云原生应用或需要弹性扩展的场景。
- 存储海量非结构化数据(如用户上传文件)。
- 需要跨地域数据同步或版本控制。
-
选择分布式文件系统:
- 大数据处理(如 HDFS 与 MapReduce 结合)。
- 需要共享文件系统语义(如多个 VM 挂载同一目录)。
-
保留本地存储:
- 对延迟敏感的应用(如实时数据库)。
- 小规模或临时性存储需求。
6.示例方案
-
混合方案:
- 使用本地存储处理热数据(如 Redis 缓存),对象存储存放冷数据(如历史日志)。
- 分布式文件系统(如 Ceph)作为底层存储,提供块存储、文件存储和对象存储统一接口。
-
云原生方案:
- Kubernetes 中使用 MinIO 作为持久化存储后端,结合 S3 API 实现无状态应用的数据持久化。
通过合理选择存储方案,可显著提升系统性能、降低成本并保障数据可靠性。
特性 | 传统分布式文件系统 | MinIO |
---|---|---|
数据模型 | 层级目录结构 | 平坦命名空间(Bucket/Object) |
接口 | 专用协议(如 NFS) | S3 兼容 REST API |
扩展性 | 需手动配置 | 自动数据分布与负载均衡 |
适用场景 | 通用存储 | 云原生、大数据、AI 数据湖 |
三.MinIO基础概念
MinIO的基础概念
● Object: 存储到Minio的基本对象,如文件、字节流,Anything…
● Bucket:用来存储Object的逻辑空间。每个Bucket之间的数据是相互隔离的。对于客户端而言,就相当于一个存放文件的顶层文件夹。
● Drive: 即存储数据的磁盘,在MinIO启动时,以参数的方式传入。Minio 中所有的对象数据都会存储在Drive里。
● Set:即一组Drive的集合,分布式部署根据集群规模自动划分一 个或多个Set, 每个Set中的Drive分布在不同位置。一个对象存储在一个Set 上。(For example: {1…44} is divided into 4 sets each of size 16.)
● 一个对象存储在一 个Set上● 一个集群划分为多个Set● 一个Set包含的Drive数显是固定的,默认由系统根据集群规模自动计算得出● 一个SET中的Drive尽可能分布在不同的节点上
MinIO 纠删码 EC (Erasure Code)
纠删码
(Erasure Code, EC) 是一种数据保护方法,它将数据分割成片段,生成冗余数据块,并将这些数据块存储在不同的位置,如磁盘、存储节点或其他地理位置。MinIO 采用 Reed-Solomon 纠删码实现,将对象拆分成数据块和奇偶校验块,以提高数据的冗余性和可用性。
简单来说就是可以通过数学计算,把丢失的数据进行还原,它可以将n份原始数据,增加m份数据,并能通过n+m份中的任意n份数据,还原为原始数据。
即如果有任意小于等于m份的数据失效,仍然能通过剩下的数据还原出来。
举个最简单例子就是有两个数据(d1, d2),用一个校验和y(d1 + d2 = y)即可保证即使丢失其中一个,依然可以还原数据。如丢失 d1 ,则使用 y - d2 = d1 还原,同理,d2 丢失或者y丢失,均可通过计算得出。
三. MinIO 安装指南
1 单机部署
# 下载并运行(Linux/macOS)
wget https://dl.min.io/server/minio/release/linux-amd64/minio
chmod +x minio
./minio server /data --console-address :9001
- 访问管理界面:
http://localhost:9001
2 分布式集群部署
# 启动4节点集群(假设4台服务器IP为192.168.1.101-104)
minio server http://192.168.1.10{1...4}/data
- 自动数据冗余:采用纠删码(Erasure Code)保障数据可靠性。
3 Docker 部署
docker run -p 9000:9000 -p 9001:9001 \-v /data:/data \-e "MINIO_ROOT_USER=admin" \-e "MINIO_ROOT_PASSWORD=password" \minio/minio server /data --console-address :9001
四. MinIO 基础使用
1. 基础命令
1.1 安装与配置
-
安装 mc:
wget https://dl.min.io/client/mc/release/linux-amd64/mc chmod +x mc sudo mv mc /usr/local/bin/
-
设置别名(连接 MinIO 服务):
mc alias set <ALIAS> <ENDPOINT> <ACCESS_KEY> <SECRET_KEY>
-
示例:
mc alias set myminio http://localhost:9000 admin password
-
-
查看别名列表:
mc alias list
2. 存储桶管理
2.1 创建存储桶
mc mb <ALIAS>/<BUCKET_NAME>
-
示例:
mc mb myminio/mybucket
2.2 删除存储桶
mc rb <ALIAS>/<BUCKET_NAME>
-
示例:
mc rb myminio/mybucket
2.3 列出存储桶
mc ls <ALIAS>
-
示例:
mc ls myminio
2.4 查看存储桶策略
mc policy get <ALIAS>/<BUCKET_NAME>
-
示例:
mc policy get myminio/mybucket
2.5 设置存储桶策略
mc policy set <POLICY> <ALIAS>/<BUCKET_NAME>
-
策略选项:
none
(私有)、download
(只读)、upload
(上传)、public
(公开)。 -
示例:
mc policy set public myminio/mybucket
3. 对象管理
3.1 上传文件
mc cp <SOURCE_FILE> <ALIAS>/<BUCKET_NAME>/<TARGET_PATH>
-
示例:
mc cp myfile.txt myminio/mybucket/
3.2 下载文件
mc cp <ALIAS>/<BUCKET_NAME>/<OBJECT_PATH> <DESTINATION>
-
示例:
mc cp myminio/mybucket/myfile.txt ./downloaded_file.txt
3.3 列出对象
mc ls <ALIAS>/<BUCKET_NAME>
-
示例:
mc ls myminio/mybucket
3.4 删除对象
mc rm <ALIAS>/<BUCKET_NAME>/<OBJECT_PATH>
-
示例:
mc rm myminio/mybucket/myfile.txt
3.5 批量删除对象
mc rm --recursive --force <ALIAS>/<BUCKET_NAME>/<PREFIX>
-
示例:
mc rm --recursive --force myminio/mybucket/old_data/
4. 高级功能
4.1 同步数据
-
本地到远程同步:
mc mirror <LOCAL_DIR> <ALIAS>/<BUCKET_NAME>
-
示例:
mc mirror ./local_data/ myminio/mybucket/
-
-
远程到本地同步:
mc mirror <ALIAS>/<BUCKET_NAME> <LOCAL_DIR>
4.2 数据迁移
-
从其他 S3 兼容存储迁移到 MinIO:
mc mirror s3-source/ myminio/mybucket/
4.3 设置生命周期规则
mc ilm add <ALIAS>/<BUCKET_NAME> --expiry-days <DAYS>
-
示例:
mc ilm add myminio/mybucket --expiry-days 30
4.4 查看服务器信息
mc admin info <ALIAS>
-
示例:
mc admin info myminio
4.5 用户管理
-
添加用户:
mc admin user add <ALIAS> <ACCESS_KEY> <SECRET_KEY>
-
示例:
mc admin user add myminio newuser newpassword
-
-
删除用户:
mc admin user remove <ALIAS> <ACCESS_KEY>
4.6 策略管理
-
创建策略:
mc admin policy create <ALIAS> <POLICY_NAME> <POLICY_FILE>
-
示例:
mc admin policy create myminio readonly-policy policy.json
-
-
绑定策略到用户:
mc admin policy attach <ALIAS> <POLICY_NAME> --user=<USER>
5. 常用快捷命令
功能 | 命令 |
---|---|
查看帮助 | mc --help |
查看某个命令的帮助 | mc <COMMAND> --help |
检查配置是否正确 | mc alias test <ALIAS> |
清空存储桶 | mc rb --force <ALIAS>/<BUCKET_NAME> |
查看存储桶占用空间 | mc du <ALIAS>/<BUCKET_NAME> |
五. Spring Boot 集成 MinIO
1 添加依赖
<dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.5.2</version>
</dependency>
2.在SpringBoot的配置文件中编写 MinIO 的配置:
minio:url: http://127.0.0.1:9005 #ip地址accessKey: admin # 账号secretKey: admin962464 # 密码secure: false #如果是true,则用的是https而不是http,默认值是truebucketName: "test" # 桶的名字 相当于文件夹
3.编写 MinIO 配置类
import io.minio.MinioClient;
import lombok.Data;
import org.springframework.boot.context.properties.ConfigurationProperties;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;@Data
@Configuration
@ConfigurationProperties(prefix = "minio")
public class MinioConfig {/*** 服务地址*/private String url;/*** 用户名*/private String accessKey;/*** 密码*/private String secretKey;/*** 存储桶名称*/private String bucketName;@Beanpublic MinioClient getMinioClient() {return MinioClient.builder().endpoint(url).credentials(accessKey, secretKey).build();}
}
4.编写 MinIO 的工具类
import com.jjy.shopping_file_service.config.MinioConfig;
import io.minio.*;
import io.minio.http.Method;
import io.minio.messages.Bucket;
import io.minio.messages.Item;
import lombok.AllArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.stereotype.Component;
import org.springframework.util.FastByteArrayOutputStream;
import org.springframework.util.StringUtils;
import org.springframework.web.multipart.MultipartFile;import javax.annotation.Resource;
import javax.servlet.ServletOutputStream;
import javax.servlet.http.HttpServletResponse;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;
import java.util.UUID;@Slf4j
@Component
public class MinIOUtil {@Resourceprivate MinioConfig minioConfig;@Resourceprivate MinioClient minioClient;/*** 查看存储bucket是否存在** @param bucketName 存储桶名称* @return boolean*/public Boolean bucketExists(String bucketName) {Boolean found;try {found = minioClient.bucketExists(BucketExistsArgs.builder().bucket(bucketName).build());} catch (Exception e) {e.printStackTrace();return false;}return found;}/*** 创建存储bucket** @param bucketName 存储桶名称* @return Boolean*/public Boolean makeBucket(String bucketName) {try {minioClient.makeBucket(MakeBucketArgs.builder().bucket(bucketName).build());} catch (Exception e) {e.printStackTrace();return false;}return true;}/*** 删除存储bucket** @param bucketName 存储桶名称* @return Boolean*/public Boolean removeBucket(String bucketName) {try {minioClient.removeBucket(RemoveBucketArgs.builder().bucket(bucketName).build());} catch (Exception e) {e.printStackTrace();return false;}return true;}/*** 获取全部bucket** @return 存储桶列表*/public List<Bucket> getAllBuckets() {try {return minioClient.listBuckets();} catch (Exception e) {e.printStackTrace();}return null;}/*** 文件上传** @param file 文件* @return 文件对象名称*/public String upload(MultipartFile file) {String originalFilename = file.getOriginalFilename();System.out.println(originalFilename);if (!StringUtils.hasText(originalFilename)) {throw new RuntimeException();}String fileName = UUID.randomUUID() + originalFilename.substring(originalFilename.lastIndexOf("."));String prefix = new SimpleDateFormat("yyyy/MM/dd").format(new Date());String objectName = prefix + "/" + fileName;try {PutObjectArgs objectArgs = PutObjectArgs.builder().bucket(minioConfig.getBucketName()).object(objectName).stream(file.getInputStream(), file.getSize(), -1).contentType(file.getContentType()).build();// 文件名称相同会覆盖minioClient.putObject(objectArgs);} catch (Exception e) {e.printStackTrace();return null;}return objectName;}/*** 预览图片** @param fileName 文件名称* @return 文件预览链接*/public String preview(String fileName) {// 查看文件地址GetPresignedObjectUrlArgs build = GetPresignedObjectUrlArgs.builder().bucket(minioConfig.getBucketName()).object(fileName).method(Method.GET).build();try {String url = minioClient.getPresignedObjectUrl(build);return url;} catch (Exception e) {e.printStackTrace();}return null;}/*** 文件下载** @param fileName 文件名称* @param res response*/public void download(String fileName, HttpServletResponse res) {GetObjectArgs objectArgs = GetObjectArgs.builder().bucket(minioConfig.getBucketName()).object(fileName).build();try (GetObjectResponse response = minioClient.getObject(objectArgs)) {byte[] buf = new byte[1024];int len;try (FastByteArrayOutputStream os = new FastByteArrayOutputStream()) {while ((len = response.read(buf)) != -1) {os.write(buf, 0, len);}os.flush();byte[] bytes = os.toByteArray();res.setCharacterEncoding("utf-8");res.addHeader("Content-Disposition", "attachment;fileName=" + fileName);try (ServletOutputStream stream = res.getOutputStream()) {stream.write(bytes);stream.flush();}}} catch (Exception e) {e.printStackTrace();}}/*** 查看文件对象** @return 存储bucket内文件对象信息*/public List<Item> listObjects() {Iterable<Result<Item>> results = minioClient.listObjects(ListObjectsArgs.builder().bucket(minioConfig.getBucketName()).build());List<Item> items = new ArrayList<>();try {for (Result<Item> result : results) {items.add(result.get());}} catch (Exception e) {e.printStackTrace();return null;}return items;}/*** 删除** @param fileName 文件名称* @return 是否删除成功*/public boolean remove(String fileName) {try {minioClient.removeObject(RemoveObjectArgs.builder().bucket(minioConfig.getBucketName()).object(fileName).build());} catch (Exception e) {return false;}return true;}}
5.业务测试
import com.cyw.miniodemo.config.MinioConfig;
import com.cyw.miniodemo.pojo.Rst;
import com.cyw.miniodemo.service.FileUploadService;
import com.cyw.miniodemo.utils.MinIOUtil;
import lombok.AllArgsConstructor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.web.bind.annotation.*;
import org.springframework.web.multipart.MultipartFile;import javax.servlet.http.HttpServletResponse;
import java.util.HashMap;
import java.util.Map;@Slf4j
@RestController
@RequestMapping("/api/file")
@AllArgsConstructor
public class FileUploadController {private MinioConfig minioConfig;private MinIOUtil minIOUtil;private FileUploadService fileUploadService;@GetMapping("/bucketExists")public Rst bucketExists(@RequestParam("bucketName") String bucketName) {Map<String, Object> map = new HashMap<>();map.put("bucketExists", minIOUtil.bucketExists(bucketName));return Rst.ok("查询成功", map);}@GetMapping("/makeBucket")public Rst makeBucket(@RequestParam("bucketName") String bucketName) {Map<String, Object> map = new HashMap<>();map.put("makeBucketSuccess", minIOUtil.makeBucket(bucketName));return Rst.ok("创建成功", map);}@GetMapping("/removeBucket")public Rst removeBucket(@RequestParam("bucketName") String bucketName) {Map<String, Object> map = new HashMap<>();map.put("deleteBucketSuccess", minIOUtil.removeBucket(bucketName));return Rst.ok("删除成功", map);}@GetMapping("/getAllBuckets")public Rst getAllBuckets() {Map<String, Object> map = new HashMap<>();map.put("buckets", minIOUtil.getAllBuckets());return Rst.ok("查询成功", map);}@PostMapping("/upload")public Rst upload(@RequestParam("file") MultipartFile file) {String objectName = minIOUtil.upload(file);if (objectName != null) {Map<String, Object> map = new HashMap<>();map.put("url", (minioConfig.getEndpoint() + "/" + minioConfig.getBucketName() + "/" + objectName));return Rst.ok("上传成功", map);}return Rst.fail("上传失败");}@GetMapping("/preview")public Rst preview(@RequestParam("fileName") String fileName) {Map<String, Object> map = new HashMap<>();map.put("url", minIOUtil.preview(fileName));return Rst.ok("预览成功", map);}@GetMapping("/download")public Rst download(@RequestParam("fileName") String fileName, HttpServletResponse resp) {minIOUtil.download(fileName, resp);return Rst.ok();}@PostMapping("/delete")public Rst remove(@RequestBody Map<String, String> params) {String url = params.get("url");String objName = url.substring(url.lastIndexOf(minioConfig.getBucketName() + "/") + minioConfig.getBucketName().length() + 1);log.info("删除对象: {}", objName);minIOUtil.remove(objName);return Rst.ok("删除成功");}
}
六. 常见问题
- 如何扩容集群?:直接添加新节点,MinIO 自动数据再平衡。
- 数据安全性:启用 HTTPS、配置 Bucket Policy、使用 Server-Side Encryption。
- 性能优化:调整纠删码配置(如
MINIO_STORAGE_CLASS_STANDARD=EC:4
)。