当前位置: 首页 > news >正文

离线安装elasticdump并导入和导出数据

离线安装elasticdump

在 CentOS 或 RHEL 系统上安装 elasticdump,你可以使用 npm(Node.js 的包管理器)来安装,因为 elasticdump 是一个基于 Node.js 的工具。以下是步骤

先在外网环境下安装

  1. 下载nodejs和npm(注意x86和aarch64的包不同)
wget https://nodejs.org/dist/v12.22.11/node-v12.22.11-linux-arm64.tar.gz

我下这个版本才能用npm install elasticdump -g下载
2. 解压

tar -zxvf node-v12.22.11-linux-arm64.tar.gz -C /usr/lib/
  1. 创建软链接
mv /usr/lib/node-v12.22.11-linux-arm64 /usr/lib/nodejs
ln -s /usr/lib/nodejs/bin/npm /usr/bin
ln -s /usr/lib/nodejs/bin/node /usr/bin
  1. 验证能否正常使用
node -v
npm -v
  1. 安装elasticdump
npm install elasticdump -g
  1. 创建elasticdump软链接
ln -s /usr/lib/nodejs/lib/node_modules/elasticdump/bin/elasticdump /usr/local/bin/elasticdump
  1. 验证安装
elasticdump --version
  1. 导出缓存包
    查看npm缓存路径
npm config get cache

我的是/root/.npm,把elasticdump安装后的缓存目录打包

cd /root
tar -zcf npm-cahce.tgz .npm
  1. 把导出的npm-cache.tgz 保存下来

拷贝安装包到内网环境

  1. 参见外网步骤安装nodejs和创建软链接
  2. 拷贝npm-cache.tar到/root,并解压缩
mv npm-cache.tar /root
cd /root
tar -zxf npm-cahce.tgz
  1. --cache-min这个参数是指超过多少分钟,才去网络下载,设置足够大就会从缓存安装
npm install --cache /root/.npm --optional --cache-min 9999999 -shrinkwarp false elasticdump
  1. 创建软链接
ln -s /usr/lib/nodejs/lib/node_modules/elasticdump/bin/elasticdump /usr/local/bin/elasticdump
  1. 检测环境,安装成功,会看到elasticdump帮助信息,导出数据时需要查看这些帮助参数的用法:
elasticdump --help

导入和导出数据

导出索引数据

  1. 将源 ES 实例中的索引数据导出为 JSON 文件:
elasticdump \--input=http://localhost:9200/your_index_name \--output=your_index_data.json \--type=data
  1. 导出索引映射,将索引的映射(mapping)导出为 JSON 文件,以确保导入时保持相同的结构:

如果有认证,则下方input输入账户密码username:password

elasticdump \--input=http://username:password@source_elasticsearch:9200/your_index_name \--output=your_index_mapping.json \--type=mapping
  1. 导出索引的settings(即索引的配置如:分片数、副本数等)
elasticdump \--input=http://localhost:9200/my_index \--output=my_index_settings.json \--type=settings

导入数据

  1. 导入索引映射:(已经有索引结构了可不导入)当索引模板有变动时建议导入
elasticdump \--input=your_index_mapping.json \--output=http://localhost:9200/your_index_name \--type=mapping
  1. 导入索引数据,设置limit一次性导入多少条(默认100条):
    当索引不存在时会自动创建
elasticdump \--input=your_index_data.json \--output=http://localhost:9200/your_index_name \--type=data \--limit=10000
  1. --ignore-errors 参数可以忽略导入过程中出现的错误,例如 _id 冲突的错误。这样,当导入数据时,如果目标索引中已经存在 _id 相同的文档,导入操作不会覆盖原有数据,而是跳过这些冲突的文档
elasticdump \--input=my_index_dump.json \--output=http://localhost:9200/my_index \--type=data \--ignore-errors
  1. 验证数据导入
    在目标 ES 实例中验证数据是否成功导入:
curl -X GET "http://target_elasticsearch:9200/your_index_name/_search?pretty"

如果返回的结果与原始索引中的数据一致,说明数据迁移成功

相关文章:

  • Android Studio 获取配置资源与第三方包信息详解
  • ProfiNet转DeviceNet边缘计算网关多品牌集成实践:污水处理厂设备网络融合全流程解析
  • [特殊字符] Kotlin与C的类型别名终极对决:typealias vs typedef,如何让代码脱胎换骨?
  • 大模型API中转平台选择指南:如何找到优质稳定的服务
  • 从头开始掌握扩散概率模型
  • 知识就是力量——一些硬件的使用方式
  • 【Lua语言】Lua语言快速入门
  • C++用于保留浮点数的两位小数,使用宏定义方法(可兼容低版本Visual Studio)
  • 【内置函数】84个Python内置函数全整理
  • 每日OJ_牛客_kotori和素因子_DFS_C++_Java
  • Warcraft Logs [Classic] [WCL] BOSS ID query
  • 关于viewpager常见的泄漏
  • 23种设计模式全解析及其在自动驾驶开发中的应用
  • Rsync+sersync2实现目录实时同步
  • 模拟SSE流式输出的四种方法
  • 黑马商城(四)网关
  • velocity模板引擎
  • C语言用if else求三个数最小值的一题多解
  • 页内碎片和页外碎片的区别
  • 第十届团体程序设计天梯赛-上理赛点随笔
  • 金融监管总局:建立保险销售人员违法违规导致经济损失的佣金薪酬追索扣回机制
  • 思南读书会500期了,这是上海最具温度的阅读文化样本
  • 江西修水警方:一民房内发生刑案,犯罪嫌疑人已被抓获
  • 郑州一废弃饭店堆砌物起火:明火被扑灭,未造成人员伤亡
  • 国新办将举行发布会,介绍《加快推进服务业扩大开放综合试点工作方案》有关情况
  • 国台办:大陆经济前景好不好,事实最有说服力