当前位置：首页 > 数据库 > 正文内容

Mysql大表数据归档

2024-11-29数据库2

前言

在生产实践中，你的mysql数据库可能面临下面这些情况：

不可抗力的因素，数据库所在服务器被回收，或者服务器磁盘损坏，数据库必须得迁移？
单点数据库读写压力越来越大，需要扩展一个或多个节点分摊读写压力？
单表数据量太大了，需要进行水平或垂直拆分怎么搞？
数据库需要从mysql迁移到其他数据库，比如PG，OB…

以上的这些场景，对于不少同学来讲，或多或少的在所处的业务中可能会涉及到，没有碰到还好，一旦发生了这样的问题，该如何处理呢？在这里我通过提供一个思路来解决单表数据量太大了，进行水平拆分，将历史数据归档保证热点数据查询。

归档流程示意图

实现步骤

controller 层

@Slf4j
@RestController
@RequestMapping("/backDoor")
public class CleanHistoryDataController {
 
    @Autowired
    private ICleanHistoryDataService cleanHistoryDataService;
 
    /**
     * 把指定过期时间的订单表数据迁移到历史表中
     */
    @PostMapping("/cleanByTableNameAndEndTime")
    public Resp<String> cleanByTableNameAndEndTime(@RequestBody CleanTableReq cleanTableReq) {
        try {
            CleanTableBo cleanTableBo = ObjectUtils.mapValue(cleanTableReq, CleanTableBo.class);
            cleanHistoryDataService.cleanByTableNameAndEndTime(cleanTableBo);
        } catch (Exception e) {
            log.error(cleanTableReq.getTableName() + " 数据迁移异常", e);
        }
        return Resp.success("success");
    }
}

Service 层

public interface ICleanHistoryDataService {
 
    void cleanHistoryTableData();
}

import com.alibaba.fastjson.JSONObject;
import com.photon.union.risk.clean.service.ICleanHistoryDataService;
import com.photon.union.risk.repo.mapper.clean.MasterDbMapper;
import lombok.extern.slf4j.Slf4j;
import org.apache.commons.collections4.CollectionUtils;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;
import org.springframework.util.StopWatch;
 
import java.util.List;
import java.util.stream.Collectors;
 
 
/**
 * @author robin
 */
@Service
@Slf4j
public class CleanHistoryDataService implements ICleanHistoryDataService {
    @Autowired
    private MasterDbMapper masterDbMapper;
 
    @Override
    public void cleanHistoryTableData() {
        StopWatch stopWatch = new StopWatch();
        stopWatch.start();
        int logInt = 0;
        Long startId = 0L;
        while (true) {
            logInt ++;
            List<JSONObject> hashMapList = masterDbMapper.selectHistoryTableDataIds(startId);
            if (CollectionUtils.isEmpty(hashMapList)){
                break;
            }
            List<Long> allIds = hashMapList.stream().map(o -> o.getLong("id")).collect(Collectors.toList());
            startId = allIds.get(allIds.size()-1);
            if (logInt % 100 == 0 ){
                log.info("id 已经处理到-->" + allIds.get(allIds.size()-1));
            }
            try {
                // 往归档历史数据表写入数据
                masterDbMapper.insertOldHistoryTableDataBatchByIds(allIds);
                // 把归档的数据从目前业务表中删除
                masterDbMapper.deleteHistoryTableDataBatchByIds(allIds);
            }catch (Exception e){
                log.error("数据迁移异常,ids:{}", allIds, e);
            }
        }
        stopWatch.stop();
        log.info("数据迁移到历史表处理完成时间:{}s", (long)stopWatch.getTotalTimeSeconds());
    }
}

Mapper 层

import com.alibaba.fastjson.JSONObject;
import org.apache.ibatis.annotations.Param;
import org.springframework.stereotype.Repository;
 
import java.util.List;
 
/**
 * @author robin
 */
@Repository
public interface MasterDbMapper {
 
    List<JSONObject> selectHistoryTableDataIds( @Param("id") Long startId);
 
    void insertOldHistoryTableDataBatchByIds(@Param("ids") List<Long> allIds);
 
    void deleteHistoryTableDataBatchByIds(@Param("ids") List<Long> allIds);
}

Sql Mapper

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd">
<mapper namespace="com.test.MasterDbMapper">
 
    <insert id="insertOldHistoryTableDataBatchByIds">
        INSERT IGNORE INTO t_order_old
        SELECT NULL,order_no,created_at
        FROM t_order WHERE id in
        <foreach collection="ids" item="item" open="(" close=")" separator=",">
            #{item}
        </foreach>
    </insert>
 
    <delete id="deleteHistoryTableDataBatchByIds">
        DELETE FROM t_order WHERE id IN
        <foreach collection="ids" item="item" open="(" close=")" separator=",">
            #{item}
        </foreach>
    </delete>
 
    <select id="selectHistoryTableDataIds" resultType="com.alibaba.fastjson.JSONObject">
        SELECT id FROM t_order
        WHERE id > #{id} and created_at lt;= DATE_SUB(NOW(), INTERVAL 6 MONTH)
        ORDER BY id limit 1000
    </select>
 
</mapper>

核心说明

根据 t_order订单表结构创建 t_order_old历史订单表用于历史数据备份存放。
整个流程基于主键 id 处理，避免慢 sql 产生，做到不影响当前线上业务处理。
1000 条记录一个批次，避免长期抢占锁资源，同时每个批次执行不影响下个批次处理，出现异常后，打印 error 日志再人工跟进处理。

Navicat for MySQL管理软件安装使用教程图解2024-11-08

mysql管理工具有哪些?哪个好用？2024-11-09

SQL中的INNER JOIN用法详解2024-11-29

SQL Server 数据太多怎么优化2024-11-29

CentOS 9 Stream 安装部署 SQL Server 20192024-11-29

SQL Server怎么导入Excel数据2024-11-29

SQL server 中 CROSS APPLY的操作2024-11-29

sql 快速删除数百万行数据的方法2024-11-29

SQL怎么创建临时表2024-11-29

广为博客

Mysql大表数据归档

前言

实现步骤

相关文章

Copyright © 2015-2024 广为博客. 闽ICP备2024075899号-1