首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

动态规划经典题目-数据压缩之文本压缩

  • 25-03-07 18:21
  • 2711
  • 5840
blog.csdn.net

文章目录

  • 一、题目描述
  • 二、解题思路
    • 1. 定义状态
    • 2. 定义状态转移方程
    • 3. 初始化
    • 4. 计算方式
  • 三、代码实现
  • 四、执行结果
  • 五、思考

一、题目描述

​ 考虑如下数据压缩技术。我们有一个表存了m个文本串,每个长度至多为k。我们想对一个长为n的数据串D使用尽可能少的文本串来编码。例如,如果我们的表包含(“a”,“ba”,“abab", “b"), 且数据串为“bababbaababa" ,编码的最好方式是(“b”,“abab”, “ba” ,“abab”,“a”)一共计5个码字. 给出一个O(nmk)算法找出最优编码的码长。你可以假设每个文本串都可以基于该表至少给出一个编码。

示例:

输入:codes = ["a","ba","abab","b"] str = "bababbaababa"
输出:5
解释:编码的最好方式是(“b”,“abab”, “ba” ,“abab”,“a”)
  • 1
  • 2
  • 3

二、解题思路

1. 定义状态

​ 设dp[i]表示字符串前i个字符组成的字符串最优码长,i从1开始计数,那么我们最终要求出的是dp[str.length]即为字符串str的最优码长;

​ 我们假设k <= i,假设字符串i的后k个字符串与编码相匹配,则有dp[i] = dp[i - k] + 1 ,当然k值可能有多个(多个编码匹配),我们取最小花费那个。

2. 定义状态转移方程

当k <= j并且字符串后k个字符组成字符串与编码匹配时, k为编码集中编码长度组成的集合,有

​ d p [ i ] = m i n ( d p [ i − k ] + 1 ) , dp[i] = min( dp[i - k] + 1), dp[i]=min(dp[i−k]+1),

3. 初始化

​ 当 i = 1时,有 d p [ 1 ] = 1 dp[1] = 1 dp[1]=1

4. 计算方式

​ 自左向右计算

三、代码实现

/**
 * 最优编码数量
 *
 *  @author hh
 *  @date 2021-5-20 21:48
 */
public class OptimumCode {

    public int optimumCode(String[] codes,String str,String[] trace){
        int[] dp = new int[str.length() + 1];
        //初始化dp[1] = 1
        dp[1] = 1;
        for(int i = 1; i <= str.length(); i++){
            dp[i] = Integer.MAX_VALUE;
            for(String bizCode : codes){
                if(bizCode.length() > i){
                    continue;
                }
                int temp = dp[i - bizCode.length()] + 1;
                if(str.substring(i - bizCode.length(),i).equals(bizCode) && dp[i] > temp){
                    dp[i] = temp;
                    trace[i] = bizCode;
                }
            }
        }
        return dp[str.length()];
    }

    public void print(String[] trace,int index){
        Stack<String> stringStack = new Stack<>();
        while (index >= 1){
            stringStack.push(trace[index]);
            index -= trace[index].length();
        }
        System.out.print("最优编码为:");
        while (!stringStack.isEmpty()){
            if(stringStack.size() == 1){
                System.out.print(stringStack.pop());
            }else{
                System.out.print(stringStack.pop() + ",");
            }
        }
    }

    public static void main(String[] args){
        String[] codes = new String[]{"a","ba","abab","b"};
        String str = "bababbaababa";
        String[] trace = new String[str.length() + 1];
        OptimumCode optimumCode = new OptimumCode();
        System.out.println("最优编码长度:" +  optimumCode.optimumCode(codes,str,trace));
        optimumCode.print(trace,str.length());
    }
}

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54

四、执行结果

在这里插入图片描述

五、思考

​ 本题和图像压缩的做法非常相似,都是对dp数组进行线性划分,读者有时间可以看我的另一篇文章动态规划经典题目-数据压缩之图像压缩,进行举一反三。

文章知识点与官方知识档案匹配,可进一步学习相关知识
算法技能树首页概览64430 人正在系统学习中
注:本文转载自blog.csdn.net的仁者乐山智者乐水的文章"https://blog.csdn.net/qq_39559641/article/details/117201073"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top