问题描述
给定一段文字,已知单词a1, a2, …, an出现的频率分别t1, t2, …, tn。可以用01串给这些单词编码,即将每个单词与一个01串对应,使得任何一个单词的编码(对应的01串)不是另一个单词编码的前缀,这种编码称为前缀码。
使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。一段文字经过前缀编码后的长度为:
L=a1的编码长度×t1+a2的编码长度×t2+…+ an的编码长度×tn。
定义一个前缀编码为字典序编码,指对于1 ≤ i < n,ai的编码(对应的01串)的字典序在ai+1编码之前,即a1, a2, …, an的编码是按字典序升序排列的。
例如,文字E A E C D E B C C E C B D B E中, 5个单词A、B、C、D、E出现的频率分别为1, 3, 4, 2, 5,则一种可行的编码方案是A:000, B:001, C:01, D:10, E:11,对应的编码后的01串为1100011011011001010111010011000111,对应的长度L为3×1+3×3+2×4+2×2+2×5=34。
在这个例子中,如果使用哈夫曼(Huffman)编码,对应的编码方案是A:000, B:01, C:10, D:001, E:11,虽然最终文字编码后的总长度只有33,但是这个编码不满足字典序编码的性质,比如C的编码的字典序不在D的编码之前。
在这个例子中,有些人可能会想的另一个字典序编码是A:000, B:001, C:010, D:011, E:1,编码后的文字长度为35。
请找出一个字典序编码,使得文字经过编码后的长度L最小。在输出时,你只需要输出最小的长度L,而不需要输出具体的方案。在上面的例子中,最小的长度L为34。
输入格式
输入的第一行包含一个整数n,表示单词的数量。
第二行包含n个整数,用空格分隔,分别表示a1, a2, …, an出现的频率,即t1, t2, …, tn。请注意a1, a2, …, an具体是什么单词并不影响本题的解,所以没有输入a1, a2, …, an。
输出格式
输出一个整数,表示文字经过编码后的长度L的最小值。
样例输入
5
1 3 4 2 5
样例输出
34
样例说明
这个样例就是问题描述中的例子。如果你得到了35,说明你算得有问题,请自行检查自己的算法而不要怀疑是样例输出写错了。
评测用例规模与约定
对于30%的评测用例,1 ≤ n ≤ 10,1 ≤ ti ≤ 20;
对于60%的评测用例,1 ≤ n ≤ 100,1 ≤ ti ≤ 100;
对于100%的评测用例,1 ≤ n ≤ 1000,1 ≤ ti ≤ 10000。
这个题换个说法就是固定合并位置的石子合并问题,然后撸了个区间dp就A了,复杂度是O(N^3),上了四边形不等式优化。
这是迄今为止最简单的t4了感觉>_<
思路还是仿照哈夫曼树的生成,但是这几个数的顺序是固定的,体现在树中,这几个叶子节点的次序就是输入的次序,然后问题就是从根开始如何分配子树了,枚举每个可能分割的点,直至分割到叶子为止,
写的时候从叶子开始向上递推,贡献也很好算f[l,r]=f[l,k]+f[k+1,r]+SUM{a[i] | l<=i<=r } k为分割点。
1 #include<bits/stdc++.h>
2 using namespace std;
3 #define LL long long
4 #define inf 0x3f3f3f3f
5 int n;
6 int a[1010],pre[1010];
7 LL f[1010][1010];
8 int p[1010][1010];
9 int main()
10 {
11 cin>>n;
12 for(int i=1;i<=n;++i)cin>>a[i],pre[i]=pre[i-1]+a[i],f[i][i]=0,p[i][i]=i;
13 for(int len=2;len<=n;++len){
14 for(int i=1,j=i+len-1;j<=n;++i,++j){
15 f[i][j]=5e18;
16 int del=pre[j]-pre[i-1];
17 for(int k=p[i][j-1];k<=p[i+1][j];++k){
18 if(f[i][k]+f[k+1][j]+del<f[i][j]){
19 f[i][j]=f[i][k]+f[k+1][j]+del;
20 p[i][j]=k;
21 }
22 }
23 }
24 }cout<<f[1][n]<<‘\n‘;
25 return 0;
26 }
CCF/CSP-201612-4-压缩编码
原文:https://www.cnblogs.com/zzqc/p/12499238.html