优秀的拆分
此题目来自 洛谷, 原始题目与提交代码请前往 P1117 [NOI2016] 优秀的拆分 - 洛谷。
题目描述
如果一个字符串可以被拆分为 的形式,其中 和 是任意非空字符串,则我们称该字符串的这种拆分是优秀的。 例如,对于字符串 ,如果令 ,,我们就找到了这个字符串拆分成 的一种方式。
一个字符串可能没有优秀的拆分,也可能存在不止一种优秀的拆分。 比如我们令 ,,也可以用 表示出上述字符串;但是,字符串 就没有优秀的拆分。
现在给出一个长度为 n 的字符串 S,我们需要求出,在它所有子串的所有拆分方式中,优秀拆分的总个数。这里的子串是指字符串中连续的一段。
以下事项需要注意:
- 出现在不同位置的相同子串,我们认为是不同的子串,它们的优秀拆分均会被记入答案。
- 在一个拆分中,允许出现 。例如 存在拆分 。
- 字符串本身也是它的一个子串。
输入格式
每个输入文件包含多组数据。
输入文件的第一行只有一个整数 ,表示数据的组数。
接下来 行,每行包含一个仅由英文小写字母构成的字符串 ,意义如题所述。
输出格式
输出 行,每行包含一个整数,表示字符串 所有子串的所有拆分中,总共有多少个是优秀的拆分。
输入输出样例
输入 #1
4
aabbbb
cccccc
aabaabaabaa
bbaabaababaaba
输出 #1
3
5
4
7
说明/提示
样例解释
我们用 表示字符串 第 个字符到第 个字符的子串(从 开始计数)。
第一组数据中,共有三个子串存在优秀的拆分: ,优秀的拆分为 ,; ,优秀的拆分为 ,; ,优秀的拆分为 ,。 而剩下的子串不存在优秀的拆分,所以第一组数据的答案是 3。
第二组数据中,有两类,总共四个子串存在优秀的拆分: 对于子串 ,它们优秀的拆分相同,均为 ,,但由于这些子串位置不同,因此要计算三次; 对于子串 ,它优秀的拆分有两种:, 和 ,,它们是相同子串的不同拆分,也都要计入答案。 所以第二组数据的答案是 。
第三组数据中, 和 各有两种优秀的拆分,其中 是问题描述中的例子,所以答案是 。
第四组数据中,,,,, 各有一种优秀的拆分, 有两种优秀的拆分,所以答案是 。
数据范围
对于全部的测试点,保证 。以下对数据的限制均是对于单组输入数据而言的,也就是说同一个测试点下的 组数据均满足限制条件。
我们假定 为字符串 的长度,每个测试点的详细数据范围见下表:
测试点编号 | 特殊性质 | |
---|---|---|
中所有字符相同 | ||
中所有字符相同 | ||
题目解答
本题题解尚未完成/尚未完善, 不足以 AC 通过评判。
这道题目要我们拆分字符串, 我们第一时间可以想到枚举所有可能性。
- C++
/**
* 洛谷 P1117 解答程序。
* @author CoolCLK
*/
#include <iostream>
#include <string>
#include <vector>
#define repeat(n) for (size_t _ = 0; _ < n; _++)
typedef unsigned short u_short;
typedef unsigned int u_int;
using namespace std;
u_short T;
/**
* string 工具类,截取片段。
* @author CoolCLK
*/
class string_part {
private:
string* str = nullptr;
size_t index;
size_t length;
public:
string_part(string* str, size_t index, size_t length) {
this->str = str;
this->index = index;
this->length = length;
}
size_t get_index() {
return this->index;
}
size_t back() {
return this->index + this->length;
}
string to_string() {
return this->str->substr(this->index, this->length);
}
};
/**
* 寻找字符串中 AABB 格式。
* @author CoolCLK
*/
u_int findAABB(string str) {
u_int ans = 0;
vector<string_part> strs;
for (size_t i = 0; i < str.length(); i++) {
for (size_t len = 1; i + (2 * len) <= str.length(); len++) {
if (str.substr(i, len) == str.substr(i + len, len) && len >= 1) {
strs.emplace_back(&str, i, 2 * len);
}
}
}
for (auto s : strs) {
for (auto ns : strs) {
if (ns.get_index() == s.back()) {
ans++;
}
}
}
return ans;
}
int main() {
cin >> T;
vector<u_int> answers;
repeat(T) {
string S;
cin >> S;
answers.emplace_back(findAABB(S));
}
for (auto ans : answers) {
cout << ans << endl;
}
return 0;
}
代码中,我通过枚举 每个的一位置并向后扩展, 直到产生 串。 并很容易地想到, 也可以当作 串处理, 只需要找到有几个紧邻的 串即可。
但是,这种方法的平均时间复杂度为 , 最坏时间复杂度为 。
也可以继续优化到 ,略微改动一下:
- C++
u_int findAABB(string str) {
vector<u_int> L(n, 0);
vector<u_int> R(n, 0);
for (size_t i = 0; i < n; i++) {
for (size_t len = 1; i + 2 * len <= n; len++) {
bool match = true;
for (size_t k = 0; k < len; k++) {
if (str[i + k] != str[i + len + k]) {
match = false;
break;
}
}
if (match) {
size_t end_index = i + 2 * len - 1;
if (end_index < n) {
L[end_index]++;
}
R[i]++;
}
}
}
u_int ans = 0;
for (size_t t = 0; t < n - 1; t++) {
ans += L[t] * R[t + 1];
}
return ans;
}
但还是不够,经测试,至少要达到 才可能通过, 否则就会 TLE 。
怎么办呢?