Вопрос насчет хэшей

pseudo · 10.Октябрь.2022 16:34:44

Решал эту задачу. Есть более простое решение - проверять длину наибольшего общего префикса и длину наибольшего общего суффикса. Но можно ли в строке s найти хэш в отрезке [1, i-1] и [i+1, n] для каждого 1 \le i \le n и проверить равен ли результат хэшу t?

Я понял, что в тупую нельзя по первому примеру:
abdrakadabra
abrakadabra

hashs_{1, 2} + hashs_{4, 12} = 63 + 237776653 = 237776716
hash_t = 357736128

Zhabka · 10.Октябрь.2022 16:47:14

Ну во-первых это зависит от хэша, ты можешь как хэш использовать хоть rand(), так что лучше уточнять какие хэши ты используешь.

Во-вторых если ты используешь полиноминальное хэширование h[i] = (h[i - 1] + s[i] * p^i) \%hsh то чтобы склеивать строки нельзя просто сложить их хэш. Если ты понимаешь хэши то ты должен понимать что идея в том что изначально хэш это полином \sum_{i=1}^{|s|} s[i] * x^i, где подставили x = p и взяли по модулю hsh(чтобы не было переполнения).

Ну и допустим мы хотим склеить строки a и b и мы знаем полиномы \sum_{i=1}^{|a|} a[i] * x^i и \sum_{i=1}^{|b|} b[i] * x^i, теперь мы получили строку s = a + b, у неё будет полином:

\sum_{i=1}^{|s|} s[i] * x^i = \sum_{i=1}^{|a|} a[i] * x^i + x^{|a|} * \sum_{i=1}^{|b|} b[i] * x^i,

дальше подумай как нужно складывать хэши чтобы получить корректный хэш конкатенации. Кстати а как ты брал хэш подстрок?

pseudo · 10.Октябрь.2022 16:54:36

Окей. Если что напишу сюда еще.

int calc(int l, int r){
return (hs[r] - hs[l-1] * 1LL * p[r-l+1] % mod + mod) % mod;
}

pseudo · 10.Октябрь.2022 16:57:44

разве не s_i * x^{i-1} или это необязательно?

Zhabka · 10.Октябрь.2022 16:59:00

Зависит от реализации, разницы нету, просто я обычно перестраховываюсь чтобы не выходить за границы.

pseudo · 10.Октябрь.2022 17:00:05

Можете посоветовать какие-то ресурсы для лучшего понимания хэшей? Я понимаю идею хэширования, читал этот пост в cp-algorithms и порешал немного задач. Но может есть еще полезные ресурсы?

Zhabka · 10.Октябрь.2022 17:00:49

Ну теперь смотри hs[i] = \sum_{l=1}^{r=i} s[i] * x^i так ведь?
Подстрока (L, R) в твоей функции возвращается как hs[R] - hs[L] * x^{R-L+1}, не кажется результат странным?

Zhabka · 10.Октябрь.2022 17:02:45

вот блог есть.

pseudo · 10.Октябрь.2022 17:04:18

Я неправильно нахожу хэш на отрезке или вы ведете к ответу на вопрос “как нужно складывать хэши чтобы получить корректный хэш конкатенации”?

Zhabka · 10.Октябрь.2022 17:04:36

вот это, прочитай блог который я скинул там есть объяснение того как сравнивать подстроки и ± подробно расписано как всё выглядит.

pseudo · 11.Октябрь.2022 09:17:48

Там написано, что если есть строка длиной len, которая начинается в точке i, то хэш этой подстроки = (pref_{i+len} - pref_i * p^{len}) mod m. Что я делаю не так?

Zhabka · 11.Октябрь.2022 10:00:58

Ну выше я спросил как ты хэшируешь, как я понял ты хэшируешь как я, а тут другое хэширование

Тема		Ответов	Просм.
Задача на строки(хеши) Информатика	9	423	12.01.2024
Проверка на палиндромность Информатика	9	385	10.09.2022
USACO Robot Instructions Информатика	21	637	05.03.2023
XOR и любимое число Информатика	7	548	10.02.2023
Разделить и плюс К Информатика	8	447	20.01.2024
Информатика → Областная → 2022 \| BeyondOlympiads Обсуждаем олимпиады	6	187	25.02.2024
Суммa уникальных букв в строке (по всем подстрокам заданной строки) Информатика	3	325	08.02.2023
Задача на префиксные суммы Информатика	8	975	06.12.2021
Я решал задачу и понял, что решал не ту задачу, но все же мне интересно правильное ли мое решение? Информатика	6	490	01.07.2022
Dшка Юниорки 2021 Информатика	8	941	13.10.2022

Вопрос насчет хэшей

Связанные темы