Я вчера по-моему загнал себя в угол, попытавшись понять, что в этой задаче делать можно и что нельзя. Поэтому хочу задать несколько вопросов, чтобы разобраться.
-
Может ли быть вероятность больше 1? Я знаю, что у негарантированных событий она может быть 1, но может ли у таких событий она быть больше 1? Событие не гарантировано, потому что как минимум можно придумать последовательность, которая состоит только из А: “ААА…ААА”.
-
Насколько я понимаю, вероятность, по определению, должна лежать в отрезке от 0 до 1 (0 \leq p \leq 1).
-
Также вероятностью является доля нужных нам событий среди всех. Но если среди всех комбинаций есть хотя бы несколько комбинаций, в которых наше событие не выполняется, как нужная нам доля может быть > 1?
-
-
Можно ли здесь просто умножить на 100?
-
Как я понимаю, умножать можно если у нас несколько вариантов, из которых должен выполняться хотя бы один. Тогда, если можно умножать, то как мне кажется, надо умножать на 98.
-
Но есть и другая мысль. Если не ошибаюсь, умножать можно только тогда, когда эти события не могут пересекаться (они должны быть mutually exhaustive), а в этом случае явно есть пересечения между вариантами событий, и умножая на 100 (98), мы все эти пересечения считаем повторно.
-
Объясню, что я имел ввиду про пересечения. Всего у нас 4^{100} комбинаций. Нужная тройка нуклеотидов может попасться самой первой, а может и второй, и так далее. Поэтому можно посчитать число комбинаций для всех таких случаев и просуммировать их:
NGGNNNN…
NNGGNNN…
NNNGGNN…
NNNNGGN…
…
Для каждого из этих случаев число комбинаций равно 4^{98}. Самих случаев 98. То есть если мы посчитаем таким образом, у нас выйдет ответ, который мы писали изначально.
Теперь соберем множества из комбинаций для каждого случая. У нас получится 98 множеств. Пересечения, о которых я спрашивал, это те комбинации, которые принадлежат одновременно более чем одному из этих множеств. И каждое из таких пересечений мы считаем как минимум два раза. Приведу пример.
Есть такие комбинации, которые принадлежат и первому и второму множеству (пронумеруем множества в порядке, котором я их писал). Их ровно столько, сколько существует таких комбинаций:
NGGGNNN…
А таких комбинаций бывает 4^{97}. После этого я пытался найти паттерн, по которому можно было бы понять, как учесть пересечения всех 98 множеств, но пока не удалось.
Одно из двух — либо задача довольно трудна для ее решения за 5-10 минут на олимпиаде, либо я себе усложняю жизнь. Хотелось бы понять, что из этого.