-
Notifications
You must be signed in to change notification settings - Fork 6
/
Copy pathprobability_dna_caesar_do_not_touch.tex
4240 lines (3205 loc) · 233 KB
/
probability_dna_caesar_do_not_touch.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
% !BIB TS-program = biber
\documentclass[a4paper]{caesar_book}
% этот файл не развивается,
% но оставлен как страховка на случай если tufte-handout не будет развиваться
\usepackage[colorlinks]{hyperref}
\usepackage{fontspec} % работа со шрифтами
\usepackage{polyglossia} % учим русский как иностранный :)
\setmainlanguage{russian}
\setotherlanguages{english}
% заменяем --- на тире, << на кавычки и т.д.:
\defaultfontfeatures{Ligatures = TeX}
% download "Linux Libertine" fonts:
% http://www.linuxlibertine.org/index.php?id=91&L=1
\setmainfont{Linux Libertine O} % or Helvetica, Arial, Cambria
% why do we need \newfontfamily:
% http://tex.stackexchange.com/questions/91507/
\newfontfamily{\cyrillicfonttt}{Linux Libertine O}
\newfontfamily{\cyrillicfont}{Linux Libertine O}
\newfontfamily{\cyrillicfontsf}{Linux Libertine O}
\usepackage{amsmath}
\usepackage{amsthm}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{url} % вставка \url{}
\usepackage{graphicx} % вставка графиков
\usepackage{csquotes} % адаптирующиеся кавычки командой \enquote{}
\usepackage{comment} % ingore everything between \begin{comment} \end{comment}
\usepackage{answers} % separate problems and solutions
\usepackage{tikz} % pictures with tikz language
\usepackage{todonotes} % todo in documents
\usepackage{enumitem} % для создания своих нумерующих списков (хак для гиперссылок)
%\usepackage[left=2cm,right=2cm,top=2cm,bottom=2cm]{geometry}
\theoremstyle{definition}
% \newtheorem{problem}{Задача}
% \numberwithin{problem}{section}
\Newassociation{sol}{solution}{solution_file}
% sol — имя окружения внутри задач
% solution — имя окружения внутри solution_file
% solution_file — имя файла в который будет идти запись решений
% можно изменить далее по ходу
% very useful during de-bugging!
% \usepackage[left]{showlabels}
% \showlabels{hypertarget}
% \showlabels{hyperlink}
% магия для автоматических гиперссылок задача-решение
\newlist{myenum}{enumerate}{3}
% \newcounter{problem}[chapter] % нумерация задач внутри глав
\newcounter{problem}
\newenvironment{problem}%
{%
\refstepcounter{problem}%
% hyperlink to solution
% \hypertarget{problem:{\thechapter.\theproblem}}{} % нумерация внутри глав
\hypertarget{problem:{\theproblem}}{}
%\Writetofile{solution_file}{\protect\hypertarget{soln:\thechapter.\theproblem}{}}
\Writetofile{solution_file}{\protect\hypertarget{soln:\theproblem}{}}
% \begin{myenum}[label=\bfseries\protect\hyperlink{soln:\thechapter.\theproblem}{\thechapter.\theproblem},ref=\thechapter.\theproblem]
\begin{myenum}[label=\bfseries\protect\hyperlink{soln:\theproblem}{\theproblem}, ref=\theproblem, leftmargin=0pt]
\item%
}%
{%
\end{myenum}}
% для гиперссылок обратно надо переопределять окружение
% это происходит непосредственно перед подключением файла с решениями
\DeclareMathOperator{\Var}{Var}
\DeclareMathOperator{\card}{card}
\DeclareMathOperator{\Cov}{Var}
\DeclareMathOperator{\E}{E}
\renewcommand{\P}{\mathbb{P}}
\newcommand{\I}{\mathbb{I}} % индикатор события
\usepackage[bibencoding = auto,
backend = biber,
sorting = nyt, % name-year-title sorting
style=authoryear]{biblatex}
\addbibresource{probability_dna.bib}
\AddEnumerateCounter{\asbuk}{\russian@alph}{щ} % для списков с русскими буквами
\setlist[enumerate, 1]{label=\asbuk*),ref=\asbuk*}
\title{Теория вероятностей: культурный код}
\author{Фольклор}
\date{\today}
\begin{document}
% \frontmatter
% \tableofcontents
% \mainmatter
\chapter{Задачи}
fff % без этого какой-то странный баг?
\Opensolutionfile{solution_file} % [sols_chap_07]
% в квадратных скобках можно уточнить фактическое имя файла
\begin{problem}
Задача о Сумасшедшей Старушке.
\sidenote{Родилась она чисто из жизни — а именно, тогда,
когда ещё юному автору приходилось часто ездить из Питера во Псков.
Чаще всего билет на покупался в общий вагон поезда. На билете всегда было указано место.
Но не тут-то было! Приходя в вагон, обнаруживалось,
что пришедшие первыми занимали самые лучшие места
(утверждая, что номера мест на билетах — это просто для статистики).
И вот тут-то и начинались эти цепочные сгоняния пассажиров.
В оригинале задачка звучала так:
«В общем вагоне поезда Ленинград-Псков $N$ мест\ldots $N$-й пассажир,
придя последним, обнаруживал,
что свободно только только самое дурацкое место — около туалета\ldots»
Но в редакции Кванта решили, что писать про бардак и туалет в общем вагоне
поезда Лениград-Псков как-то не очень. И самовольно переделали условие на кинотеатр,
\url{http://kvant.mccme.ru/1985/06/p34.htm}, автор: Игорь Алексеев}
В самолёте $100$ мест и все билеты проданы.
Первой в очереди на посадку стоит Сумасшедшая Старушка,
она очень переживает, что ей не хватит места.
Сумасшедшая Старушка врывается в самолёт
и несмотря на номер по билету садится на случайно выбираемое место.
Каждый оставшийся пассажир садится на своё место, если оно свободно,
и на случайное выбираемое место, если его место уже кем-то занято.
\begin{enumerate}
% \item Какова вероятность того, что все пассажиры сядут на свои места?
%\item Какова вероятность того, что второй пассажир в очереди сядет на своё место?
\item Какова вероятность того, что последний пассажир сядет на своё место?
\item Чему примерно равно среднее количество пассажиров севших на свои места?
\end{enumerate}
\begin{figure*}
\includegraphics[width=15cm]{images/crazy_woman.jpg}
\caption{— Простите, пожалуйста, это место 1Б?}
\end{figure*}
\begin{sol}
Решение раз. Рассмотрим последовательность пересаживаний,
начинающуюся с сумасшедшей старушки.
В этой последовательности последний пассажир и
сама сумасшедшая старушка равновероятно опережают друг друга.
Следовательно, искомая вероятность равна $1/2$.
Решение два. Решаем задачу для $n=2$, получаем вероятность $1/2$.
База индукции есть. Предположим, что
для $1$, $2$, \ldots, $n-1$ пассажира вероятность равна $1/2$.
В случае $n$ пассажиров первым ходом старушка может занять своё место,
место последнего, какое-то другое место. Если она заняла своё,
то последний точно сядет на своё место. Если она заняла место последнего,
то он точно не сядет на своё место. Если она сядет на одно из оставшихся мест,
то вскоре очередь дойдёт до того пассажира, чьё место она заняла.
В этот момент можно считать, что он превратится в сумасшедшую старушку.
Для меньшего количество пассажиров задача решена и даёт вероятность $1/2$.
В силу симметрии получаем вероятность $1/2$ и для $n$ пассажиров.
\end{sol}
\end{problem}
\begin{problem}
На самолёт, имеющий $100$ мест, проданы все билеты.
Для посадки в самолёт пассажиры выстроились в очередь.
Первые 99 пассажиров — сумасшедшие старушки.
Они садятся на наугад выбранные места. Последний пассажир садится на то место,
которое указано в его билете. Если это место занято, то он с
помощью стюардессы сгоняет старушку со своего законного места.
Согнанная с чужого места сумасшедшая старушка становится
благоразумной и садится на свое место по билету. Возможно для
этого придется согнать еще одну старушку и так далее.
\begin{enumerate}
\item Какова вероятность того, что потревожат старушку, стоявшую $i$-ой в очереди?
\item Каково ожидаемое количество потревоженных старушек?
\end{enumerate}
\begin{sol}
\begin{enumerate}
\item Чтобы потревожили старушку, стоявшую $i$-ой в очереди,
эта старушка должна случайным образом выбрать то место из $101-i$ оставшихся,
которое по билету принадлежит последнему пассажиру,
или же сесть на место другой сумасшедшей старушки так,
чтобы в итоге другая сумасшедшая старушка попросила ее пересесть.
Если старушки случайно выбирают место в порядке очереди,
то $i$-ая старушка будет выбирать $1$ место из $101-i$.
Вероятность случайно выбрать место одинакова для всех мест, а значит:
$\P(\text{i grandma will choose the last passenger`s seat})=1 - \frac{1}{101-i} =
\frac{100-i}{101-i}$.
НО: здесь еще надо учесть ситуацию,
когда в итоге $i$-ая старушка будет потревожена другой.
Ответ: min $\P(\text{i grandma will be bothered}) =\frac{100-i}{101-i}$
\item Одну из старушек потревожат с вероятностью $\frac{1}{100}$,
так как она должна была случайно выбрать одно из $100$ мест.
Если её потревожили, то с вероятностью $\frac{98}{99}$ место, указанное в ее билете,
будет занято, что преполагает пересаживание еще одной старушки и т.д.
Ноль старушек будет потревожено с вероятностью $\frac{99}{100}$,
лишь одна старушка будет потревожена с вероятностью $\frac{1}{100} \cdot \frac{1}{99}$,
две старушки будут потревожены с вероятностью
$\frac{1}{100} \cdot \frac{98}{99} \cdot \frac{1}{98}$ и т.д.
Заметим, что при нахождении математического ожидания
можно будет вынести $\frac{1}{9000}$ за скобку, а в ней останется
сумма чисел от $1$ до $99$.
$\E(X) = 0 \cdot \frac{99}{100} + 1 \cdot \frac{1}{100} \cdot \frac{1}{99} +
2\cdot \frac{1}{100} \cdot \frac{98}{99} \cdot {1}{98} + \ldots = 0.489$
\end{enumerate}
\end{sol}
\end{problem}
\begin{problem}
Задача собирателя наклеек. Coupon collector's problem.
Производитель чудо-юдо-йогуртов наклеивает на каждую упаковку одну
из 50 случайно выбираемых наклеек. Покупатель собравший все виды наклеек
получает приз от производителя. Пусть $X$ — это количество упаковок йогурта,
которое нужно купить, чтобы собрать все наклейки.
Найдите $\E(X)$, $\Var(X)$.
\begin{sol}
Количество наклеек можно разложить в сумму независимых случайных величин,
\[
X=Z_1+Z_2+\ldots+Z_n,
\]
где $Z_i$ — количество наклеек, которые нужно докупить,
чтобы найти $i$-ый новый вид наклейки, когда в коллекции уже есть наклейки $i-1$ вида.
Конечно, $Z_1=1$.
Замечаем, что $\E(Z_i)=\ldots $, $\Var(Z_i)=\ldots $.
\end{sol}
\end{problem}
\begin{problem}
Спички Банаха. Banach's matchbox problem.
Польский математик Стефан Банах имел привычку носить
в каждом из двух карманов пальто по коробку спичек.
Всякий раз, когда ему хотелось закурить трубку,
он выбирал наугад один из коробков и доставал из него спичку.
Первоначально в каждом коробке было по $n$ спичек.
Но когда-то наступает момент, когда выбранный наугад коробок оказывается пустым.
\begin{enumerate}
\item Какова вероятность того,
что в другом коробке в этот момент осталось ровно $k$ спичек?
\item Каково среднее количество спичек в другом коробке?
\end{enumerate}
\begin{sol}
\begin{enumerate}
\item Обозначим оставшееся количество спичек в другом кармане буквой $X$.
Рассмотрим случай, когда Банах обнаруживает пустым правый карман.
Следовательно, Банах проверил оба своих кармана всего $n-k+n=2n-k$ раз,
из которых $n-k$ раз он проверил левый карман, $n$ раз — правый,
а сейчас лезет в правый карман.
Используя формулу для биномиального распределения получаем:
\[
C_{2n-k}^n \left(\frac{1}{2}\right)^{n-k}\cdot
\left(\frac{1}{2}\right)^{n}\cdot \frac{1}{2}=
C_{2n-k}^{n}\left(\frac{1}{2}\right)^{2n-k+1}
\]
Второй случай рассматривается аналогично, если мы просто поменяем карманы местами.
Умножаем полученную вероятность на $2$, получаем:
\[
\P(X=k)=2\cdot C_{2n-k}^{n}\left(\frac{1}{2}\right)^{2n-k+1}=
C_{2n-k}^{n}\left(\frac{1}{2}\right)^{2n-k}
\]
\item
\end{enumerate}
\end{sol}
\end{problem}
\begin{problem}
Равновесие Харди-Вайнберга.
Предположим, что три возможных генотипа \verb|aa|, \verb|Aa| и \verb|AA|
изначально встречаются с частотами $p_1$, $p_2$ и $p_3$, где $p_1+p_2+p_3=1$.
Ген не сцеплен с полом,
поэтому частоты $p_1$, $p_2$ и $p_3$ одинаковы для мужчин и для женщин.
\begin{enumerate}
\item У семейных пар из этой популяции рождаются дети.
Назовём этих детей первым поколением.
Каковы частоты для трёх возможных генотипов в первом поколении?
\item У семейных пар первого поколения тоже рождаются дети.
Назовём этих детей вторым поколением.
Каковы частоты для трёх возможных генотипов во втором поколении?
\item Каковы частоты для трёх возможных генотипов в $n$-ном поколении?
\item Заметив явную особенность предыдущего ответа сформулируйте
теорему о равновесии Харди-Вайнберга.
Прокомментируйте утверждение: «Любой рецессивный ген со временем исчезнет».
\end{enumerate}
\begin{sol}
Рассмотрим все варианты скрещивания и вероятности:
\begin{tabular}{ll}
$\verb|AA|*\verb|AA|$ & $p_1^2$ \\
$\verb|AA|*\verb|Aa|$ & $2 \cdot p_1 \cdot p_2$ \\
$\verb|AA|*\verb|aa|$ & $2 \cdot p_1 \cdot p_3$ \\
$\verb|Aa|*\verb|Aa|$ & $p_2^2$ \\
$\verb|Aa|*\verb|aa|$ & $2\cdot p_2 \cdot p_3$ \\
$\verb|aa|*\verb|aa|$ & $p_3^3$
\end{tabular}
Зная, какие дети рождаются у всевозможных пар,
составим аналогичную таблицу вероятностей для генотипов детей:
\begin{tabular}{ll}
$\verb|AA|$ & $p_1^2+p_1 \cdot p_2+0.25 \cdot p_2^2 = p^2$ \\
$\verb|Aa|$ &
$p_1 \cdot p_2+p_2 \cdot p_3+0.5 \cdot p_2^2+2 \cdot p_1 \cdot p_3 = 2pq$ \\
$\verb|aa|$ & $p_3^2+p_2 \cdot p_3+0.25 \cdot p_2^2 = q^2$
\end{tabular}
Видим, что всё это сворачивается в полные квадраты:
$\verb|AA|: (p_1+0.5 \cdot p_2)^2 = p'^2$
$\verb|Aa|: 2(p_1+0.5 \cdot p_2)^2\cdot (p_3+0.5 \cdot p_2)^2 = 2p'q'$
$\verb|aa|:(p_3+0.5 \cdot p_2)^2 = q'^2$
Соотношение генов не изменилось и всё ещё удовлетворяет уравнению $p'^2+2p'q'+q'^2=1$
Потому соотношение генов в любом поколении не меняется,
а значит, рецессивный ген со временем не исчезает.
\end{sol}
\end{problem}
\begin{problem}
Поляризация света.
Световая волна может быть разложена на две поляризованные составляющие,
вертикальную и горизонтальную.
Поэтому состояние отдельного поляризованного фотона
может быть описано углом $\alpha$.
\sidenote{На самом деле внутренний мир фотона гораздо разнообразнее.}
Поляризационный фильтр описывается углом поворота $\theta$.
Фотон в состоянии $\alpha$ задерживается поляризационным фильтром с параметром $\theta$
с вероятностью $p=\sin^2(\alpha-\theta)$ или
проходит сквозь фильтр с вероятностью $1-p$,
переходя при этом в состояние $\theta$.
\begin{enumerate}
\item Какова вероятность того,
что поляризованный фотон в состоянии $\alpha$
пройдёт сквозь фильтр с параметром $\theta=0$?
\item Имеется два фильтра и поляризованный фотон в состоянии $\alpha$.
Первый фильтр — с $\theta=0$, второй — c $\theta=\pi/2$.
Какова вероятность того, что фотон пройдет через оба фильтра?
\item Имеется три фильтра и поляризованный фотон в состоянии $\alpha$.
Первый фильтр — с $\theta=0$, второй — c $\theta=\beta$, третий — с $\theta=\pi/2$.
Какова вероятность того, что фотон пройдет через все три фильтра?
При каких $\alpha$ и $\beta$ она будет максимальной и чему при этом она будет равна?
\sidenote{Как сделать «секретный монитор» своими руками,
\url{http://www.youtube.com/watch?v=-ojbykV1zyc}}
\item Объясните следующий фокус. Фокусник берет два специальных стекла и видно,
что свет сквозь них не проходит. Фокусник ставит между двумя стёклами третье,
и свет начинает проходить через три стекла.
\end{enumerate}
\begin{sol}
\begin{figure*}
\includegraphics[width=10cm]{images/tree_task6.jpg}
\end{figure*}
\begin{enumerate}
\item $\P(\text{фотон в состоянии } \alpha
\text{ пройдет через фильтр с параметром } \theta = 0)
= 1 - \sin^2(\alpha-0) = \cos^2(\alpha)$
\item $\P(\text{фотон пройдет сквозь фильтр с параметром } \theta = 0
\text{, переходя в состояние} 0) = 1 - \sin^2(\alpha) = \cos^2(\alpha)$
$\P(\text{фотон в состоянии } 0
\text{ пройдёт сквозь фильтр с параметром } \theta = \pi/2)
= 1−\sin^2(0-\pi/2) = \cos^2(-\pi/2)$
Ответ: $\P(\text{фотон в состоянии } \alpha
\text{ пройдет через фильтр с параметром } \theta = 0
\text{ и сквозь второй фильтр } \theta = \pi/2) =
\cos^2(\alpha) \cdot \cos^2(−\pi/2) = 0$
\item $\P(\text{фотон проходит сквозь фильтр с параметром } \theta = 0
\text{, переходя в состояние } 0) = 1 - \sin^2(\alpha) = \cos^2(\alpha)$
$\P(\text{фотон в состоянии } 0
\text{ проходит сквозь фильтр с параметром } \theta = \beta
\text{, переходя в состояние } \beta) = 1−\sin^2(0-\beta) = \cos^2(-\beta)$
$\P(\text{фотон в состоянии } \beta
\text{ проходит сквозь фильтр с параметром } \theta = \pi/2)
= 1−\sin^2(\beta-\pi/2) = \cos^2(\beta-\pi/2)$
Вероятность того, что фотон пройдет поочереди по всем трём фильтрам равна:
\[
\cos^2(\alpha)\cdot \cos^2(-\beta)\cdot\cos^2(\beta-\pi/2)
\]
Максимизируя вероятность, получаем $\alpha = 0, \beta = \pi/4$.
При этих значениях вероятность прохождения через три фильтра равна $1/4$.
\item Данный фокус объясняется с помощью уже решённых пунктов 2 и 3.
В пункте 2 мы доказали,что при любых $\alpha$ вероятность того,
что свет сначала пройдет сквозь фильтр с параметром $\theta = 0$,
а потом сквозь фильтр с параметром $\theta=\pi/2$ равняется $0$.
В пункте 3 мы доказали, что если $\alpha = \pi/2$
и между этими фильтрами ставить другой фильтр с параметром $\beta=\pi/4$,
то всегда будет существовать вероятность ($1/4$),
что свет пройдет сквозь 3 фильтра/стекла.
Именно этим и объясняется почему свет не проходит сквозь два стекла,
а когда между ними ставишь другое стекло, то он начинает проходить сквозь три стекла.
\end{enumerate}
\end{sol}
\end{problem}
\begin{problem}
Истеричная певица
Начинающая певица дает концерты каждый день.
Каждый ее концерт приносит продюсеру 0.75 тысяч евро.
После каждого концерта певица может впасть в депрессию с вероятностью 0.5.
Самостоятельно выйти из депрессии певица не может.
В депрессии она не в состоянии проводить концерты.
Помочь ей могут только цветы от продюсера.
Если подарить цветы на сумму $0\le x\le 1$ тысяч евро,
то она выйдет из депрессии с вероятностью $\sqrt{x}$.
Какова оптимальная стратегия продюсера?
Продюсер максимизирует текущую ожидаемую ценность певицы.
\begin{sol}
Рассмотрим совершенно конкурентный невольничий рынок начинающих певиц.
Певицы в хорошем настроении продаются по $V_1$, в депрессии — по $V_2$.
Получаем систему уравнений:
\[
\begin{cases}
V_1 = 0.75 + (0.5 V_1 + 0.5 V_2) \\
V_2 = \max_x \sqrt{x}V_1 + (1 - \sqrt{x})V_2 - x
\end{cases}
\]
Оптимизируем и получаем, $x^* = (V_1 - V_2)^2/4$.
Из первого уравнения находим $(V_1 - V_2)/2=0.75$.
\end{sol}
\end{problem}
\begin{problem}
Парадокс Симпсона. Simpson's Paradox.
Два лекарства испытывали на мужчинах и женщинах. Каждый
человек принимал только одно лекарство. Общий процент людей,
почувствовавших улучшение, больше среди принимавших лекарство А.
Процент мужчин, почувствовавших улучшение, больше среди мужчин, принимавших лекарство В.
Процент женщин, почувствовавших улучшение, больше среди женщин, принимавших лекарство В.
\begin{enumerate}
\item Возможно ли это?
\item Какое лекарство нужно посоветовать принять пациенту, если его пол неизвестен?
\end{enumerate}
\begin{sol}
Да, возможно.
% \todo[inline]{две иллюстрации: с мозаичными графиками и векторами из Вильямса}
Если пол неизвестен, то лучше принимать $B$.
\end{sol}
\end{problem}
\begin{problem}
Вовочку перевели из класса А в класс Б.
Мог ли при этом возрасти средний балл по математике в обоих классах?
\begin{sol}
Да, возможно, если уровень Вовочки ниже среднего уровня класса А,
но выше среднего уровня класса Б.
\end{sol}
\begin{figure*}
\includegraphics[width=17cm]{images/average.png}
\caption{Dilbert}
\end{figure*}
\end{problem}
\begin{problem}
Злобный дракон поймал трех гномов. И решил поиграться с ними.
Каждому гному он надевает с равными вероятностями черный или белый колпак.
\sidenote{ — Значит, дракон — это датчик случайных колпаков?}
Гномы видят чужие колпаки, но не видят своих и не могут общаться после выдачи колпаков.
Каждый гном может попытаться угадать цвет своего колпака, либо промолчать.
Дракон отпустит гномов, если хотя бы один гном угадал цвет своего колпака,
и никто не сделал ошибки. Если все одновременно промолчали, или кто-нибудь ошибся,
то все гномы будут съедены. Перед игрой гномы могут договориться о стратегии игры.
\begin{enumerate}
\item Как гномам следует играть, если Злобный дракон спрашивает их по очереди?
Какова вероятность того, что они будут спасены?
\item Как гномам следует играть, если они должны дать ответ одновременно?
Какова вероятность того, что они будут спасены?
\item Если от далекого спутника нужно получить один бит информации («да» или «нет»),
то, отправив три бита, можно не бояться того, что природа «испортит» один из них.
Постройте этот простой код. Проведите аналогию с предыдущим пунктом.
\sidenote{ — Три гнома — три бита?}
\end{enumerate}
Идея этой задачи используется не только при космической связи.
Чтобы неглубокие царапины на компакт диске не вызывали потерь данных,
при записи используется код Рида-Соломона.
\sidenote{ — А как звали третьего гнома?}
\begin{sol}
\begin{enumerate}
\item Присвоим белому колпаку значение $0$, а черному $1$. Первый гном смотрит
на двух остальных и считает «сумму» их колпаков. Пусть по договоренности,
если сумма четная, то гном произносит «белый», нечетная – «чёрный».
Дракон воспринимает высказанное как догадку о цвете колпака первого гнома,
хотя по сути оно таковым не является. У гнома нет данных,
чтобы сделать вывод о цвете своего колпака. С вероятностью 0.5 гном
либо угадал цвет своего колпака, сообщая сумму двум другим игрокам,
и игра продолжается, либо не угадал и все будут съедены.
Допустим, первый считает сумму, видит, что она нечетная, говорит дракону,
что его колпак черный и случайным образом угадывает цвет своего колпака.
Второй, зная сумму, которую назвал первый, смотрит на шапку третьего гнома
и сравнивает «значение» колпака третьего гнома с названной ранее суммой.
Если она не изменилась, то его колпак, очевидно, белый. Изменилась – чёрный.
Из предположения второго третий наверняка знает, какого цвета на нём колпак.
Таким образом, вероятность выигрыша сводится к вероятности того,
что названная первым гномом «сумма» в действительности соответствует цвету его колпака.
\item Итак, у нас есть счётное число гномов, которые увидели дракона.
Эти гномы знают, что колпаки бывают двух цветов — чёрного и белого,
поэтому последовательность из белых и чёрных колпаков
(надетых на головы бедных гномов, конечно)
является последовательностью
абсолютно эквивалентной последовательности из нулей и единиц,
рассмотренной в предыдущем пункте.
Что же мешает нам посоветовать гномам заранее определить
представительскую последовательность в каждом классе похожих
(главную звезду в созвездии похожих звёзд колпаков) и угадывать свой цвет, согласно ей?!
Тогда каждый гном, видя цвета колпаков своих друзей, стоящих впереди,
сможет определить класс, к которому принадлежит реальная последовательность колпаков
(определенная драконом при раздаче колпаков).
Так как эта последовательность «похожа»
на выбранную гномами в качестве представительской,
то она будет отличаться от нее на конечное число колпаков.
Значит, гадая согласно выбранной последовательности,
лишь конечное число гномов назовут свои цвета неправильно.
\end{enumerate}
\end{sol}
\end{problem}
\begin{problem}
Париж, Людовик XIV, 1654 год, высшее общество говорит о рождении новой науки —
теории вероятностей. Ах, кавалер де Мере,
«fort honnête homme sans être mathématicien»\ldots
\sidenote{«благородный человек, хотя и не математик».}
Старая задача, неправильные решения которой предлагались тысячелетиями
(например, одно из неправильных решений предлагал изобретатель двойной записи,
кумир бухгалтеров, Лука Пачоли) наконец решена правильно!
Два игрока играют в честную игру до шести побед. Игрок первым выигравший шесть партий
(не обязательно подряд) получает 800 луидоров.
К текущему моменту первый игрок выиграл пять партий, а второй — три партии.
Они вынуждены прервать игру в данной ситуации.
Как им поделить приз по справедливости?
\begin{center}
\begin{figure*}[t]
\includegraphics[width=10cm]{images/conditional.png}
\caption{\url{http://xkcd.com/795/}}
\end{figure*}
\end{center}
\begin{sol}
Проведём ещё 3 партии. Первый игрок проиграет только,
если все три выиграны вторым игроком, то есть с вероятностью $1/8$.
Стало быть $800$ луидоров надо поделить на $100$ и $700$.
\end{sol}
\end{problem}
\begin{problem}
На арене две команды гладиаторов, $A$ и $B$. Каждый гладиатор обладает
определенной силой, неизменной по ходу игры. Команды могут отличаться
по количеству гладиаторов и их силе. Игра проходит в виде последовательных турниров,
в каждом из которых участвует по одному гладиатору от каждой стороны.
Если в очередном турнире встречаются гладиаторы с силами $a$ и $b$,
то вероятность победы первого определяется величиной $\frac{a}{a+b}$.
Гладиатор, проигравший турнир, выбывает из игры, выигравший — возвращается в команду.
Гладиаторы не устают, но и не приобретают опыта. Стратегия команды предписывает,
какого гладиатора выдвигать на очередной турнир в зависимости текущего состава команд.
Игра ведется до полного выбывания из игры одной из команд.
Как выглядит оптимальная стратегия команды $A$?
\begin{sol}
Для упрощения объяснений временно заменим гладиаторов на лампочки.
У них есть важное свойство: знание о том, сколько времени лампочка уже горит,
не несёт информации о том, сколько она ещё будет гореть.
Единственное распределение с таким свойством — свойством отсутствия памяти —
экспоненциальное. Если математическое ожидание времени работы лампочки $x$,
то вероятность того, что она всё ещё горит в момент $t$, равна $e^{-t/x}$.
Если взять две лампочки с математическими ожиданиями времени работы,
равными $x$ и $y$ соответственно,
то первая будет гореть дольше второй с вероятностью $\frac{x}{x+y}$.
Встреча двух гладиаторов соответствует «соревнованию» между лампочками:
они горят, пока одна из них не перегорит, а ту, что выиграла,
выключают и могут выбрать для следующего турнира,
причём из-за свойства отсутствия памяти её «сила» в следующем турнире не меняется.
В течение турнира у каждый команды в любой момент времени горит ровно одна лампочка.
Выиграет та, у которой общая длительность горения всех лампочек
(общая сила всех гладиаторов) будет больше.
Поскольку эта общая длительность не зависит от того,
в каком порядке лампочки будут включаться, вероятность того,
что выиграет команда $A$ не зависит от её стратегии.
\end{sol}
\end{problem}
\begin{problem}
В отличие от обычного гладиатора, у победившего гладиатора-вампира сила увеличивается
на силу побежденного им гладиатора-вампира. В остальном правила поединка такие же,
как в предыдущей задаче.
Как выглядит оптимальная стратегия команды $A$?
\begin{sol}
Выпишем суммарную силу каждой из команд: $A = a_1 + \ldots + a_n$ и
$B = b_1 + \ldots + b_m$.
Предположим, что гладиатор из команды $A$ имеет силу $a$
и он побеждает гладиатора из $B$, сила которого была $b$.
В этом случае суммарная сила первой команды увеличивается на $b$,
а суммарная сила второй уменьшается на ту же величину,
так как её гладиатор выбывает из игры.
Однако при этом сила команд $A+B$ остаётся неизменной!
Таким образом, в конце суммарная сила победителя будет $A+B$, а проигравшего – $0$.
Рассчитаем математическое ожидание выигрыша команды $A$ в очередном турнире,
если она выдвинет гладиатора с силой $a$ против гладиатора с силой $b$:
\[
\frac{a}{a+b} \cdot b + \frac{a}{a+b} \cdot (-a) = 0
\]
Поскольку турниры не отличаются друг от друга,
для каждого математическое ожидание будет равно нулю, откуда следует,
что ожидаемый выигрыш команды $A$ равен её начальной суммарной силе.
Пусть $p$ – вероятность того, что выиграет команда $A$,
выпишем математическое ожидание выигрыша команды $A$ во всём турнире:
\[
p \cdot (A+B)+(1-p) \cdot 0=A
\]
Выразив $p = \frac{A}{A+B}$, видим,
что вероятность победы команды $A$ определяется
только соотношением начальных сил обеих команд и не зависит от их стратегий.
Значит, любая стратегия команды $A$ приведёт к одному и тому же результату.
\end{sol}
\end{problem}
\begin{problem}
Маша и Саша играют в быстрые шахматы. У них одинаковый класс игры и
оба предпочитают играть белыми, т.е. вероятность выигрыша белых $p>0.5$.
Партии играются до 10 побед. Первую партию Маша играет белыми.
Она считает, что в следующей партии белыми должен играть тот,
кто выиграл предыдущую партию. Саша считает, что ходить белыми нужно по очереди.
При каком варианте правил у Маши больше шансы выиграть?
\begin{sol}
Максимальное число партий, сыгранное Машей и Сашей = $20$.
В первой партии Маша играет белыми, и выигрывает с вероятностью $p>0.5$.
Независимо от правил Маша может сыграграть максимум $10$ раз, а Саша не больше $9$.
Победитель точно определится за $19$ партий. Победитель – игрок,
выигрывший в большем числе партий,
а значит Машин шанс выиграть не зависит от выбранного варианта правил.
\end{sol}
\end{problem}
\begin{problem}
Гадалка
Маша пишет на бумажках два любых различных натуральных числа по своему выбору.
Одну бумажку она прячет в левую руку, а другую — в правую.
Саша выбирает любую Машину руку. Маша показывает число, написанное на выбранной бумажке.
Саша высказывает свою догадку о том, открыл ли он большее из двух чисел или меньшее.
Если Саша не угадал, то Маша выиграла.
Существует ли у Саши стратегия,
гарантирующая ему выигрыш с вероятностью строго более 50\%, даже будучи известной Маше?
\begin{figure*}
\includegraphics[width=17cm]{images/ninenine.png}
\caption{Dilbert, «We guarantee that each number is random individually,
but we don't guarantee that more than one of them is random»,
\url{http://en.wikipedia.org/wiki/RANDU}}
\end{figure*}
\begin{sol}
Да. Например, такая.
До общения с Машей подкидывать монетку до выпадения первого орла
и запомнить число потребовавшихся подбрасываний. Пусть это будет число $X$.
Открыть равновероятно левую или правую Машину руку. Если открытое число больше $X$,
то сказать, что оно большее, иначе сказать, что меньшее.
\end{sol}
\end{problem}
\begin{problem}
Больший кусок окружности
Аня хватается за верёвку в форме окружности в произвольной точке.
Боря берёт мачете и с завязанными глазами разрубает
верёвку в двух случайных независимых местах. Аня забирает себе тот кусок,
за который держится. Боря забирает оставшийся кусок. Вся верёвка имеет единичную длину.
\begin{enumerate}
\item Чему равен ожидаемый длина куска верёвки, доставшегося Ане?
\item Вероятность того, что у Ани верёвка длиннее?
\end{enumerate}
\begin{sol}
\begin{enumerate}
\item Мысленно отметим на окружности три точки: места ударов Бориса и точку,
где схватилась Анна. Можно считать, что эти три точки равномерно
и независимо распределены по окружности.
Следовательно, среднее расстояние между соседними точками равно $1/3$.
Аня берёт два кусочка, слева и справа от своей точки.
Значит ей в среднем достаётся $2/3$ окружности.
\item Объявим точку, где схватилась Аня нулём.
Координаты двух ударов изобразим на плоскости. Закрашиваем подходящий участок.
Аня выигрывает на полосе вдоль биссектрисы за исключением двух треугольников.
Вероятность того, что Анин кусок длиннее равна $3/4$.
\end{enumerate}
\end{sol}
\end{problem}
\begin{problem}
Судьба Дон-Жуана.
У Дон-Жуана $n$ знакомых девушек, и их всех зовут по-разному. Он пишет
им $n$ писем, но по рассеянности раскладывает их в конверты
наугад. Случайная величина $X$ обозначает количество девушек, получивших письма,
адресованные лично им.
\begin{enumerate}
\item Найдите $\E(X)$, $\Var(X)$
\item Какова при большом $n$ вероятность того, что хотя бы одна девушка получит письмо,
адресованное ей?
\end{enumerate}
\begin{sol}
Раскладываем $X$ в сумму $X=Z_1 + Z_2 + \ldots + Z_n$. Получаем, $\E(X)=1$, $\Var(X)=1$.
\end{sol}
\end{problem}
\begin{problem}
Ефросинья подкидывают правильную монетку неограниченное количество раз.
\begin{enumerate}
\item Сколько в среднем нужно сделать бросков до появления последовательности ОРОР?
До появления последовательности РОРР?
\item Какова вероятность того, что ОРОР появится раньше РОРР?
\item Какова вероятность того, что ООО появится позже РРОО?
\item Каковы вероятности того, что ООР появится раньше ОРР? ОРР раньше РРО?
РРО раньше РОО? РОО раньше ООР?
\end{enumerate}
\begin{sol}
\begin{enumerate}
\item Воспользуемся интересным методом, который описан в статье \cite{li1980martingale}.
Метод заключается в том, что игроки учавствуют в честной лотерее.
Если поставил $1$\$: выиграл – получаешь $2$, включая поставленный $1$;
проиграл – у тебя $0$.
Допустим у нас есть последовательность ОРРРОРОР. Выигрышная последовательность ОРОР.
Все ставят на то, что в следующий ход выиграет эта комбинация следующим образом.
Ставится $1$\$ на то, что выпадет О. Если выпадает О,
то игрок обязан поставить полученные $2$ доллара на Р. Если опять выиграл,
то обязан поставить все $4$ выигранных доллара на Р и так далее.
Если проиграл, то выбывает игрок теряет деньги и выбывает из игры.
Кроме того, игроки вступают в игру так: в первый раз ставит 1 игрок,
во второй раз игроки 1 и 2 (если 1 не проиграл до этого),
в третий раз учвствуют игроки 1, 2, 3
(опять же, если один или оба не выбыли в результате прошлого кона).
В конце концов считается чистый выигрыш и ожидемое колличество бросков.
В нашем случае что-то выиграют 5 и 7 игроки (у 5 выигрыш равен $16$, у 7 – $4$).
Чистый выигрыш = $20 - N$, где $N$ - колличество ходов до ОРОР.
Организованная лотерея имеет нулевое математическое ожидание выигрыша на каждом ходу,
значит мат ожидание финального благосостояния игрока равно стартовому благосостоянию.
Тогда $\E(N) = 20$.
Итого, ожидаемое колличество ходов: до $\text{ОРОР} = 16 + 4 = 20$,
до $\text{РОРР} = 16 + 2 =18$.
Есть и ещё один метод решения, изложенный в
«DNA, Words And Models» by Robin, Rodolphe, and Schbath. Авторы объясняют,
почему математическое ожидание
есть сумма обратных вероятностей каждого префикса в слове,
который также является суффиксом этого же слова.
В случае ОРОР такие суффиксы-префиксы — это ОРОР и ОР, в случае РОРР это РОРР и Р.
Удивительно, но результат окажется таким же, как при предыдущем методе решения.
А вообще, это все можно вывести самостоятельно, вот пример,
если нужно найти количество бросков до ОРО:
\[
\begin{aligned}
\E(0) &= \frac{1}{2} (\E(\text{О}) + 1) + \frac{1}{2} (\E(0) + 1)\\
\E(\text{О}) &= \frac{1}{2} (\E(\text{О}) + 1) + \frac{1}{2} (\E(\text{ОР}) + 1)\\
\E(\text{ОР}) &= \frac{1}{2} (\E(\text{ОРО}) + 1) + \frac{1}{2} (\E(0) + 1)\\
\E(\text{ОРО}) &= 0
\end{aligned}
\]
По аналогии можно найти и количество бросков до ОРОР, и до РОРР
\item Пусть у меня есть какие-то состояние $p_{0,0}$ – это верятность того,
что ОРОР появится раньше РОРР, но еще не выпал ни орел, ни решка.
Тогда с вероятностью $0.5$ я окажусь в состоянии $p_{0,1}$ (выпала решка) и с $0.5$
в состоянии $p_{1,0}$ (выпал орел).
Получаем: $p_{0,0}=0.5p_{0,1}+0.5p_{1,0}$.
Таким образом, в конце концов можно составить систему
\[
\begin{cases}
2p_{0,0}=p_{0,1}+p_{1,0}\\
2p_{0,1}=p_{0,1}+p_{1,2}\\
2p_{1,0}=p_{2,1}+p_{1,0}\\
2p_{1,2}=p_{2,3}+p_{1,0}\\
2p_{2,1}=p_{0,1}+p_{3,2}\\
2p_{2,3}=p_{0,4}+p_{3,2}=p_{3,2}\\
2p_{3,2}=p_{4,3}+p_{0,0}=1+p_{1,0}\;,
\end{cases}
\]
где $p_{0,4} = 0$ и $p_{4,3} = 1$
Можно переписать систему как
\[
\begin{cases}
2p_{0,0}=p_{1,2}+p_{2,1}\\
2p_{1,2}=p_{2,3}+p_{2,1}\\
2p_{2,1}=p_{1,2}+2p_{2,3}\\
4p_{2,3}=1+p_{2,1}\;,
\end{cases}
\]
Решив ее, получаем ответ $p_{0,0} = 9/14$
\item Воспользуемся методом из Section 8.4 («Flipping Coins») из Concrete Mathematics.
Найдему сумму всех возможных кобинаций,
где побеждает РРОО: $S_{1} = \text{РРОО} +
\text{ОРРОО}+\text{РРРОО}+\text{ОРРРОО}+\text{РОРРОО}+\ldots$
где побеждает ООО: $S_{2} = \text{ООО}+ \text{РООО}+\text{ОООО}+\text{ОРООО}+\ldots$
где никто не побеждает: $N= 1 + \text{О}+\text{Р}+\text{ОР}+\text{ОО}+\text{РО}+\ldots $
Тогда, если мы заменим О и Р на вероятности их появления ($0.5$ и $0.5$),
то получим вероятность победы первой комбинации,
вероятность выигрыша второй комбинации и матемачиское ожидание окончания игры.
Составим три уравнения:
\[
\begin{cases}
N \text{ООО} =
S_{2} +S_{2} \text{О} + S_{2}\text{ОО} + S_{1}\text{О} + S_{1} \text{ОО}\\
N \text{РРОО} = S_{1} \\
S_{1} + S_{2} = 1\\
\end{cases}
\]
То есть мы к $N$ добавляем искомые комбинации и смотрим, как это всё расскладывается.
Ответ: $\P = 0.58333333$
\item ООР раньше чем ОРР? Не будем долго думать и воспользуемся уже известным способом
\[
\begin{cases}
N \text{ООР} = S_{1}\\
N \text{ОРР} = S_{2} +S_{1} \P\\
S_{1} + S_{2} = 1\\
\end{cases}
\]
$\P = 0.66666667$
ОРР раньше РРО?
\[
\begin{cases}
N \text{ОРР} = S_{1} + S_{2}\text{РР}\\
N \text{РРО} = S_{2}+ S_{1} \text{РО}+S_{1} \text{О}\\
S_{1} + S_{2} = 1\\
\end{cases}
\]
$\P = 0.75$
РРО ранше РОО?
\[
\begin{cases}
N \text{РРО} = S_{1} \\
N \text{РОО} = S_{2}+ S_{1} \text{О}\\
S_{1} + S_{2} = 1\\
\end{cases}
\]
$\P = 0.66666667$
РОО раньше ООР?
\[
\begin{cases}
N \text{РОО} = S_{1} + S_{2} \text{ОО}\\