티스토리 뷰
[Statistics 110] 3강 - Birthday Problem과 확률의 특성 (Birthday Problem, Properties of Probability)
JG Ahn 2020. 7. 13. 21:12본 게시글은 [하버드] 확률론 기초: Statistics 110, 3강 - Birthday Problem과 확률의 특성을 보고 정리한 글입니다.
학습 목표
확률의 non-naive한 정의의 공리(규칙)을 이용하여 확률의 특성을 증명할 수 있으며, 포함배제의 원리를 이해한다.
핵심 키워드
- Birthday Problem
- 확률의 non-naive한 정의의 공리
- 확률의 특성
- 포함배제의 원리
학습 내용
생일 문제 (Birthday Problem)
생일 문제는 k명 중에 2명 이상이 같은 생일을 가질 확률을 뜻한다.
일별 출생 확률은 동일하고 각각의 사건은 독립적으로 발생한다고 가정한다.
K가 몇 명 이상이어야 같은 생일을 가진 사람들이 있을 확률이 50% 일까?
k > 365 일 때 확률은 1이다
k <= 365 라 할 때, 여사건을 이용하여 확률을 계산해보자
P(no match : 두 명의 생일이 같지 않은 경우)를 구하고 1에서 해당 확률을 빼면 최소한 한 쌍의 생일이 일치하는 확률을 구할 수 있습니다.
이런 방법은 자주 사용되는 방법으로, 사건의 확률을 직접 찾는 것이 쉬울지 여사건을 계산하는 것이 쉬운지 생각해봐야 합니다.
이 경우에는 여사건을 게산하는것이 더 쉽습니다.
확률의 naive한 정의를 사용해서 모두 동일한 확률이라고 가정하면 분모는
분자의 경우 각각의 ID를 가지는 사람들을 생각해봅시다. ID의 순서대로 한 명씩 파티에 들어온다고 해봅시다.
첫 번째 사람은 365일 중 아무 때나 생일이 될 수 있습니다 : 365.
두 번째 사람은 첫 번째 사람과는 다른 생일을 아무 때나 가질 수 있습니다 :
다음 사람은 이 두 사람을 제외하고 아무 때나 생일을 가질 수 있습니다 :
이렇게 계속 곱해집니다. 따라서 다음과 같은 식으로 표현할 수 있죠.
참고로 P(match: 두 명의 생일이 같은 경우)의 확률을 보면 k가 23일 때 50.7%, k가 50일 때 97%, k가 100일 때 99.999%의 확률을 가집니다.
직관적으로 생각해보면 가장 중요한 값은 k가 아닌 k에서 2개를 고르는 경우의 수입니다. k명이 있을 때 k명 중에서 각 2명씩을 골라야 하기 때문입니다.
따라서 23명의 경우 253쌍을 만들 수 있고 큰 확률을 가질 것 같습니다.
확률의 non naive 한 정의
공리(자명한 이치)
1.
아무것도 일어나지 않는 경우는 없다
확실한 사건에 대해서는 항상 1의 확률을 가진다
2.
[합사건의 확률에 대한 정리]
n이 1부터 m또는 무한대가 되더라도 유한사건이 된다
A1, A2, ...가 모두 겹치지 않는 서로소여야 한다.
확률의 특징
1.
Proof
2.
Proof
확률은 항상 0~1 사이의 값을 가지기 때문에 음수를 가질 수 없다.
따라서
3.
Proof
이 때,
포함배제의 원리 (Inclusion-Exclusion Principle)
예제) deMontmort's Problem(1713): 카드가 놓인 위치(첫번째, 두번째, ...)와 카드에 쓰여있는 숫자가 일치할 확률은 얼마인가?
무작위로 섞여 있는 카드 1, 2, ... n 중에서, 카드 j가 j번째 순서에 놓이는 사건을
모든 위치에 대한 확률이 같은 확률이라고 할 때
카드 뭉치의 순서는
이것을 계속하면
이제 포함배제의 원리를 적용시켜보겠습니다. 포함배제의 원리에 따라 위에서 구한 값들을 대입해보면
그러므로 구하고자 하는 확률인
'Mathematics > Harvard Statistics 110' 카테고리의 다른 글
[Statistics 110] 2강 - 해석을 통한 문제풀이 및 확률의 공리 (Story Proofs, Axioms of Probability) (0) | 2020.07.12 |
---|---|
[Statistics 110] Strategic Pratice 1 (ing) (0) | 2020.07.09 |
[Statistics 110] 1강 - 확률과 셈 원리 (Probability and Counting) (1) | 2020.07.08 |
모집단(Population), 모수(Population Parameter),표본(Sample)이란? (0) | 2020.04.30 |
- Total
- Today
- Yesterday
- nlg
- S3
- 모델 시각화
- MIT
- keras
- wavenet
- AWS
- RNN
- nlp 트렌드
- Tensorflow2.0
- stft
- nlp
- TF2.0
- lambda
- boto3
- LSTM
- librosa
- MFCC
- 6.006
- 알고리즘
- 알고리즘 강의
- 핵심어 검출
- 오디오 전처리
- tensorflow
- netron
- 인공지능 스피커 호출
- aws cli
- 시계열
- Introduction to Algorithm
- BOJ
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |