티스토리 뷰
[Statistics 110] 1강 - 확률과 셈 원리 (Probability and Counting)
JG Ahn 2020. 7. 8. 19:40본 게시글은 [하버드] 확률론 기초: Statistics 110, 1강 - 확률과 셈 원리를 보고 정리한 글입니다.
목차
- 확률론의 활용 영역
- 용어 정리
- 확률의 Naive한 정의
- 내포하고 있는 가정
- 셈 원리(Counting Principle)
- 이항 계수(Bionomial Coefficient)
- 이항 계수 수식에 대한 설명
- 포커에서 풀하우스가 나올 확률 찾기
- Sampling Table(표본 추출 정리 표)
들어가기
확률론의 기초 이론을 배우는 과목입니다.
여러 가지 문제의 확률 계산 방법, 이산 및 연속 확률분포, 조건부 확률 분포, 마코프 체인, 중심극한정리 등을 배울 수 있습니다.
이곳에서 배운 이론은 수리통계학, 시뮬레이션에 근간이 되는 내용입니다.
학습 목표
확률의 기초 용어(표본공간, 사건, 셈 원리)를 이해하고 적용할 수 있다.
핵심 키워드
- 표본 공간 (sample space)
- 사건 (Event)
- 셈 원리-곱의 법칙 (Counting-Multiplication Rule)
- 이항 계수 (Binomial Coefficient)
학습 내용
확률론의 활용 영역
- 유전학, 물리학, 계량 경제학, 금융, 역사학, 정치
- 인문학, 사회과학계에서도 중요도와 활용이 늘어나고 있다
- 도박과 게임 - 통계에서 여러 번 연구된 주제이다 (페르마, 파스칼)
- 인생 전반 : 수학이 확실성에 대한 학문이라면, 확률은 불확실성(Uncertainty)을 계량화하는 것을 가능하게 해준다
용어 정리
- 표본 공간(Sample Space) : 시행에서 발생 가능한 모든 경우의 집합
- 사건(Event) : 표본공간의 부분집합
- P(A) : A라는 사건이 일어날 확률
확률의 Naive한 정의
내포하고 있는 가정:
- 모든 사건이 발생할 확률은 같다
- 유한한 표본공간
- 항상 이 가정이 만족되는 것은 아니기 때문에 적용 불가한 경우들이 있다
셈 원리(Counting Principle)
곱의 법칙(Multiplication Rule) : 발생 가능한 경우의 수가 \(n_1, n_2, ..., n_r\)가지인 \(1, 2, ..., r\)번의 시행에서 발생 가능한 모든 경우의 수는 \(n_1 \times n_2 \times...\times n_r\) 이다.
예시 : 아이스크림을 선택할 때 2개의 콘과 3개의 맛이 있다면 총 6가지의 경우의 수가 생긴다 (2 * 3)
이항계수(Bionomial Coefficient)
$$\binom{n}{k} = \frac{n!}{(n-k)!k!} = \frac{n\times(n-1)\times(n-2)\times...\times(n-k+1)}{k!}$$
\(\binom{n}{k}\)는 n개 중 k를 고르는 경우의 수를 뜻하고 이항 계수라고 부른다. (순서 관계 없이)
\(\binom{n}{k} (if\; k>n :0)\)
이 값이 의미하는 것은 n명의 사람이 있을 때 그 중에서 k명의 사람을 뽑는 경우의 수이다. 순서는 고려하지 않는다
따라서 k 크기를 가지는 부분집합의 개수라고 할 수 있다.
k가 n보다 큰 경우 0으로 정의되어야 하는데, 10명 중에서 11명을 선택하는 것은 불가능하기 때문이다
이항 계수 수식에 대한 설명
n명의 사람중에서 k명을 선택하는 상황에서 첫 번째 사람을 선택한다면 n가지의 선택지가 있습니다. 누구든지 선택할 수 있기 때문이죠 그리고 그 다음 사람은 이미 선택된 사람을 제외한 누군가가 됩니다. \(n \times (n-1)\) 그리고 그 다음은 \(n \times (n-1) \times (n-2)\)가 되겠죠.
이런 식으로 \((n-k+1)\)까지 계속할 수 있는데요. \(n \times (n-1) \times (n-2) \times ... \times (n-k+1)\) 여기까지는 특정한 순서로 사람을 선택할 때의 경우의 수가 될 것입니다. 하지만 여기 선택된 k명의 사람들은 어떠한 순서로든지 선택될 수 있죠. 그래서 이것을 k!으로 나누는 겁니다. 왜냐하면 이만큼 중복해서 셌기 때문이죠.
포커에서 풀하우스가 나올 확률 찾기
카드 뭉치는 52장의 카드로 이루어 지고 이 중에서 5장의 카드를 받는다.
풀 하우스는 세 장이 같은 숫자로 이루어지고 나머지 두 장도 같은 숫자인 경우이다. (7 세장, 10 두장)
카드가 잘 섞여있기 때문에 다섯 장의 카드를 뽑는 모든 경우는 동일한 확률을 가진다고 가정한다.
우선 52개중에서 5개를 뽑는 경우의 수는 얼마일까요?
$$\binom{52}{5}$$
가장 먼저 세 장을 고르는 것을 어떻게 해야 할까요?
첫번째로 7를 고른다고 생각해보면 13가지 중에서 한 가지를 선택한다고 할 수 있겠죠 그리고 곱의 법칙을 이용해 이것을 계산하겠습니다.
$$\frac{13}{\binom{52}{5}}$$
총 세 장의 7을 골라야 하는데 카드 뭉치 한 개에는 총 4장의 7이 있죠, 따라서 4개중에서 3개를 뽑을 확률을 곱해줘야 합니다
$$\frac{13 \times \binom{4}{3}}{\binom{52}{5}}$$
이제 10을 선택해야 합니다. 총 12 가지의 선택지가 있습니다. 7을 제외하고 어떤 수든지 가능하기 때문이죠.
$$\frac{13 \times \binom{4}{3} \times 12}{\binom{52}{5}}$$
두 장을 뽑아야 하기 때문에 4장 중 2장을 뽑는 경우의 수가 됩니다. 그럼 이제 끝입니다.
$$\frac{13 \times \binom{4}{3} \times 12 \times \binom{4}{2}}{\binom{52}{5}}$$
표본 추출 정리 표 (Sampling Table) : n개 중에서 k개 뽑기
순서 상관 있음 | 순서 상관 없음 | |
중복 | \(n^k\) | \(\binom{n+k-1}{k}\) |
중복x | \(n \times (n-1) \times (n-2) \times ... \times (n-k+1)\) | \(\binom{n}{k}\) |
'Mathematics > Harvard Statistics 110' 카테고리의 다른 글
- Total
- Today
- Yesterday
- nlg
- netron
- 핵심어 검출
- RNN
- librosa
- 인공지능 스피커 호출
- 알고리즘
- S3
- MIT
- 알고리즘 강의
- aws cli
- nlp 트렌드
- 오디오 전처리
- stft
- keras
- tensorflow
- 모델 시각화
- lambda
- wavenet
- MFCC
- boto3
- AWS
- 시계열
- Introduction to Algorithm
- LSTM
- nlp
- BOJ
- Tensorflow2.0
- TF2.0
- 6.006
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |