1 베에지안 사고와 일상적 추론
베이지안 추론은 우리가 어떤 데이터를 관찰한 후 세상에 대한 믿음을 업데이트하는 데 사용하는 공식적인 프로세스입니다.
1.1 이상한 경험에 대한 추론
윌 커트는 UFO 사례를 통해 새로운 데이터가 들어올 때 신념과 그 업데이트에 대한 베이지안적 사고가 매우 자연스럽고 상식적인 절차라는 것을 보여줍니다. 이것은 제가 전에 생각해 보지 못했던 흥미로운 접근 방식인데, 많은 베이지안 도입이 매우 복잡할 뿐만 아니라 우리가 일상 세계에서 사용하지 않는 공식을 개발하기 때문입니다.
베이지안 추론 과정:
- Observe data
- Build a hypothesis
- Update your beliefs based on new data
1.1.1 Observing Data
| P(창밖의 밝은 빛, 하늘에 접시 모양의 물체)=very low |
이 방정식을 이렇게 읽을 수 있습니다. "창밖에서 밝은 빛을 관찰할 확률과 하늘에 접시 모양의 물체를 관찰할 확률은 매우 낮습니다." 확률 이론에서 우리는 여러 사건의 결합된 확률을 살펴볼 때 사건을 구분하기 위해 쉼표를 사용합니다.
1.1.2 사전 신념을 갖고 확률을 조절
| P(창밖의 밝은 빛, 하늘에 접시 모양의 물체|지상에서의 경험 )=very low | (1.1) |
우리는 이 방정식을 "지구에서의 경험을 감안할 때, 하늘에서 밝은 빛과 접시 모양의 물체를 관찰할 확률은 매우 낮다"로 읽을 것입니다. 확률 결과는 조건부 확률이라고 하는데, 한 가지 사건이 발생할 확률을 다른 무언가의 존재에 조건화하고 있기 때문입니다.
사건과 조건에 대한 더 짧은 변수 이름:
- D: all of our data
- X: prior belief
- 지구가 회전한다고 믿는다면, 태양이 특정 시간에 뜨고 질 것이라고 예측할 것입니다.
- 좋아하는 야구팀이 최고라고 믿는다면, 그 팀이 다른 팀보다 더 많이 이길 것이라고 예측할 것입니다.
- 과학자는 특정 치료법이 암의 성장을 늦출 것이라고 가설을 세울 수 있습니다.
- 금융 분야의 양적 분석가는 시장이 어떻게 움직일지에 대한 모델을 가질 수 있습니다.
- 예를 들어, 무언가가 "놀랍다"고 말하는 것은 우리의 이전 경험에 근거한 낮은 확률의 데이터가 있다고 말하는 것과 같을 수 있습니다.
- 무언가가 "이치에 맞는다"고 말하는 것은 우리의 이전 경험에 근거한 높은 확률의 데이터가 있다는 것을 나타낼 수 있습니다.
- 최초 가설로 출발 : H1 = 뒷마당에 UFO가 있다.
- 고립된 상태에서, 귀하의 경험을 감안할 때 이 가설은 극히 가능성이 낮습니다. P(H1|X)=very, very low
- 새로운 데이터로 귀하의 신념을 업데이트할 것입니다. H2=영화가 제작되고 있다.
- 고립된 상태에서, 이 가설의 확률은 직관적으로 매우 낮습니다. P(H1|X)=very low
- 귀하는 귀하의 사전 신념을 "매우, 매우 낮음"에서 "매우 낮음"으로 업데이트했습니다
- The probability of rain is low: P(rain) = low
- The probability of rain given that it is cloudy is high: P(rain| coludy) = high
- The probability of you having an umbrella given it is raining is much greater than the probability of you having an umbrella in general: P(unbrella | rain) > > P(umbrella)
D=창밖의 밝은 빛, 하늘에 접시 모양의 물체, X=지상에서의 경험이라 하면 식 1.1은 P(D|X)=very low로 나타낼 수 있다.
1.1.3 다중 신념에 대한 조건화
| P(창밖의 밝은 빛, 하늘에 접시 모양의 물체| 7월4일 지상에서의 경험)=low | (1.2) |
이 두 가지 경험을 모두 고려했을 때, 우리의 조건부 확률은 "매우 낮음"에서 "낮음"으로 바뀌었습니다.
1.1.4실천에서 사전 신념 가정하기
본 것을 설명하려면 어떤 종류의 가설을 형성해야 합니다. 즉, 세상이 어떻게 돌아가는지에 대한 예측을 하는 모델입니다. 세상에 대한 우리의 모든 기본 신념은 가설입니다.
H1= 뒷마당에 UFO가 있다.
하지만 이 가설은 무엇을 예측하는 것일까요? 우리는 "뒷마당에 UFO가 있다면 무엇을 볼 것으로 예상하시나요?"라고 물을 수 있습니다. 그리고 당신은 "밝은 불빛과 접시 모양의 물체"라고 대답할 수 있습니다. 형식적으로 우리는 이것을 다음과 같이 씁니다.
P(D|H1, x) > > P(D|X)
이 방정식은 이렇게 말합니다: "내가 이것이 UFO라고 믿고 이전 경험을 고려했을 때, 하늘에서 밝은 빛과 접시 모양의 물체를 볼 확률은 설명 없이 하늘에서 밝은 빛과 접시 모양의 물체를 보는 확률보다 훨씬 높습니다[두 배 더 큰 기호 >>로 표시]."
1.1.5 일상대화에서 가설 발견하기
1.2 더 많은 증거를 수집하고 믿음을 업데이트하기
더 많은 데이터를 수집하려면 더 많은 관찰이 필요합니다. 우리의 시나리오에서, 당신은 창밖을 내다봅니다. 새로운 증거가 있으면, 누군가가 근처에서 영화를 촬영하고 있는 것처럼 보인다는 것을 깨닫습니다.
베이지안 분석 과정
1.3 가설 비교
새로운 데이터로 대체 가설을 세웠습니다. 이 과정을 베이지안 추론으로 나누어 보겠습니다. 첫 번째 가설은 데이터를 설명하고 혼란을 종식시키는 방법을 제공했지만, 추가 관찰 결과로 더 이상 데이터를 잘 설명하지 못합니다.
You started with P(D|H1, X)=very, very low
and updated our belief with P(Dupdated|H2, X) > > P(D|H_1, x)
우리는 한 믿음이 다른 믿음보다 더 정확하다고 말합니다. 왜냐하면 그것이 우리가 관찰하는 세상에 대한 더 나은 설명을 제공하기 때문입니다. 수학적으로, 우리는 이 아이디어를 두 확률의 비율로 표현합니다.
$$\frac{P(D_{\text{updated}|H_2, X)}{P(D|H_1, X)}$$
이 비율이 1,000과 같이 큰 숫자인 경우 "H2는 H1보다 데이터를 1,000배 더 잘 설명한다"는 의미입니다.
1.4 데이터는 믿음을 알려줍니다. 믿음은 데이터를 알려주면 안 됩니다.
강조할 만한 마지막 요점은 이 모든 예에서 유일한 절대적인 것은 여러분의 데이터라는 것입니다. 여러분의 가설은 바뀌고, 세상에서의 여러분의 경험, X 는 다른 사람과 다를 수 있지만, 데이터, D는 모두가 공유합니다.
Case 1 (이 장 전체에서 사용):
| P(D|H, X) | (1.3) |
“내 믿음은 내가 관찰한 것을 얼마나 잘 설명하는가?”
Case 2 (일상의 생각에서 자주 사용됨)
| P(H|D, X) | (1.4) |
첫 번째 경우, 우리는 수집한 데이터와 세상을 더 잘 설명하는 관찰에 따라 믿음을 바꿉니다. 두 번째 경우, 우리는 기존 믿음을 뒷받침하는 데이터를 수집합니다. 베이지안 사고는 마음을 바꾸고 세상을 이해하는 방식을 업데이트하는 것입니다. 우리가 관찰하는 데이터는 전부 현실이므로, 우리의 믿음은 궁극적으로 데이터와 일치할 때까지 바뀌어야 합니다.
1.5 마무리하기
믿음을 됫바침하는 데이터를 확인(P(D|H))하는 것보다 믿음을 변경할 데이터 (P(H|D))에 훨씬 더 관심을 가져야 합니다.
1.6 Exercises
다음 질문에 답하여 베이지안 추론을 얼마나 잘 이해하는지 확인해 보세요. 답은 No Starch Press(PDF)에서 찾을 수 있습니다.
연습문제 1.1 이 장에서 배운 수학적 표기법을 사용하여 다음 문장을 방정식으로 다시 쓰세요.
연습 1.2 이 장에서 다룬 기술을 사용하여 다음 시나리오에서 관찰한 데이터를 수학적 표기법으로 정리합니다. 그런 다음 이 데이터를 설명하는 가설을 세웁니다.
직장에서 집에 돌아와서 현관문이 열려 있고 옆 창문이 깨진 것을 알아차립니다. 안으로 들어가자마자 노트북이 없다는 것을 즉시 알아차립니다.
P(open, window broken, laptop missing| robbed)= P(D|Hrobbed)
연습 1.3 다음 시나리오는 이전 시나리오에 데이터를 추가합니다. 이 새로운 정보가 어떻게 당신의 믿음을 바꾸는지 보여주고 이 장에서 배운 표기법을 사용하여 데이터를 설명하는 두 번째 가설을 생각해 보세요.
동네 아이가 달려와 실수로 창문에 돌을 던진 것에 대해 사과합니다. 그들은 노트북을 보고 도난당하고 싶지 않아서 현관문을 열어서 가져왔고, 노트북은 그들의 집에서 안전하게 보관되었다고 주장합니다.
P(open, window broken, laptop missing| accidentally broke window, laptop keeping)= P(D|Haccident)
댓글
댓글 쓰기