처음으로 수학을 주제로 KAIST 수리과학과 남경식 교수님을 모셔봤습니다 :)
그동안 수학을 좋아했던 친구들은 물론이고 이번 기회를 통해 새롭게 수학의 재미를 느껴보세요 :)
남경식 교수님의 강의와 인터뷰영상을 확인하고 많은 질문 공유 해주세요 :)
남경식 교수님 강의영상
남경식 교수님 인터뷰영상 남경식 교수님 리뷰영상
확률을 계산하는 방법이 많은데요. 변수도 있고, 정규분포값 분석도 있고, ...
확률이 높다고 해서 무조건 좋은 선택이 아닐 경우도 있는데요.
진로에 대한 고민도 엄청 많은데요.
어떤 확률 방법으로 진로나 중요한 선택을 하면 좋을까요?
그런데 2007년 미국 스탠퍼드대 수학자 퍼시 디아코니스(Persi Diaconis)가 동전 던지기의 확률은 절반이 아니라는 논문을 발표했다. 동전 던지기의 결과는 우리가 생각하듯 무작위적인 것이 아니라 물리학 법칙에 따라 정해진다는 것이다. 그는 자신이 계산해본 결과, 처음 동전을 올려놓은 면이 나올 확률이 절반을 살짝 웃돈다고 말했다.
그에 따르면 위로 던져진 동전은 축이 흔들리는 세차운동을 하게 되면서 처음 위를 향한 면이 더 오랫 동안 공중에 머물게 되고, 그에 따라 처음 상태대로 떨어질 가능성이 좀 더 크다는 것이다. 그는 실제 몇가지 실험을 통해 이를 관찰한 뒤 던질 때와 떨어질 때 같은 면이 나올 확률을 51%로 예측했다.
만약 동전을 앞뒷면 구분 없이 세워놓은채로 던지면 확률이 어떻게 될까? 거의 정확하게 50%가 나오지 않을까?
감염자 역설(Simpson's Paradox)은 통계적인 현상으로, 부분 그룹 간의 상관관계가 전체 그룹에서의 상관관계와 반대 방향일 때 발생합니다. 즉, 각 부분 그룹에서의 데이터를 분석할 때는 하나의 결론이 도출되지만, 전체 데이터를 고려할 때는 그와 반대의 결론이 도출되는 상황입니다.
예를 들어, 의료 연구에서 A 집단과 B 집단의 치료 효과를 비교하려고 할 때, 각 집단 내에서는 A 집단이 더 나은 결과를 보이는 것으로 나타날 수 있습니다. 그러나 전체 데이터를 통합하여 분석하면 B 집단이 더 나은 결과를 보이는 경우가 발생하는 것이 감염자 역설의 예시 중 하나입니다.
나는 지금 거짓말을 하고 있다.
5지선다 문제에서 답을 찍어서 맞출 확률은 일반적으로 20%로 가정됩니다. 이는 답을 선택할 때 각 선택지가 동일한 확률로 선택되기 때문입니다. 예를 들어, 만약 답을 모르고 무작위로 선택한다면 5개의 보기 중 하나를 선택할 확률은 1/5이므로 20%입니다.
그러나 어떤 주장에서는 찍기로 맞출 확률이 50%라고 주장하는데, 이는 답이 맞을지 틀릴지 두 가지 경우 중 하나가 발생할 것이라는 논리입니다. 이 주장은 각 선택지가 동일한 확률로 선택되지 않을 가능성이 있고, 찍기로 인해 맞을지 틀릴지에 대한 이진적인 확률로 해석될 수 있습니다. 그렇다면 20%와 50% 중 무엇이 맞는 것일까?
위 상황은 생일 문제라고도 불리며 이 문제는 '생일 축하 파티에서 적어도 두 사람의 생일이 같을 확률은 얼마인가?'라는 것을 묻는 것으로, 직관과는 다르게 비교적 적은 사람 수에서도 생일이 같은 경우가 발생할 확률이 높다는 것을 보여줍니다.
이 문제는 '생일은 1년 365일 중 하나이며, 생일이 서로 일치하지 않는 확률'의 보완으로 접근됩니다. 처음 사람이 생일을 갖고 있을 때 그와 다른 사람의 생일이 일치할 확률은 1/365입니다. 그리고 이를 모든 다른 사람들에 대해 확장하면 적어도 두 명의 생일이 같을 확률을 계산할 수 있습니다.
생일 문제는 주로 '23명의 사람 중에서 적어도 두 사람의 생일이 같을 확률'로 유명하며, 이는 약 50%에 가까운 값을 갖습니다. 이는 생일이 서로 일치하지 않는 확률과 반대되는 경우를 계산하여 얻어집니다.
23명의 사람 중에서 적어도 두 명의 생일이 같을 확률을 계산하는 방법은 다음과 같습니다.
(생일이 서로 다른 경우의 수)=365/365×364/365×363/365×⋯×343/365
그런데, 생일이 서로 다른 경우의 수를 1에서 빼면 적어도 두 명의 생일이 같을 확률을 구할 수 있습니다.
(적어도 두 명의 생일이 같을 확률)=1−(생일이 서로 다른 경우의 수)
이 값을 계산하면, 약 50.7%가 됩니다. 따라서 23명의 사람 중에서 적어도 두 명의 생일이 같을 확률은 약 50.7%입니다.
또한, 사람 수가 늘어날수록 생일이 일치할 확률은 기하급수적으로 증가하는데, 이는 생일이 일치하는 확률이 생각보다 높다는 것을 강조합니다.
벼락맞을 확률을 인터넷에 검색해보면 1/28만 이라는 확률이 나온다.
그러나 그 근거인 공식을 보면 미국 전체 인구수를 벼락 맞은 사람의 수로 나눈 값인데, 이 방식대로 다시 계산하면 1/3000만 이라는 확률이 나온다.
이 방법보다 더 확실하게 계산할 수 있는 방법은 없을까?
확률의 정의, 즉 개념은 어떠한 일이 일어날 가능성을 비율 또는 빈도로 측정한 값이다.
이런 확률이란 개념이 몬티홀 딜레마와 같이 어떠한 변수로 인해 값이 달라진다는 점에서
과연 실생활에서 이런 확률의 개념이 적용이 될지 의구심이 든다.
확률은 우리가 어떤사건이 일어날 수 있는 경우의 수를 알려준다. 이를 활용해 스포츠 같은 경우에는 팀의 포지션, 그리고 순서(예를들어 야구 타자 순서를 정할때 용이 하게 쓰일것이고 대부분 구단들도 이를 계산하는 직원을 뽑거나 분석하는 코치도 따로 있다. 하지만 일부 베태랑 감독이나 코치들은 이 데이터 값을 신뢰하지 않는다고 한다. 왜냐하면 선수마다 각자의 사정이 있을수도있다.(예를들어 아내랑 싸워서 오늘 기분이 안좋음)그리고 날씨, 몸상태등 여러 변수가 존재하며 이를 바이오리듬의 불규칙성 때문이기도 하다. 즉, 완벽한 확률을 계산하기 위해서는 방대한 데이터를 처리할 능력이 필요할것이고 이데이터를 감당할만한 컴퓨터는 매우 비쌀것이고 이 컴퓨터의 계산이 항상 승리를 보장할것도 아니다. 따라서 베태랑 감독의 경험을 토대로한 감의 데이터와 정확한 선수들의 데이터를 통한 확률중 어느것이 더 승률이 높을지가 궁금하다.
몬티홀 문제는 결정을 바꾸면 확률이 올라간다는 것인데 시험문제를 풀때도 결정을 바꾸면 더 많이 맞을까 궁금했다.
몬티홀의 딜레마 처럼 문을 바꾸었을때의 확률이 ⅔, 바꾸지 않았을때가 ⅓ 임을 알려줬을때 향후 이 문제를 갑자기 보여준다면 사람들은 과연 위에 알려준것 처럼 느낄지 아니면 그냥 ½, ½ 로 느낄지 궁금했다. 이렇게 확률의 역설이 우리가 실제로 느끼는데에 있어 영향을 미치는지 궁금했다. 또 위와 같이 이러한 확률을 바로 알아차리지 못하는 것도 궁금하였다.
예를 들어
A: 10000원을 10%에 준다: 기댓값 1000원
B: 2000원을 60%에 준다: 기댓값 1200원
위와 같은 상황에서, 기회가 4번 정도 주어젔다고 했을 때 A를 선택하는 사람이 더 많을 것이다.
이처럼 기댓값이 높지만 적은 선택이 있는 경우에선, 기댓값이 낮아도 리턴이 큰 것을 선택하는 경향이 있지 않을까?
시험 문제를 찍을 때에 단순히 찍는 것이 아니라, 우선 아무 답이나 찍은 다음, 답이 아닐 것 같은 것들은 모두 제거하고 그 후에 먼저 선택한 답을 다른 답으로 바꾸면 정답일 확률이 올라갈지 궁금해 질문하게 되었습니다.
본인이 생각한 질문의 배경(이유)