본문 바로가기
2. 인간 인생 탐구

AI 수학 알고리즘을 알아야 하는 이유

by 키다리 가로등 2025. 4. 24.
반응형

 
 

기계는 왜 학습하는가
_2024 아닐 아난타스와미
 
수학에 관심 있는 분이라면 이 책 추천!
왜 수학을 배워야 하는지 궁금한 학생에게도 추천!
 
"신경망 개발에 대한 책 중에는 기본이 되는 수학을 설명하는 것도 있고 사회사를 설명하는 것도 있다. 이 책은 수학을 사회사의 맥락에서 제시한다. 걸작이다. 저자는 수학을 초보자도 이해할 수 있도록 설명하는 솜씨가 빼어날 뿐 아니라 사회사를 생동감 있게 표현하는 능력도 뛰어나다." _ 제프리 힌턴
 
이 책의 목표는 기계학습(MR, machine learning)과 심층학습(deep learning)의 밑바탕에 깔려있는 단순한? 수학적 개념을 독자에게 전달하는 것이다. 

AI를 어떻게 만들고 보급할지에 대한 결정은 개발자들에게만 맡겨둘 수는 없다. 극도로 유용하지만 사회불안과 잠재적 위협을 초래할 수 있는 AI기술을 효과적으로 다스리려면 교육자, 정치인, 정책입안자, 과학소통가, 심지어 AI에 관심 있는 소비자 등 또 다른 부류의 사람들이 기계학습수학의 기초를 파악해야한다.

선형 대수, 미적분, 확률통계, 최적화이론이라는 4가지 핵심적 수학분야의 방정식을 알고, 학습하는 기계의 필연성을 이해할 때에야 비로소 우리는 AI로 가득한 미래를 맞이할 준비가 될 것이다. 
 
1. 퍼셉트론 학습 알고리즘(by로젠 블랫)
데카르트 좌표공간을 둘로 나누는(두 집단으로 선형분리하는) 초평면을 찾으려 한다. 적절한 가중치 집합을 찾는다. 즉, 퍼셉트론이 하는 일은 *벡터 W를(크기+방향) 찾는 일, 즉 수직 초평면을 찾는 일이다. 선형적으로 분리 가능한 (비만 or 정상) 데이터에 대해서만 효과적으로 작동하는 한계가 있기에, 다층 퍼셉트론과 같은 더 복잡한 구조가 요구된다. (다층 퍼셉트론을 훈련하는 법→미적분과 최적화이론 활용)
*스칼라는 크기만 있는 값, 벡터는 크기와 방향이 모두 있는 값, 수학적으로는 표현하면 스칼라는 점, 벡터는 화살표.
 
2. 최소제곱평균 알고리즘 (LMS, least mean square) (by 위드로)
신호에서 잡음을 제거하는 법을 학습할 수 있는 적응필터에 쓰인다. (미적분 활용) 
LMS알고리즘역전파의 토대이고, 역전파는 AI의 토대이다. 
*미분: 미분은 연속함수의 기울기를 계산하는 방법이다.
 
3. 확률 통계
*몬티 홀 딜레마 이야기는 확률에 대해 생각하는 두 가지 방법의 영원한 갈등을 보여준다. 그것은 빈도 확률베이스확률이다. 
[몬티 홀 딜레마 : 문 세 개 중에 한 개의 문 뒤에는 차가 있고 나머지 두 개의 문 뒤에는 염소가 있다. 당신이 1번을 골랐다. 문 뒤에 무엇이 있는지 아는 진행자는 다른 문(3번이라고 하죠)을 열어 염소를 보여준다. 그러고는 당신에게 선택을 바꿀지 묻는다]
베이스정리로 따져보면, 1번 문에 있을 확률은 1/3, 2번 문에 있을 확률은 2/3이다. 선택을 바꿔야 한다. 
대부분의 기계 학습은 알고리즘이 명시적으로 그렇게 설계되지 않았더라도 본질적으로 확률론적이다. 
 

책에 수식과 그림과 표로 자세하게 설명을 해줍니다.
책 내용을 여기에 적는 건 여기까지 할게요.
직접 읽어보는 게 더 유익하답니다.
이 작은 곳에 다 담을 수가 없네요. 

반응형

마무리

 
AI는 이제 일상생활에 두루 쓰이고 있어요. 맞춤 콘텐츠 추천(쇼핑몰, 유튜브 등), 고객상담 챗봇, 스마트 의료시스템, 자율주행 등에 많이 사용되고 있습니다. 그리고 모두 수학적으로 프로그래밍 되어 있어요.
 
기계가 학습하는 것이 우리가 그렇게 설계했기 때문일까 아니면 스스로 지능이 생긴 걸까? 그것을 대중들에게 알려주려고 이 책을 만들었나 봅니다. AI의 기본 원리를 알아야 우리가 AI에 대해서 좀 더 현실적으로 받아들일 수 있을 것 같습니다. 알고리즘을 작동시키는 수학원리가 무엇인지 알면 무턱대고 불안해하는 일은 없을 테니까요.
 
어떤 수식으로 AI채용시스템이 작동하는지, 어떤 통계모델로 AI범죄 예측시스템이 작동하는지 우리가 모른다면, AI를 신처럼 생각하게 되고, 결과에 순응하며, 문제 해결방안조차 알 수 없겠지요. 데이터에 숨은 규칙을 알아야 비판적으로 해석할 수 있을 거라 생각합니다. 

AI는 숫자, 벡터, 함수, 확률, 최적화 등으로 분석하고 판단하는데, 문제는 AI가 완벽하지도 않을뿐더러 방향성을 갖고 있다는 것입니다. 학습하는 데이터가 결함이 있는 데이터이고 (과거 역사적으로 편견과 차별이 존재했기에 많은 자료들에 그런 문제가 내재되어 있음), 그런데이터를 이용하여 예측하기에, 잘못된 예측과 편향을 극대화시킬 수 있어요.
 
거대 언어 모델 (LLM)은 추론일까?
정교한 패턴 매칭일까?
책에서 설명한 수학적 작동방식을 안다면 당연히 패턴 매칭이라 말하겠지만, 기계가 학습을 하면 할수록 창발적 행동(예측할 수 없는 행동이 갑자기 튀어나옴)이 나타나기에 전문가들도 이젠 의견이 분분한 것 같습니다.
 
그 창발적 행동이 왜 일어나는지 알아가는 게 중요한 것 같아요. 
 
인간 역시 개개인은 감정을 가진 존재이고 예측불가능하지만, 집단적으로 보면 예측가능한 패턴을 보이기도 합니다. 
"대형 사건 사고가 터지는 이유는 중요하지 않다. 전조현상은 없다. 임계상태에 다다르게 되었다는 것이 중요하다."라고 마크 뷰캐넌이 책에서 말했었지요. 사회가 물리적 패턴이 존재한다는 관찰은 어느 정도 타당해 보이지만, 복잡계 세상에 미래를 예측할 순 없다는 한계가 있지요.

임계점에 다다르면 예측 못한 사태가 벌어지는데, 기계가 대규모 학습을 하면 창발적 행동을 나타내는 것도 이것과 비슷한지...
 
인간이 독서 경험이 많아질수록 사고력이 생기듯, AI도 그런 것일까...? 선형적이 아니라 비선형 활성화 함수를 통해 비약적인 변화로 이어지는 것일까...?

아래는 요즘 인기많은 EBS과학프로그램 ‘취미는 과학’입니다. 재미있으니 한 번 보세요.
https://youtu.be/0KDosjF0iYM?si=5wFKStR23Dk94gft


 
 
자연재해, 사건사고는 왜 일어나는가?

 

자연재해, 사건사고는 왜 일어나는가?

뉴스에서 사건 사고가 날 때마다 어찌할 수 없는 현실에 마음이 아프면서,마크뷰캐넌의 책이 떠오릅니다.  "모든 일에는 패턴이 있고, 임계숫자가 있다. "과거 마크뷰캐넌의 책들에서 나온 말

naturalmedicine.tistory.com

 
 
군중심리는 왜 생길까??_ 사회적 원자

 

군중심리는 왜 생길까??_ 사회적 원자

사회적 원자_2007 마크 뷰캐넌 (국내 2010 초판) → 토머스 셸링의 분리게임체스판에 흰 동전, 검은 동전을 골고루 섞어 놓고, 30% 미만의 소수가 되면 이사를 간다는 동전을 옮기는 규칙을 가정해

naturalmedicine.tistory.com

 

반응형