[최소한의 주식 공부 30] AI가 주식 투자를 잘할 수 있을까?
주식 투자자가 알아야 할 가장 기본적이고 중요한 지식을 담아 ‘최소한의 주식 공부’를 연재합니다. 주식이라는 자산의 근본적인 실체에서 시작해, 의사결정의 주요 원칙과 피해야 할 함정에 대해 홍진채 라쿤자산운용 대표가 독자 여러분과 함께 고민합니다. ― 버핏클럽
인공지능이 대세가 되면서 반드시 마주하는 질문이 있습니다. “인공지능이 주식 투자를 잘할 수 있을까?”
체스도, 바둑도 인공지능에 점령당한 지 오래되었고 미술, 음악, 영상, 회계, 코딩까지 인공지능이 무시무시하게 침범해오고 있습니다. 더 이상 창의성이니 감수성이니 하는 걸로 인간의 고유성을 주장하기가 어렵게 되었습니다.
저는 주식 투자를 업으로 삼다 보니 “인공지능이 주식 투자도 인간보다 잘하면 어떻게 되나요? 그럴 수 있을까요?”라는 질문을 자주 받습니다.
가능은 하다. 쉽지는 않다.
누구든 이 질문에 온전히 답을 내릴 수는 없겠지만, 저는 가능하다고 생각합니다. 논리적 추론을 따지기 전에 답변의 안전성을 먼저 살펴보자면, 불가능하다고 믿었는데 가능하게 되었을 때의 위험이, 가능하다고 믿었는데 불가능할 때보다 훨씬 큽니다. 그러니 일단 가능하다고 믿는 게 상대적으로 안전한 선택입니다.
체스든 바둑이든 운전이든 예술 창작이든 모두 한때 인간의 전유물로 여겨졌습니다. 그런 영역들이 침범당하고 있으니, 어디에도 안전한 영역은 없다고 보아야 합니다. (개인적으로는, 인간이 팔 수 있는 최후의 속성은 ‘서사’와 ‘책임’이라고 생각합니다. 이세돌은 알파고에 졌지만, 다큐멘터리 ‘알파고’의 주인공은 알파고가 아니라 이세돌이었습니다. 이는 상당히 많은 걸 시사합니다.)
구체적으로 살펴봅시다. 인공지능이 좋은 성과를 낼 수 있는(잘 학습할 수 있는) 영역의 특징은 이러합니다.
게임의 결과(승패)가 명시적으로 정해져 있다(명확한 목표). 중간 과정에서 승리에 다가가고 있는지가 명시적으로 드러난다(과정에서의 보상). 학습할 수 있는 데이터가 많다. 데이터가 레이블링이 잘되어 있다. 게임의 규칙이 변하지 않고, 플레이어의 상태 정보가 공개되어 있다. 복잡한 문제를 하위 문제로 분해할 수 있다. 피드백이 빠르고 반복 가능하다. 인간의 상식, 암묵지에 대한 의존도가 낮다. 시뮬레이션이 가능하다.
위 사항을 만족하는 정도가 높을수록 인공지능이 빠르게 침투했습니다.
1997년 딥블루는 체스 세계 챔피언 가리 카스파로프를 격파했습니다.
2011년 왓슨은 퀴즈쇼 제퍼디에서 우승했습니다.
2012년 제프리 힌턴 교수팀의 알렉스넷이 이미지 인식 대회인 이미지넷에서 우승했습니다.
2016년 알파고가 이세돌 9단에게 승리했습니다.
2022년 미드저니로 만든 작품이 미술대회에서 1위를 수상했습니다.
체스는 바둑보다 변수가 적습니다. 퀴즈쇼는 말 그대로 퀴즈이기 때문에, 단답형의 정답을 잘 찾으면 되는 게임입니다. 이미지 생성, 대화(챗봇), 운전 등은 하나의 정답지가 존재하지 않고, 어떤 행동(중간 선택)을 좋은 행동으로 볼 것인지가 애매한 경우가 많습니다. 그래도 이 영역들은 인공지능이 아주 빠른 속도로 발전해가고 있습니다.
투자는 어떤가요? ‘우리가 떠올리는’ 투자 분야는 위 모든 조건에 어긋납니다. 오늘내일 주가가 올랐다고 해서 장기적인 성과가 좋을 거라고 믿을 수 없습니다(보상 및 중간 보상의 모호함). 취득할 수 있는 정보는 많지만, 현시대의 강화학습이 원하는 학습 자료, 즉 ‘뛰어난 투자자의 매매 패턴’ 자료가 극히 드뭅니다. 뛰어난 투자자 자체가 드물고, 그 투자자들이 매매 내역을 거의 공개하지 않습니다. 단지 매매 내역만 필요한 게 아니라, 해당 매매에 이르기까지 어떤 정보를 취득했는지도 알아야 하는데, 이는 현재의 기술로는 불가능합니다.
그런데 위 조건들은 사실 인공지능 발전사에서의 여러 갈래가 섞여 있습니다. 위에서 언급한 인공지능의 도약 이벤트를 하나씩 살펴보면, 다양한 기술 갈래에서 업적을 이루었습니다. 딥블루는 brute-force 알고리즘, 즉 무식하게 하나씩 변수들을 다 계산했습니다. 지능이라기보다는 연산력의 승리였다고 볼 수 있죠. 왓슨은 DeepQA라는 기법을 썼는데, 이 또한 엄청난 기술적 도약이라기보다는 효과적인 추론 알고리즘이라고 볼 수 있습니다.
진짜 기술적 도약은 알렉스넷의 이미지넷 우승인데요. CNN(합성곱 신경망) 아키텍처와 심층 신경망 지도학습의 승리입니다. 이 뒤에는 GPU를 인공신경망 학습에 사용한다는 하드웨어 측면의 도약이 있었습니다. 알파고는 CNN에 강화학습과 MCTS(몬테카를로 트리 탐색)를 합친 거라, 큰 그림에서는 알렉스넷의 흐름을 이어받았다고 볼 수 있습니다.
두 번째 기술적 도약은 2017년 구글이 발표한 트랜스포머 논문(Attention is All You Need)입니다. 이후의 챗GPT, 미드저니, 테슬라 EtoE 자율주행 등 우리가 현시대에 인공지능이라고 부르는 대다수 모델은 트랜스포머 기반입니다.
트랜스포머는 아주 단순하게 비유하자면, 언어(혹은 픽셀이나 소리, 잘게 쪼갤 수 있는 것이라면 무엇이든)를 잘게 쪼갠 후 지도로 펼쳐서, 주어진 쿼리(질문)에 맞게 지도상에서 길을 찾아가는 방식이라고 볼 수 있습니다. 인간이 쓰는 언어, 그림, 음악 등을 학습하여, 인간이라면 이런 질문에 이렇게 대답했을 거라고 생각되는 가장 그럴싸한 답을 찾아가는 거죠.
다시 투자로 돌아가 봅시다. 트랜스포머 기반 인공지능에 주식 투자를 맡기면 어떻게 될까요? 분명 정보 취득과 통합에서는 인간이 도저히 따라잡을 수 없는 속도를 보여주겠지만, 막상 의사결정에서는 다수의 인간과 다를 바 없는 선택을 할 것입니다. 다수의 인간이 할 법한 행동을 하여 자연스럽게 보이는 게 트랜스포머의 근간이니까요. (물론 각 도메인에 따라 커스터마이징은 들어갑니다만) 또한 그 인공지능이 취득하는 정보가 원 소스뿐 아니라 1차, 2차 가공된 정보들이라면, 그 과정에서 가공자들의 편향, 오해 등이 포함됩니다. 질 나쁜 학습 자료라는 거죠.
그런 점에서 최근 나온 논문(http://arxiv.org/abs/2512.10971)의 결과는 놀랍지 않습니다. 챗GPT, 클로드, 라마 등 현재 가장 똑똑하다고 평가받는 6종의 LLM에 실시간 금융시장의 정보를 수집, 분석, 투자 의사결정을 하게 해뒀더니, 인간처럼 찔끔찔끔 벌고 깨질 때 크게 깨지며 우왕좌왕하는 모습을 보여주었다고 합니다.
그렇다고 해서 투자자들이 이를 안심하거나 조롱해서는 안 됩니다. 말씀드렸듯, 현재 주류 인공지능 모델은 트랜스포머 아키텍처 기반 LLM입니다. 인공지능의 발전사에서 이와 상이한 여러 기술적 갈래가 있었고, 이들은 각각의 길을 걷거나 융합되거나 합니다. 차세대 주식 투자용 인공지능이 현재의 1차, 2차 가공 정보들을 ‘그럴싸한 진실을 보여주는 자료’로 받아들이는 게 아니라 ‘인간의 편향을 알려주는 시그널’로 활용하게 된다면 전혀 다른 양상이 벌어질 수 있습니다. 혹은 시장에 미세하게 존재하는 알파 창출 요인들, 소수만 알고 있는 정보라든가, 각종 소셜미디어 자료를 종합하여 매크로 데이터를 먼저 정확하게 예측해낸다든가 한다면 인공지능이 알파를 창출할 가능성은 충분히 있습니다.
EtoE 자율주행 또한 많은 시행착오를 겪었습니다. 인간이 하는 대로 그대로 따라 하라고 학습을 시켜놨더니 정지선 위반이나 각종 ‘꼼수’ 운전을 그대로 배워버렸었죠. 그래서 ‘좋은 운전’을 별도로 가이드하면서 학습을 시켰습니다. 투자에 쓰인 인공지능은 이보다 더 초보적인 단계로서, 애초에 투자 전용 모델로 개발된 게 아니기 때문에 벌써 투자에서 좋은 성과를 낸다면 그게 오히려 이상한 일입니다. (물론 각종 분야에서 그런 일이 벌어지고는 있습니다만) 인공지능은 앞으로 더욱더 많이 발전할 테고, 투자라는 영역도 인간 고유의 영역이 아니게 될 것입니다. (블랙웰 칩으로 학습한 LLM은 투자도 잘한다는 소문이 있습니다.)
경쟁은 이미 시작되었다
앞서 투자 분야에 대해서 언급하면서 ‘우리가 떠올리는’이라는 단서를 달았던 것이 기억나시나요?
우리가 떠올리는 일반적인 투자란 뉴스를 습득하고, 재무제표를 보고, 블로그나 애널리스트 보고서를 읽고 포트폴리오를 구성하여(적어도 하루 이상은 지켜보면서) 주식을 사고파는 일을 의미합니다.