.png)
아무리 잘 짜인 거래 전략이라도 백테스트에서 실전으로 넘어가면 성과가 10~20% 정도 떨어지기 마련입니다. 여러분도 이미 이런 현상이 있다는 사실을 알고 계실 겁니다. 우연히 본 적이 있거나, 거래 커뮤니티에서 언급되는 것을 들었거나, 어쩌면 어떤 백테스트 가이드에서 읽은 적이 있을지도 모릅니다.
하지만 아무도 제대로 설명해주지 않는 사실이 하나 있습니다. 바로 그 10~20%가 우연이 아니라는 점입니다. 운 때문도 아니며, 결코 여러분의 전략에 문제가 있다는 신호도 아닙니다.
예측 가능한 일이며, 그 원인을 파악한다면 실제 자금을 위험에 빠뜨리기 전에 미리 대비할 수 있습니다.

모든 전략은 두 가지 세계에 존재한다.
첫째, 이 전략은 이론적으로 완벽한 조건이 갖춰진 통제된 환경, 즉 백테스트에서 작동합니다. 그런 다음 실제 시장으로 넘어가는데, 그곳에서는 그 완벽한 조건들이 실제로는 전혀 존재하지 않습니다.
그 차이는 미묘한 것이 아니라 구조적인 것이다.
백테스트에서는 매수·매도 체결이 사용자가 설정한 가격에 정확히 이루어집니다. 하지만 실제 거래에서는 다른 투자자가 제시하는 가격에 체결되는데, 이 가격은 대개 더 불리하며 때로는 훨씬 더 불리할 수도 있습니다.
백테스트에서는 주문 대기열도, 지연 시간도, 그리고 바로 스프레드가 좁아져야 할 때 오히려 벌어지는 현상도 없습니다. 하지만 실전 거래에서는 이 모든 요소가 동시에 존재합니다.
하지만 가장 중요한 차이는 심리적인 측면에 있다.
백테스트에서 10연패는 차트상에서 확인하는 단순한 통계 수치에 불과합니다. 하지만 실전 계좌에서 10연패는 실제 스트레스가 가해지는 상황에서 내린 10번의 결정이며, 실제 자금이 예상과 다른 방향으로 흘러가고, 자신이 실수를 저질렀는지 의심하는 실제적인 불안감을 동반합니다. 우리 몸은 금전적 손실과 신체적 위협을 구분하지 못하며, 이에 대한 스트레스 반응은 똑같습니다. 이는 다음 거래를 실행하는 방식에 있어 모든 것을 바꿔놓습니다.
바로 이 때문에 ‘10~20%의 법칙’이 존재하며, 이 법칙의 각 요소를 제대로 이해하느냐 마느냐에 따라 전환기를 무사히 헤쳐 나가는 전략과 몇 주 만에 무너져 내리는 전략의 운명이 갈리게 됩니다.
어떤 전략의 백테스트 결과든 열어보세요. 평균 수익이 얼마인지 확인해 보세요. 예를 들어 30달러라고 가정해 봅시다.
자, 이제 물어보겠습니다. 그 30달러 중 실제로 여러분의 계좌로 입금되는 금액은 얼마일까요?
대부분의 트레이더에게 있어 솔직한 대답은 ‘훨씬 적다’는 것입니다. 의도적으로 그렇게 설정하지 않는 한, 백테스트는 결코 이런 사실을 알려주지 않을 것입니다.
현실적인 비용 구조는 다음과 같습니다:

슬리피지 구간은 대부분의 백테스트가 현실과 완전히 동떨어지는 지점입니다.
일반적인 시장 거래 시간대에는 슬리피지가 미미하여 1~2틱 정도에 불과합니다. 하지만 뉴스 이벤트, 실적 발표, 유동성 공백이 발생하는 시기에는 슬리피지가 거래 전체의 수익성을 좌우할 수 있습니다. 이러한 요인을 반영하지 않거나 고정된 수치로만 모델링한 백테스트는, 변동성이 급증하고 주문 흐름이 마르며 체결 조건이 악화되는 변동성이 높은 거래 세션과 같이 가장 중요한 순간에 실제 실전 전략보다 훨씬 더 좋은 성과를 보이는 것처럼 보이게 만듭니다.
이것이 첫 번째 현실 점검입니다. 평균 수익 거래에서 현실적인 왕복 비용을 차감해 보세요. 차감 후에도 수치가 맞지 않는다면, 여러분에게는 경쟁 우위가 없는 것입니다.
대부분의 백테스트는 정적 차트를 기반으로 하기 때문에 완벽한 체결을 전제로 합니다. FX Replay를 사용하면 완성된 차트에 진입 포인트를 설정하는 것이 아니라, 시세가 실시간으로 전개되는 대로 매매를 실행하게 됩니다. 이러한 차이 덕분에 일반적인 백테스트에서는 포착할 수 없었던 타이밍 문제, 체결 실패, 그리고 망설임 등의 요소가 드러나게 됩니다.

아마 한 번쯤은 보셨을 겁니다. 승률 80%가 넘고, 수익 곡선은 완만하며, 손실 폭은 미미해 보이는 전략 말입니다. 마음 한구석에서는 ‘이건 너무 완벽해’라고 속삭일 것입니다.
네 말이 맞아. 아마 그럴 거야.
과적합은 전략의 규칙을 과거 데이터에 극도로 잘 맞도록 지나치게 엄격하게 만들거나, 조정하거나, 일부만 선별할 때 발생합니다. 문제는 이러한 규칙들이 실제 시장 패턴이 아닌 잡음에 맞추어지고 있다는 점입니다. 백테스트에서는 과거 데이터만 반영되므로 이 방법이 아주 잘 통하지만, 전략이 새로운 시장 데이터(실제 거래에 들어가면 말 그대로 모든 거래가 이에 해당합니다)를 접하는 순간, 전략은 무너지고 맙니다.
다음은 이를 알아보는 방법입니다:
과적합된 전략은 일반적으로 다음과 같은 특징을 보입니다:
과적합을 방지하는 방법은 간단하지만, 대부분의 트레이더들은 이를 간과합니다. 규칙을 완전히 고정하고 나중에는 절대 건드리지 마십시오. 그런 다음 개발 과정에서 한 번도 살펴보지 않았던 데이터 기간을 대상으로 고정된 규칙을 테스트하십시오.
전략이 무너진다면, 그것은 과거 데이터에 맞춘 것에 불과합니다. 전략이 어느 정도 잘 유지된다면, 실제로 유망한 전략일 가능성이 있습니다. 하지만 그렇다고 해도 백테스트 결과가 완벽하다고 해서 실제 실행도 완벽할 것이라는 보장은 없습니다. FX Replay에서 동일한 규칙을 실행해 보면, 과거 결과에서는 드러나지 않던 문제점들이 종종 드러납니다. 즉, 진입 시기가 늦어지거나 신호가 누락되거나, 실시간으로 결정을 내려야 할 때만 나타나는 타이밍 오류 등이 그것입니다.
2020년부터 2022년까지 백테스트된 전략은 최근 역사상 가장 이례적인 변동성 국면을 겪었습니다. 2016년부터 2018년까지 백테스트된 전략은 비교적 온화하고 변동성이 낮은 추세 장세를 경험했습니다.
두 백테스트 모두 “성공적”입니다. 하지만 둘 다 오해를 불러일으킬 가능성이 있습니다.
모든 전략에는 선호하는 시장 환경이 있습니다. 추세 추종 전략은 방향성이 뚜렷한 강세장에서는 큰 수익을 내지만, 등락폭이 작은 횡보장에서는 손실을 입습니다. 평균 회귀 전략은 안정적인 횡보장에서는 좋은 성과를 내지만, 모멘텀이 강한 상승장에서는 큰 타격을 입습니다. 백테스트 결과가 훌륭하게 나오든 형편없이 나오든, 이는 거의 전적으로 테스트 기간 동안 어떤 시장 환경이 지배적이었는지에 달려 있으며, 실제 거래 시 어떤 시장 환경이 나타날지는 전혀 통제할 수 없습니다.
즉, 이번 백테스트는 “이” 특정 시장 환경에서 이 전략이 효과가 있었는지에 대한 질문 하나에만 답했을 뿐입니다. “실제 거래에서 마주하게 될 모든” 시장 환경에서 이 전략이 효과가 있을지에 대한 질문에는 결코 답하지 못했습니다.
해결책은 간단하지만 효과적입니다. 의도적으로 서로 다른 세 가지 시장 국면에서 전략을 테스트해 보십시오.
백테스트 결과 중에서 성과가 가장 저조했던 3개월을 골라보세요. 해당 기간의 시장 상황은 어땠나요? 그와 정반대되는 상황, 즉 추세장, 횡보장, 변동성이 극심한 급등장을 파악하세요. 그리고 정해진 규칙을 각 상황에 대해 따로 적용해 보세요.
이 세 가지 모두에서 합리적으로 통용되는 전략은 단 하나의 체제에서만 통했던 전략보다 훨씬 더 신뢰할 만한 근거를 갖추고 있다.

모든 트레이더가 결국 깨닫게 되는 사실은 이렇습니다. 백테스트에서 규칙을 적용하는 것과 실제 압박 속에서 규칙을 적용하는 것은 완전히 다른 일입니다.
백테스트에서는 규칙을 따릅니다. 규칙은 기계적으로 적용됩니다. 손실이 난 거래는 차트 위의 한 줄에 불과합니다. 드로다운은 나중에 확인하는 숫자에 지나지 않습니다.
실제 자금을 걸고 실전 거래를 하다 보면 신체적 반응이 나타나고 의사결정 능력은 떨어지게 됩니다. 차트를 분석할 때 가졌던 그 절제력은 가격이 예상과 반대 방향으로 움직이는 순간 사라져 버립니다.
다음에 일어날 일은 뻔하다:
이 모든 것은 의도적인 약점이 아닙니다. 이는 백테스트에서는 결코 재현되지 않았던 상황에 대한 생리적 반응일 뿐입니다.
바로 여기에서 10~20%의 성능 저하가 실제로 발생하는 것입니다. 이는 단순히 비용 문제 때문이 아니라, 평상시 규칙을 따르는 것과 스트레스 상황에서 규칙을 따르는 것 사이의 차이에서 비롯됩니다.
거래 심리학 연구에 따르면, 연습 과정에서 압박감을 경험한 트레이더들(단순히 차트를 검토하는 것이 아니라 가격 변동에 따라 적극적으로 결정을 내린 경우)은 정적인 차트만 검토한 트레이더들보다 실전 거래에서 훨씬 더 우수한 성과를 냈습니다. 이러한 유형의 연습은 실제 거래의 스트레스 상황에 부합하는 신경 회로를 형성하는 데 도움이 됩니다.
바로 이것이 리플레이 기반 연습이 효과적인 이유이며, FX Replay가 존재하는 이유이기도 합니다. 단순히 과거의 상황을 되짚어보는 것이 아니라, 상황이 전개되는 바로 그 순간에 어떻게 대응할지 결정하는 것입니다. 시세가 움직이고, 시간적 압박을 받으며, 연패를 단순한 숫자가 아닌 ‘거래가 진행 중인 상태에서 연속으로 세 번의 손실을 겪는’ 실제 경험으로 체감하게 됩니다. 이러한 압박감과 경험, 그리고 스트레스에 대한 내성은 실제로 실전 거래로 이어집니다.
정적 백테스트는 단일 기간을 대상으로 테스트합니다. 워크포워드 테스트는 실제 거래 환경과 더 유사한 조건에서 전략이 변화하는 시장 상황에 맞춰 제대로 작동하는지 검증합니다.
백테스트 결과는 하나의 거래 시나리오를 보여줄 뿐입니다. 실제 거래는 예측할 수 없습니다. 몬테카를로 시뮬레이션은 현실적인 최악의 시나리오 범위를 보여줍니다. 백테스트에서 5,000달러의 손실 폭이 95번째 백분위수에서는 14,800달러로 확대될 수 있습니다. 만약 그런 상황이 심리적으로 투자 자금을 감당하기 힘들게 만든다면, 투자 규모가 너무 작은 것입니다.
대부분의 트레이더는 백테스트 기간 동안 손익(P&L)을 추적합니다. 하지만 실제로 추적해야 할 것은 규칙 준수 여부입니다. 유효한 신호는 모두 포착하고 무효한 신호는 모두 배제했던 백테스트가, 확신도가 가장 높은 거래만 선별해 수익을 낸 백테스트보다 더 많은 정보를 제공합니다.

대부분의 트레이더들은 백테스트 단계에서 실전 거래로 단숨에 넘어가곤 한다.
백테스트 결과가 양호하다 → 확신이 생긴다 → 자금을 배분한다.
빠진 부분은 바로 그 중간 단계인데, 바로 그 단계에서 대부분의 전략이 좌절하고 맙니다.
실제로 작동하는 코드는 다음과 같습니다:
개발 과정에서 한 번도 접하지 못한 데이터로 전략을 테스트해 보세요. 결과가 안정적이라면 2단계로 넘어가세요. 결과가 무너진다면 과적합이 발생한 것입니다. 다시 돌아가서 모델을 재구축하세요.
전략을 단일한 고정 기간이 아닌, 이동하는 시간 창을 통해 재검증하십시오. 이는 실제 거래에서 시장 상황이 시간이 지남에 따라 어떻게 변화하는지를 반영합니다. 여러 기간에 걸쳐 일관된 성과를 보인다면, 그 우위는 더욱 견고하다고 볼 수 있습니다.
FX Replay와 같은 리플레이 도구를 활용해 실제 과거 시장 상황에서 매매 실행을 연습해 보세요. 단순히 차트를 검토하는 데 그치지 말고, 캔들이 형성되는 대로 적극적으로 진입 및 청산 결정을 내려보세요. 수익 손실(P&L)과는 별도로 규칙 준수 여부를 일지 형태로 기록해 두세요. 유효한 신호는 모두 포착했나요? 무효한 신호는 모두 피했나요? 이는 수익을 냈는지 여부보다 훨씬 더 중요합니다.
과거 거래 내역의 순서를 1,000회 이상 무작위로 재배열해 보세요. 이렇게 하면 백테스트에서 우연히 나타난 최대 손실폭뿐만 아니라, 발생할 수 있는 손실폭의 실제 분포를 확인할 수 있습니다.
손실이 판단력을 흐리지 않을 정도로 작은 규모로 실전 거래를 시작하세요. 모든 거래를 기록해 두세요: 진입 근거, 체결, 청산, 당시의 느낌, 규칙을 준수했는지 여부 등입니다. 이 실전 데이터를 백테스트 결과와 비교해 보세요. 30~50회 정도의 거래를 거치면, 실제 체결 결과가 백테스트와 일치하는지, 아니면 어떤 부분이 저하되고 있는지 파악할 수 있을 것입니다.
30~50회 정도 거래를 마치면 실제 데이터를 확보하게 됩니다. 실전 손익이 백테스트 예상치와 10~15% 이내의 차이를 보이고, 규칙 준수율이 높다면 전환이 순조롭게 진행되고 있는 것입니다. 그 시점부터 점차 거래 규모를 확대해 나가세요.
실전 거래에 전략을 적용하기 전에 다음 사항을 반드시 확인하십시오:
비용 구조
과적합 방지
체제 검증
심리학과 실행
백테스트와 실전 거래 간의 차이는 백테스팅의 실패가 아닙니다. 이는 백테스팅이 보장 수단이 아니라 필터 역할을 한다는 점을 보여주는 특징입니다.
좋은 백테스트는 해당 전략이 효과가 있을 수 있음을 보여줄 뿐입니다. 실제 거래 환경에서 반드시 효과가 있을 것이라고 보장해 주지는 않습니다.
비용, 과적합, 체제 리스크, 심리적 요인 등 격차의 각 구성 요소를 이해하고, 실제 운영에 들어가기 전에 이를 하나하나 검증한다면 불확실성의 대부분을 제거할 수 있습니다. 10~20%의 성과 저하는 더 이상 우연의 산물이 아닙니다. 이는 예측 가능하고 관리 가능한 수준이 되며, 이미 충분히 고려한 사항이 됩니다.
백테스트를 성공적으로 마친 트레이더들은 백테스트 결과가 완벽한 사람들이 아닙니다. 그들은 검증 작업을 수행하고, 백테스트 결과가 무엇을 의미하는지 정확히 이해한 사람들입니다.
대개 다음과 같은 이유 중 하나 이상이 작용합니다. 비용이 현실적으로 반영되지 않았거나, 전략이 과거 데이터에 과도하게 맞추어졌거나, 시장 환경이 백테스트에서는 전혀 나타나지 않았던 방향으로 바뀌었거나, 실제 스트레스 상황에서 규칙 준수도가 저하되었기 때문입니다. 대부분의 경우 이러한 요인들이 복합적으로 작용합니다.
네. 검증된 전략이라면 흔히 있는 일입니다. 비현실적인 가정을 바탕으로 한 전략은 성과가 훨씬 더 크게 떨어집니다. 실제 매매에서 30~50회 거래 후 손익이 백테스트 예상치와 10~20% 이내의 차이를 보인다면, 전략 적용이 잘 이루어지고 있는 것입니다.
개발 과정에서 한 번도 사용하지 않았던 데이터로 고정된 규칙을 테스트해 보세요. 성능이 급격히 떨어진다면 과적합된 것입니다. 성능이 비교적 잘 유지된다면 별문제는 없을 것입니다.
이는 대부분의 트레이더가 생각하는 것보다 훨씬 더 중요합니다. 3년 동안의 정적 백테스트는 하나의 결과를 보여줄 뿐입니다. 반면 워크포워드 테스트는 그 결과가 여러 하위 기간에 걸쳐 일관되게 나타나는지 여부를 알려주며, 이는 시장 환경이 끊임없이 변화하는 실제 거래 상황에 더 가깝습니다.
샘플 외 백테스트 결과가 유효하고, 시뮬레이션 재실행 시 규칙이 일관되게 준수되며, 몬테카를로 분석 결과 위험 수준이 허용 가능한 범위에 속하고, 실제 거래 첫 30건이 백테스트 예상치와 합리적인 범위 내에서 일치할 때.