Financial AI Model Study
회귀, 차원축소, 트리 기반, 서포트 벡터, 신경망 모형을 비교하며 복잡한 모형이 언제 일반화 성능 개선으로 이어지는지 학습한 프로젝트입니다.
기간 · 2024년 가을학기
역할 · 개인 프로젝트 시리즈
01 · 비즈니스·연구 질문
무엇을 확인하려 했는가
전처리, 정규화, 모형 복잡도와 하이퍼파라미터는 검증·테스트 성능에 어떤 영향을 줄까?
02 · 근거와 데이터
어떤 자료를 사용했는가
03 · 분석 과정
어떻게 분석하고 구현했는가
- 01
모형 복잡도 비교
별도 평가 데이터의 성능을 기준으로 다항회귀 차수와 decision tree 설정을 비교했습니다.
- 02
표현과 정규화 분석
PCA, 표준화, Ridge와 Lasso를 적용해 데이터 구조와 overfitting을 살펴봤습니다.
- 03
Support Vector 모형 조정
Iowa housing 데이터에서 Linear SVR 파라미터 조합을 비교했습니다.
- 04
Neural Network 깊이 비교
선형회귀, 은닉층 1개의 ANN과 은닉층 3개의 DNN을 비교했습니다.
04 · 해석
무엇을 알 수 있었는가
국가위험 예시에서 보고된 첫 두 PCA 주성분이 전체 분산의 약 88.4%를 설명했습니다.
비교한 조합에서는 C=1, epsilon=50인 Linear SVR의 성능이 가장 좋았습니다.
더 깊은 DNN은 작은 ANN과 비교해 큰 개선을 보이지 않았습니다.
05 · 실무적 시사점
어떤 판단에 활용할 수 있는가
복잡한 방법이라는 이유만으로 선택하지 않고, 검증 결과가 실제 개선을 뒷받침할 때만 추가 복잡도를 채택해야 한다는 기준을 확인했습니다.
06 · 추가 검증
한계와 다음 과제
- •원본 데이터와 데이터 사전을 복구해야 합니다.
- •4개 과제를 재현 가능한 노트북으로 통합해야 합니다.
- •수업 과제의 성능 수치를 실제 운영 환경의 성과로 표현할 수 없습니다.
07 · 시각적 근거
확인된 근거와 해석 범위
다항회귀 차수별 validation RMSE
보고서 근거과제 보고서에 기록된 validation RMSE를 차수별로 비교합니다. 이 그래프만으로 특정 차수가 최종 선택이라고 결론 내릴 수 없으며, train/test 결과와 원자료를 함께 재현해야 합니다.
근거 · Financial AI assignment 1 report
PCA 설명분산
보고서 근거보고서에서 PC1과 PC2가 각각 64.03%, 24.37%를 설명해 합계 약 88.4%였습니다. 특정 국가위험 예시의 수업 결과이며 일반적인 금융 예측 성능을 뜻하지 않습니다.
근거 · Financial AI assignment 1 report · national-risk example
Linear SVR tuning 결과
보고서 근거C
1.0
epsilon
50
Train MSE
1,782.2306
Validation MSE
1,944.5111
비교한 조합 중 C=1, epsilon=50이 보고서상 가장 낮은 validation MSE를 보였습니다. 제한된 수업 실험의 결과이며 외부 데이터나 production 환경의 성능을 보장하지 않습니다.
근거 · Financial AI assignment 3 report · Iowa housing example
ANN과 DNN validation 관찰
보고서 근거ANN
은닉층 1개 · 비교 기준 모형
DNN
은닉층 3개 · 추가 복잡도의 개선 제한
보고서는 더 깊은 DNN이 작은 ANN보다 의미 있는 개선을 보이지 않았다고 해석했습니다. 문서 안의 일부 최소 손실 표기가 일관되지 않아 정확한 수치 비교 대신 정성적 결론만 표시합니다.
근거 · Financial AI assignment 4 report