Case 05응용 분석 · 모형 선택

Financial AI Model Study

회귀, 차원축소, 트리 기반, 서포트 벡터, 신경망 모형을 비교하며 복잡한 모형이 언제 일반화 성능 개선으로 이어지는지 학습한 프로젝트입니다.

기간 · 2024년 가을학기

역할 · 개인 프로젝트 시리즈

01 · 비즈니스·연구 질문

무엇을 확인하려 했는가

전처리, 정규화, 모형 복잡도와 하이퍼파라미터는 검증·테스트 성능에 어떤 영향을 줄까?

02 · 근거와 데이터

어떤 자료를 사용했는가

금융·공개 데이터를 활용한 4개 응용 과제

학습, 검증, 테스트 결과 비교

RMSE, MSE, ROC-AUC, scree plot, tuning surface와 loss curve

Pythonscikit-learnTensorFlow/KerasPCASVM/SVRANN/DNN

03 · 분석 과정

어떻게 분석하고 구현했는가

01
모형 복잡도 비교
별도 평가 데이터의 성능을 기준으로 다항회귀 차수와 decision tree 설정을 비교했습니다.
02
표현과 정규화 분석
PCA, 표준화, Ridge와 Lasso를 적용해 데이터 구조와 overfitting을 살펴봤습니다.
03
Support Vector 모형 조정
Iowa housing 데이터에서 Linear SVR 파라미터 조합을 비교했습니다.
04
Neural Network 깊이 비교
선형회귀, 은닉층 1개의 ANN과 은닉층 3개의 DNN을 비교했습니다.

04 · 해석

무엇을 알 수 있었는가

국가위험 예시에서 보고된 첫 두 PCA 주성분이 전체 분산의 약 88.4%를 설명했습니다.

비교한 조합에서는 C=1, epsilon=50인 Linear SVR의 성능이 가장 좋았습니다.

더 깊은 DNN은 작은 ANN과 비교해 큰 개선을 보이지 않았습니다.

05 · 실무적 시사점

어떤 판단에 활용할 수 있는가

복잡한 방법이라는 이유만으로 선택하지 않고, 검증 결과가 실제 개선을 뒷받침할 때만 추가 복잡도를 채택해야 한다는 기준을 확인했습니다.

06 · 추가 검증

한계와 다음 과제

•원본 데이터와 데이터 사전을 복구해야 합니다.
•4개 과제를 재현 가능한 노트북으로 통합해야 합니다.
•수업 과제의 성능 수치를 실제 운영 환경의 성과로 표현할 수 없습니다.

07 · 시각적 근거

확인된 근거와 해석 범위

다항회귀 차수별 validation RMSE

보고서 근거

Degree 144,167

Degree 229,607

Degree 327,122

Degree 426,114

Degree 524,594

과제 보고서에 기록된 validation RMSE를 차수별로 비교합니다. 이 그래프만으로 특정 차수가 최종 선택이라고 결론 내릴 수 없으며, train/test 결과와 원자료를 함께 재현해야 합니다.

근거 · Financial AI assignment 1 report

PCA 설명분산

보고서 근거

PC164.03%

PC224.37%

PC39.77%

PC41.83%

보고서에서 PC1과 PC2가 각각 64.03%, 24.37%를 설명해 합계 약 88.4%였습니다. 특정 국가위험 예시의 수업 결과이며 일반적인 금융 예측 성능을 뜻하지 않습니다.

근거 · Financial AI assignment 1 report · national-risk example

Linear SVR tuning 결과

보고서 근거

1.0

epsilon

Train MSE

1,782.2306

Validation MSE

1,944.5111

비교한 조합 중 C=1, epsilon=50이 보고서상 가장 낮은 validation MSE를 보였습니다. 제한된 수업 실험의 결과이며 외부 데이터나 production 환경의 성능을 보장하지 않습니다.

근거 · Financial AI assignment 3 report · Iowa housing example

ANN과 DNN validation 관찰

보고서 근거

ANN

은닉층 1개 · 비교 기준 모형

DNN

은닉층 3개 · 추가 복잡도의 개선 제한

보고서는 더 깊은 DNN이 작은 ANN보다 의미 있는 개선을 보이지 않았다고 해석했습니다. 문서 안의 일부 최소 손실 표기가 일관되지 않아 정확한 수치 비교 대신 정성적 결론만 표시합니다.

근거 · Financial AI assignment 4 report

← 포트폴리오

English

Case 05응용 분석 · 모형 선택

Financial AI Model Study

회귀, 차원축소, 트리 기반, 서포트 벡터, 신경망 모형을 비교하며 복잡한 모형이 언제 일반화 성능 개선으로 이어지는지 학습한 프로젝트입니다.

기간 · 2024년 가을학기

역할 · 개인 프로젝트 시리즈

01 · 비즈니스·연구 질문

무엇을 확인하려 했는가

전처리, 정규화, 모형 복잡도와 하이퍼파라미터는 검증·테스트 성능에 어떤 영향을 줄까?

02 · 근거와 데이터

어떤 자료를 사용했는가

금융·공개 데이터를 활용한 4개 응용 과제

학습, 검증, 테스트 결과 비교

RMSE, MSE, ROC-AUC, scree plot, tuning surface와 loss curve

Pythonscikit-learnTensorFlow/KerasPCASVM/SVRANN/DNN

03 · 분석 과정

어떻게 분석하고 구현했는가

01
모형 복잡도 비교
별도 평가 데이터의 성능을 기준으로 다항회귀 차수와 decision tree 설정을 비교했습니다.
02
표현과 정규화 분석
PCA, 표준화, Ridge와 Lasso를 적용해 데이터 구조와 overfitting을 살펴봤습니다.
03
Support Vector 모형 조정
Iowa housing 데이터에서 Linear SVR 파라미터 조합을 비교했습니다.
04
Neural Network 깊이 비교
선형회귀, 은닉층 1개의 ANN과 은닉층 3개의 DNN을 비교했습니다.

04 · 해석

무엇을 알 수 있었는가

국가위험 예시에서 보고된 첫 두 PCA 주성분이 전체 분산의 약 88.4%를 설명했습니다.

비교한 조합에서는 C=1, epsilon=50인 Linear SVR의 성능이 가장 좋았습니다.

더 깊은 DNN은 작은 ANN과 비교해 큰 개선을 보이지 않았습니다.

05 · 실무적 시사점

어떤 판단에 활용할 수 있는가

복잡한 방법이라는 이유만으로 선택하지 않고, 검증 결과가 실제 개선을 뒷받침할 때만 추가 복잡도를 채택해야 한다는 기준을 확인했습니다.

06 · 추가 검증

한계와 다음 과제

•원본 데이터와 데이터 사전을 복구해야 합니다.
•4개 과제를 재현 가능한 노트북으로 통합해야 합니다.
•수업 과제의 성능 수치를 실제 운영 환경의 성과로 표현할 수 없습니다.

07 · 시각적 근거

확인된 근거와 해석 범위

다항회귀 차수별 validation RMSE

보고서 근거

Degree 144,167

Degree 229,607

Degree 327,122

Degree 426,114

Degree 524,594

근거 · Financial AI assignment 1 report

PCA 설명분산

보고서 근거

PC164.03%

PC224.37%

PC39.77%

PC41.83%

근거 · Financial AI assignment 1 report · national-risk example

Linear SVR tuning 결과

보고서 근거

1.0

epsilon

Train MSE

1,782.2306

Validation MSE

1,944.5111

근거 · Financial AI assignment 3 report · Iowa housing example

ANN과 DNN validation 관찰

보고서 근거

ANN

은닉층 1개 · 비교 기준 모형

DNN

은닉층 3개 · 추가 복잡도의 개선 제한

근거 · Financial AI assignment 4 report

무엇을 확인하려 했는가

어떤 자료를 사용했는가

어떻게 분석하고 구현했는가

모형 복잡도 비교

표현과 정규화 분석

Support Vector 모형 조정

Neural Network 깊이 비교

무엇을 알 수 있었는가

어떤 판단에 활용할 수 있는가

한계와 다음 과제

확인된 근거와 해석 범위

다항회귀 차수별 validation RMSE

PCA 설명분산

Linear SVR tuning 결과

ANN과 DNN validation 관찰

무엇을 확인하려 했는가

어떤 자료를 사용했는가

어떻게 분석하고 구현했는가

모형 복잡도 비교

표현과 정규화 분석

Support Vector 모형 조정

Neural Network 깊이 비교

무엇을 알 수 있었는가

어떤 판단에 활용할 수 있는가

한계와 다음 과제

확인된 근거와 해석 범위

다항회귀 차수별 validation RMSE

PCA 설명분산

Linear SVR tuning 결과

ANN과 DNN validation 관찰