報(bào)告名稱: 上市公司債券信用風(fēng)險(xiǎn)識(shí)別模型
報(bào)告類型: 投資策略研究
報(bào)告日期: 20250107
研究員: 汪毅,丁皓晨
【內(nèi)容摘要】
傳統(tǒng)的債券違約模型主要分為線性模型和非線性模型。線性模型如AltmanZ-score通過財(cái)務(wù)比率得出綜合風(fēng)險(xiǎn)評(píng)分,簡(jiǎn)便易用,但財(cái)務(wù)指標(biāo)有限,可能無法全面反映債務(wù)人狀況。非線性模型如Merton模型基于期權(quán)定價(jià)理論,能夠更好地捕捉資產(chǎn)波動(dòng),但對(duì)參數(shù)依賴較大,且忽視跳躍性事件。與之相比,機(jī)器學(xué)習(xí)在債券違約風(fēng)險(xiǎn)評(píng)估中具有優(yōu)勢(shì),能夠通過自動(dòng)化數(shù)據(jù)分析挖掘復(fù)雜的非線性關(guān)系,處理大規(guī)模數(shù)據(jù)和缺失值,并實(shí)時(shí)適應(yīng)市場(chǎng)變化。機(jī)器學(xué)習(xí)的強(qiáng)大自適應(yīng)性和精確性使其成為傳統(tǒng)違約模型的重要補(bǔ)充,提高了預(yù)測(cè)準(zhǔn)確性并應(yīng)對(duì)市場(chǎng)復(fù)雜性。上市公司債券信用風(fēng)險(xiǎn)識(shí)別不僅有助于債券市場(chǎng)的投資,同樣能夠作為一個(gè)良好的股票篩選因子。
在數(shù)據(jù)集的時(shí)間區(qū)間劃分上,為了確保訓(xùn)練集和測(cè)試集比例接近7:3,我們選擇2022Q1的財(cái)報(bào)數(shù)據(jù)作為訓(xùn)練集,并使用2024Q2的財(cái)報(bào)數(shù)據(jù)作為測(cè)試集。同時(shí),為了提高樣本的針對(duì)性,在正常樣本中僅保留公司債和可轉(zhuǎn)債兩類,從而降低數(shù)據(jù)異質(zhì)性,優(yōu)化模型的泛化性能。特征選取方面,綜合考慮企業(yè)運(yùn)營(yíng)與債券特性,報(bào)告選取了財(cái)務(wù)、債券本體以及股票交易三大類指標(biāo)。針對(duì)數(shù)據(jù)不平衡問題,報(bào)告中采用的欠采樣策略不僅有效平衡了數(shù)據(jù)分布。通過這種處理方法,模型在數(shù)據(jù)集中對(duì)少數(shù)類(如違約樣本)的識(shí)別能力顯著增強(qiáng)。同時(shí),在樣本數(shù)量有限的情況下,盡量保留了重要的異質(zhì)性信息,確保模型能夠捕捉到關(guān)鍵的風(fēng)險(xiǎn)特征。
我們使用了邏輯回歸、隨機(jī)森林、支持向量機(jī)、XGBoost以及LightGBM五個(gè)分類模型。由于支持向量機(jī)必須使用統(tǒng)一量綱后的數(shù)據(jù),在檢驗(yàn)五個(gè)模型的情況后我們發(fā)現(xiàn)統(tǒng)一量綱的操作將會(huì)顯著提高每個(gè)模型的召回率,而這有可能是由于引入未來數(shù)據(jù)導(dǎo)致的。為了避免未來函數(shù)的問題,我們將不再考慮支持向量機(jī)作為信用風(fēng)險(xiǎn)識(shí)別模型。在剩余的四個(gè)模型中,隨機(jī)森林不論是在AUC還是召回率上都具備明顯的優(yōu)勢(shì),AUC達(dá)到0.90,召回率達(dá)到0.84。
使用隨機(jī)森林作為預(yù)測(cè)最新一期債券信用風(fēng)險(xiǎn)的模型,選取2024年11月1日至2024年12月20日的信用風(fēng)險(xiǎn)樣本以及2024Q3截面的正常樣本構(gòu)成驗(yàn)證集,對(duì)于已經(jīng)產(chǎn)生的信用風(fēng)險(xiǎn)事件,隨機(jī)森林均給出了相對(duì)準(zhǔn)確的分類(預(yù)測(cè)概率均大于50%),并且調(diào)整概率均大于50%。對(duì)于截面上存續(xù)的可轉(zhuǎn)債,共有11支可轉(zhuǎn)債的違約調(diào)整概率超過50%。
風(fēng)險(xiǎn)提示:數(shù)據(jù)選取未使用全部數(shù)據(jù),可能導(dǎo)致樣本偏差;特征選取存在一定主觀性;數(shù)據(jù)不平衡采樣方法可能導(dǎo)致信息丟失;歷史數(shù)據(jù)無法完全預(yù)測(cè)未來結(jié)果;模型存在失效可能性。