Bakit kailangan ang cross validation?
Bakit kailangan ang cross validation?

Video: Bakit kailangan ang cross validation?

Video: Bakit kailangan ang cross validation?
Video: Machine Learning Fundamentals: Cross Validation 2024, Mayo
Anonim

Cross Validation ay isang napaka-kapaki-pakinabang na pamamaraan para sa pagtatasa ng pagiging epektibo ng iyong modelo, lalo na sa mga kaso kung saan kailangan mong bawasan ang overfitting. Ito ay magagamit din sa pagtukoy ng mga hyper parameter ng iyong modelo, sa kahulugan na kung aling mga parameter ang magreresulta sa pinakamababang error sa pagsubok.

Kung isasaalang-alang ito, palaging mas mahusay ba ang cross validation?

Cross Validation ay karaniwang isang napakahusay na paraan upang sukatin ang isang tumpak na pagganap. Bagama't hindi nito pinipigilan ang iyong modelo na mag-overfit, sinusukat pa rin nito ang isang tunay na pagtatantya ng pagganap. Kung mag-overfit sa iyo ang iyong modelo, magreresulta ito sa mas masahol na mga hakbang sa pagganap. Nagbunga ito ng mas masahol pa cross validation pagganap.

Sa tabi sa itaas, bakit kailangan natin ng validation set? Set ng pagpapatunay aktwal na maaaring ituring bilang isang bahagi ng pagsasanay itakda , dahil ginagamit ito sa pagbuo ng iyong modelo, mga neural network o iba pa. Karaniwan itong ginagamit para sa pagpili ng parameter at upang maiwasan ang overfitting. Set ng pagpapatunay ay ginagamit para sa pag-tune ng mga parameter ng isang modelo. Set ng pagsubok ay ginagamit para sa pagtatasa ng pagganap.

Kasunod nito, maaari ring magtanong, ano ang ibig sabihin ng cross validation?

Krus - ang pagpapatunay ay a pamamaraan na ginagamit para sa pagtatasa kung paano nagsa-generalize ang mga resulta ng statistical analysis sa isang independiyenteng set ng data. Krus - pagpapatunay ay higit na ginagamit sa mga setting kung saan ang target ay hula at ito ay kinakailangan upang tantiyahin ang katumpakan ng pagganap ng isang predictive na modelo.

Paano mo pipiliin ang bilang ng mga fold sa cross validation?

Ang bilang ng fold ay karaniwang tinutukoy ng numero ng mga instance na nasa iyong dataset. Halimbawa, kung mayroon kang 10 instance sa iyong data, 10- tiklop na krus - pagpapatunay hindi magkaroon ng kahulugan.

Inirerekumendang: