[¹öÁî Á¤·®È¸¦ ÅëÇÑ °í°´ ´ÏÁî ºÐ¼®]
Çкο¡¼ ±¤°í±âȹ°ú ¸¶ÄÉÆÃÀ» °øºÎÇÏ¸ç ºê·£µå °ü¸®¿Í ºê·£µå Àü·« µîÀÇ °ÀǸ¦ ÀÚÁÖ Á¢Çß½À´Ï´Ù. ÀÌ·Î ÀÎÇØ ºê·£µù¿¡ Àͼ÷Çϰí, ´ëÇпø¿¡¼ µ¥ÀÌÅÍ ºÐ¼®À» °øºÎÇ߱⿡ Á¤·®È¿Í ÃøÁ¤¿¡µµ ÀڽŠÀÖ½À´Ï´Ù. °ü·ÃÇÑ °æÇèÀ¸·Î, ½º¸¶Æ®Æù °ü·Ã °í°´ ¹ÝÀÀ ÅØ½ºÆ®¸¦ Á¤·®È ¹× ÃøÁ¤ÇÏ¿© ±âÁ¾º° °í°´ ´ÏÁ µµÃâÇϱ⵵ Çß½À´Ï´Ù.
PythonÀ¸·Î ¾ÆÀÌÆù13, ZÇø³3 µî ½º¸¶Æ®Æù¿¡ ´ëÇÑ ¹öÁ À¯Æ©ºê, ºí¶óÀεå, ³×À̹ö Ä«Æä¿¡¼ Å©·Ñ¸µÇß½À´Ï´Ù. ±×¸®°í ÀÚÁÖ ¾ð±ÞµÇ´Â Ä«¸Þ¶ó, ¹èÅ͸®, µðÀÚÀÎ, ¼º´É, ȸéÀÇ 5°¡Áö Ç׸ñÀ¸·Î ¹üÁÖÈÇß½À´Ï´Ù. ±× ÈÄ ¸ðµç ¹öÁî¿¡ ±Ø¼ºÁ¡¼ö¸¦ ºÎ¿©Çϰí, Ç׸ñ¿¡ µû¶ó ½º¸¶Æ®Æù Á¡¼ö¸¦ °è»êÇß½À´Ï´Ù. °¡·É ¾ÆÀÌÆù13ÀÇ Ä«¸Þ¶ó Á¡¼ö´Â 0.69, ¹èÅ͸® Á¡¼ö´Â 0.60À¸·Î »êÃâµÇ´Â ½ÄÀÔ´Ï´Ù.
¶ÇÇÑ ¹üÁÖÈÇÑ ¹öÁ 0°ú 1ÀÇ Çà·Ä·Î º¯È¯ÇØ ¿¬°ü°ü°èºÐ¼®À¸·Î Ç׸ñ °£ °ü°è¸¦ ÆÄ¾ÇÇß½À´Ï´Ù. ±× °á°ú µðÀÚÀΰú ¼º´ÉÀÇ support°¡ °¢°¢ 0.402¿Í 0.36À¸·Î, ¼º´É¿¡ ´ëÇÑ ¹èÅ͸®ÀÇ lift°¡ 1.25·Î ±Í°áµÇ¾ú½À´Ï´Ù. ÀÌ´Â °í°´ÀÌ µðÀÚÀΰú ¼º´ÉÀ» °¡Àå Áß½ÃÇϰí, ¼º´É°ú ¹èÅ͸®¸¦ º¸¿ÏÀû °ü°è·Î °£ÁÖÇÑ´Ù´Â °ÍÀ» ÀǹÌÇÕ´Ï´Ù. µû¶ó¼ »õ·Î¿î ½º¸¶Æ®ÆùÀº µðÀÚÀΰú ¼º´É, ¹èÅ͸® °³¼±¿¡ ÃÊÁ¡ÀÌ ¸ÂÃçÁ®¾ß ÇÔÀ» Ãß·ÐÇÒ ¼ö ÀÖ¾ú½À´Ï´Ù.
5°¡Áö Ç׸ñ Á¡¼ö¿Í ¿¬°ü°ü°èºÐ¼® °á°ú¸¦ Á¾ÇÕÇϸé, ½º¸¶Æ®Æù ±âÁ¾¿¡ µû¸¥ °í°´ ´ÏÁî ÆÄ¾ÇÀÌ °¡´ÉÇÕ´Ï´Ù. ¿¹ÄÁ´ë ZÇø³3´Â µðÀÚÀΰú ¼º´É, ¹èÅ͸® Á¡¼ö°¡ 0.70, 0.54, 0.34¿´½À´Ï´Ù. µðÀÚÀÎ Á¡¼ö ´ëºñ ¼º´É°ú ¹èÅ͸® Á¡¼ö°¡ »ó´ëÀûÀ¸·Î ³·±â¿¡, °í°´Àº ¼º´É°ú ¹èÅ͸®°¡ °ÈµÈ ZÇø³4ÀÇ Ãâ½Ã¸¦ Èñ¸ÁÇÑ´Ù°í ÇÒ ¼ö ÀÖ½À´Ï´Ù.
ÅØ½ºÆ® µ¥ÀÌÅ͸¦ Á¤·®ÈÇϰí ÃøÁ¤ÇÏ¿© °í°´ ´ÏÁ ÆÄ¾ÇÇÒ ¼ö ÀÖ¾ú´ø °æÇèÀ̾ú½À´Ï´Ù. ³Ø½¼¿¡¼µµ ºñÁ¤Çü µ¥ÀÌÅ͸¦ °´°üÀûÀ¸·Î Á¤·®ÈÇϰí ÃøÁ¤ÇÏ¿© ºê·£µù ÀλçÀÌÆ®¸¦ µµÃâÇϰڽÀ´Ï´Ù. À̸¦ ÅëÇØ °ÔÀÓ ½ÃÀå¿¡¼ ³Ø½¼ °ÔÀÓ ºê·£µå¸¦ È®°íÈ÷ ÇÏ´Â ¸ð½À º¸¿©µå¸®°Ú½À´Ï´Ù.
[Ã¥ÀÓ°¨À» °âºñÇÑ µ¥ÀÌÅÍ ºÐ¼®°¡]
µ¥ÀÌÅÍ ºÐ¼®Àº Àú·Î ÇÏ¿©±Ý º¸¶÷À» ´À³¢°Ô ÇÕ´Ï´Ù. Åë°è¿Í ¸Ó½Å·¯´×, µö·¯´× ¹æ¹ý·ÐÀ» ¹è¿ì¸ç ´Ù¾çÇÑ ºÐ¼®À» ÁøÇàÇß½À´Ï´Ù. ¼ö¸¹Àº º¯¼ö ¼Ó À¯ÀǹÌÇÑ º¯¼ö¸¦ ÃßÃâÇÏ°í ¸ðÇüÀ» Á¦ÀÛÇÏ¿©, Â÷º°ÈµÇ¸é¼ µ¿½Ã¿¡ ÀÌ·Î¿î °¡Ä¡¸¦ µµÃâÇÒ ¼ö ÀÖ´Ù´Â Á¡ÀÌ Å« ¼ºÃë°¨À¸·Î ´Ù°¡¿Ô½À´Ï´Ù. ±× °úÁ¤¿¡¼, µ¥ÀÌÅ͸¦ ºÐ¼®ÇÒ ¶§ °¡Àå Áß¿äÇÑ ÀÚÁúÀÌ Ã¥ÀÓ°¨À̶ó´Â »ç½ÇÀ» ±ú´Þ¾Ò½À´Ï´Ù. °¡Ä¡ ÀÖ´Â ÀλçÀÌÆ® µµÃâ±îÁö »ó´çÇÑ ½Ã°£°ú ³ë·ÂÀÌ ¼Ò¿äµÇ±â ¶§¹®ÀÔ´Ï´Ù.
¿¹¸¦ µé¾î¼ ÀûÀýÇÑ °áÃøÄ¡ ġȯ°ª ¼³Á¤À» À§ÇØ º¸°£¹ý, Á¦°Å¹ý, Æò±Õ´ëÄ¡¹ý µî ´Ù¼öÀÇ Ä¡È¯¹ýÀ» ½ÃµµÇØ¾ß Çϰí, ÇϳªÀÇ ÀÌ»óÄ¡ Á¦°Å¸¦ À§ÇØ leverage, sdr, cooks distance µîÀ» ÂüÁ¶ÇØ¾ß ÇÕ´Ï´Ù. ¸Ó½Å·¯´× ¸ðÇüÀ» Á¦ÀÛÇÒ ¶§´Â ¿©·¯ ¾Ë°í¸®Áò¿¡ cross-validationÀ» Àû¿ëÇÑ ÈÄ overfittingÀ» ÀÏÀ¸Å°Áö ¾Ê´Â ÃÖÀûÀÇ ÇÏÀÌÆÛ ÆÄ¶ó¹ÌÅÍ µµÃâ °úÁ¤À» °ÅÃľ߸¸ ÇÕ´Ï´Ù.
ÀÇ¹Ì ÀÖ´Â °á·ÐÀ» ¹ß±¼Çϰڴٴ åÀÓ°¨ÀÌ ºÎÀçÇϸé, ¹«ÀǹÌÇÑ µ¥ÀÌÅÍ ºÐ¼®À¸·Î À̾îÁú °¡´É¼ºÀÌ ³óÈÄÇÕ´Ï´Ù. Àú´Â ÇкΠ½ÃÀýºÎÅÍ ´Ù¾çÇÑ ÆÀ ÇÁ·ÎÁ§Æ®¸¦ ¼öÇàÇß°í À½¾Ç µ¿¾Æ¸® ȸÀåÀ¸·Îµµ Ȱµ¿ÇÑ ¹Ù°¡ Àֱ⿡, µ¥ÀÌÅÍ ºÐ¼®À» À§ÇÑ Ã¥ÀÓ°¨À» ºÎÁ·ÇÏÁö ¾Ê°Ô Áö³æ´Ù°í »ý°¢ÇÕ´Ï´Ù. ºÐ¼®Áö¿øÆÀÀÇ µ¥ÀÌÅÍ ºÐ¼®°¡ Á÷¹«¸¦ Ã¥ÀÓ°¨¿¡ ±âÃÊÇØ ¼öÇàÇϰڽÀ´Ï´Ù. ÀÌ·Î½á ¹Ï°í ¸Ã±æ ¼ö ÀÖ´Â ³Ø½¼ ±¸¼º¿øÀ¸·Î ÀÚ¸®¸Å±èÇϰڽÀ´Ï´Ù.
[µ¥ÀÌÅÍ¿Í ºñÁî´Ï½º ÀλçÀÌÆ®]
Àú´Â ¸Ó½Å·¯´×À» Ȱ¿ëÇÑ ºñÁî´Ï½º ¹®Á¦ ÇØ°áÀ̳ª µ¥ÀÌÅÍ ±â¹Ý Ÿ°ÔÆÃÀÌ °¡´ÉÇÕ´Ï´Ù. ÀÌ´Â ÇÐºÎ¿Í ´ëÇпøÀ» °ÅÄ¡¸ç ºñÁî´Ï½º ¹× µ¥ÀÌÅÍ ¿ª·®À» ±æ·¯¿Â °Í¿¡¼ ±âÀÎÇÕ´Ï´Ù. ÇÑ ¹øÀº, °í°´ µ¥ÀÌÅÍ¿¡ ÆÄ·¹ÅäÀÇ ¹ýÄ¢À» Àû¿ëÇØ ¿ì¼öÇÑ ¼º´ÉÀÇ »óÀ§ 20% °í°´ ¿¹Ãø¸ðÇüÀ» Á¦ÀÛÇÑ Àûµµ ÀÖ½À´Ï´Ù.
¸Ó½Å·¯´×À¸·Î ƯÁ¤ °í°´ÀÌ ¸ÅÃâ »óÀ§ 20%¿¡ ¼ÓÇÒÁö ¿¹ÃøÇÒ ¼ö ÀÖ´Ù¸é, °í°´ ¼¼±×¸ÕÆ®¿¡ µû¶ó ÀûÀýÇÑ ¸¶ÄÉÆÃÀ» ÁýÇàÇØ ¸ÅÃ⠱شëȰ¡ °¡´ÉÇϸ®¶ó ¿¹»óÇß½À´Ï´Ù. ÀÌ¿¡ PythonÀ¸·Î ±¸¸Å±Ý¾× »óÀ§ 20% ¿©ºÎ ÀÌÁøº¯¼ö¸¦ »ý¼ºÇϰí, »ó°ü°è¼ö¿Í VIF°ªÀ¸·Î ´ÙÁß°ø¼±¼º À¯¹ß º¯¼ö¸¦ Á¦°ÅÇß½À´Ï´Ù. ±×¸®°í º¸°£¹ýÀ» ÅëÇÑ °áÃøÄ¡ ġȯ°ú ÀÌ»óÄ¡ Á¦°Å·Î Àüó¸® ÈÄ scikit-learn ÇÁ·¹ÀÓ¿öÅ©¸¦ Ȱ¿ëÇØ ·ÎÁö½ºÆ½ ȸ±Í¸ðÇü, ·£´ýÆ÷·¹½ºÆ®, ºÎ½ºÆÃ µîÀ» Á¦ÀÛÇß½À´Ï´Ù. ±× °á°ú Á¤È®µµ, ¹Î°¨µµ, Á¤¹Ðµµ°¡ °¢°¢ 0.931, 0.798, 0.717ÀÎ ·£´ýÆ÷·¹½ºÆ® ¸ðÇüÀ» µµÃâÇÒ ¼ö ÀÖ¾ú°í, ¿¬°£ ¼Òµæ°ú ÀÚ³à ¼ö°¡ °¡Àå Áß¿äÇÑ º¯¼ö¶ó´Â »ç½Çµµ È®ÀÎÇß½À´Ï´Ù.
µ¥ÀÌÅÍ¿¡ ±âÃÊÇÑ ºñÁî´Ï½º ÀλçÀÌÆ® µµÃâ ´É·ÂÀº »ç¾÷, ¸¶ÄÉÆÃ µî À¯°ü ºÎ¼¿ÍÀÇ Çù¾÷¿¡ À¯¿ëÇϸ®¶ó ±â´ëÇÕ´Ï´Ù. ¾Æ¿ï·¯, ÃÑÁ¡ 4.3 ¸¸Á¡¿¡ ÆòÁ¡ 4.22¸¦ ¹Þ°í ¼ö¼®À¸·Î ´ëÇпøÀ» Á¹¾÷Ç߱⿡ ½Ç·Â ¶ÇÇÑ ºÎÁ·ÇÏÁö ¾Ê´Ù°í ÀÚºÎÇÕ´Ï´Ù. ¿À·£ ±â°£ ºñÁî´Ï½º¿Í µ¥ÀÌÅ͸¦ °øºÎÇØ ¿Ô½À´Ï´Ù. µÎ ¿ª·®ÀÇ ±ÕÇü ÀâÈù ½Ã°¢À» ¹ÙÅÁÀ¸·Î À¯ÀǹÌÇÑ °¡Ä¡¸¦ Á¦½ÃÇϰí, ´Ù¾çÇÑ Çù¾÷¿¡µµ À̹ÙÁöÇϵµ·Ï ÇϰڽÀ´Ï´Ù.