µ¥ÀÌÅÍ ¸¶ÀÌ´× : Àå³²½Ä.È«¼º¿Ï.ÀåÀçÈ£ ÁöÀ½, ´ëû¹Ìµð¾î, 1999
(3) ÀüÅëÀûÀÎ Àü¹®°¡½Ã½ºÅÛÀÇ ÇѰè
(4) µ¥ÀÌÅÍÀÇ È«¼ö, Á¤º¸ÀÇ ºó°ï
(3) data mining°ú ±âÁ¸ÀÇ Á¶È¸ µµ±¸
±â¾÷°£ÀÇ °æÀïÀÌ ½Éȵǰí Á¤º¸ÀÇ Á߿伺¿¡ ´ëÇÑ ÀνÄÀÌ È®»êµÊ¿¡ µû¶ó ´ë·®ÀÇ µ¥ÀÌÅÍ¿¡¼ À¯¿ëÇÑ Á¤º¸¸¦ ij³»´Â 'data mining'ÀÌ ÁÖ¸ñ ¹Þ°í ÀÖ´Ù. ÀÌ¹Ì ¿Ü±¹¿¡¼´Â ´Ù¾çÇÑ ¿¬±¸¿Í ÇÁ·ÎÁ§Æ®°¡ ÃßÁøµÇ¾î ±× °á°ú¹°µéÀÌ ¼Ó¼Ó ¹ßÇ¥µÇ°í ÀÖÀ¸³ª ±¹³»ÀÇ °æ¿ì data miningÀÇ Àü ´Ü°è¶ó ÇÒ ¼ö ÀÖ´Â µ¥ÀÌÅÍ¿þ¾îÇϿ콺(data warehouse) ±¸Ãà ÀÛ¾÷ÀÌ ÀϺΠÁøÇàµÇ°í ÀÕÀ» »Ó º»°ÝÀûÀ¸·Î data miningÀ» Àû¿ëÇÑ »ç·Ê¸¦ ã±â´Â ¾î·Æ´Ù. ±×·¯³ª 21¼¼±â ±â¾÷°æ¿µ¿¡¼ µ¥ÀÌÅͺ£À̽º¸¶ÄÉÆÃ(Database Marketing)À̳ª °í°´°ü°è°ü¸®(CRM: Customer Relationship Management), À§Çè°ü¸®(Risk Management) µîÀÇ Á߿伺ÀÌ Å©°Ô ºÎ°¢µÇ±â ½ÃÀÛÇÏ¸é¼ ±¹³»¿¡¼µµ ´Ù¾çÇÑ ºÐ¾ß¿¡¼ data mining ÀÛ¾÷ÀÌ ÀÌ·ç¾îÁú Àü¸ÁÀÌ´Ù. ÀÌ Àå¿¡¼´Â ¾ÆÁ÷Àº ¿ì¸® ±Í¿¡ »ý¼ÒÇÑ data mining¿¡ ´ëÇÑ Àü¹ÝÀûÀÎ °³¿ä¸¦ µîÀå¹è°æ ¹× Á¤ÀÇ, ´ëÇ¥ÀûÀÎ ÀÛ¾÷À¯Çü°ú »ê¾÷º° ÁÖ¿ä ÀÀ¿ë ºÐ¾ß, ±×¸®°í ÇÁ·ÎÁ§Æ® ¼öÇà½Ã °í·ÁÇØ¾ß ÇÒ »çÇ× µîÀ» ÅëÇØ ¼³¸íÇϰíÀÚ ÇÑ´Ù.
ÃÖ±Ù µé¾î ¿ì¸®°¡ °¡Àå ¸¹ÀÌ µè´Â ´Ü¾î °¡¿îµ¥ Çϳª°¡ 'Á¤º¸'ÀÏ °ÍÀÌ´Ù.
½Å¹®À̳ª ÀâÁö, ¹æ¼Û µîÀÇ ¹Ìµð¾î¿Í ¸ðÀÓ, °¿¬ µî¿¡¼ ÁÖÁ¦¿¡ °ü°è¾øÀÌ ÇÑ ¹ø ÀÌ»ó
³ª¿À´Â ÀÌ ´Ü¾î¿¡ ¿ì¸®´Â ¾î´À»õ Ä£¼÷ÇØÁ® ÀÖ´Ù. Á¤º¸¶ó´Â °Í ¾øÀ̵µ °ú°Å¿¡´Â º°
¹®Á¦¾øÀÌ »ì¾Æ°¥ ¼ö ÀÖ¾ú´Âµ¥, ÀÌÁ¦´Â Á¤º¸¾øÀÌ´Â ¾Æ¹« °Íµµ ÇÒ ¼ö ¾ø´Ù´Â À§±â°¨À»
´À³¢±âµµ ÇÑ´Ù. Àΰ£Àº ´©±¸³ª ȯ°æ¿¡ ÀûÀýÈ÷ ÀûÀÀÇÏ¿© ¸ÃÀº ÀÏÀ» ¹«¸® ¾øÀÌ È¿°úÀûÀ¸·Î
¼öÇàÇÏ·Á´Â ¿å±¸¸¦ °¡Áö°í ÀÖ´Ù. ±×·¯³ª °³ÀÎÀÇ ´É·ÂÀ̳ª Áö½Ä¿¡´Â ÇѰ谡 ÀÖÀ¸¹Ç·Î
ÀÌ·¯ÇÑ ÇѰ踦 ±Øº¹Çϱâ À§ÇÏ¿© °ú°Å¿¡µµ ´Ã Á¤º¸¶ó´Â °ÍÀ» ¼öÁýÇϰí Ȱ¿ëÇÏ·Á ¾Ö½á¿Ô´Ù.
±×·¸´Ù¸é Á¤º¸È »çȸ¶ó ÀÏÄ´ ¿À´Ã³¯, Á¤º¸ÀÇ Á߿伺°ú Çʿ伺ÀÌ ¾î´À ¶§º¸´Ùµµ
Å©°Ô ºÎ°¢µÇ´Â ±î´ßÀº ¹«¾ùÀϱî? ±× ÀÌÀ¯¸¦ ±â¾÷°æ¿µ Ãø¸é¿¡¼ ã¾Æº¸¸é Á¤º¸È »çȸ¿¡¼´Â
Á¤º¸°¡ ±â¾÷°æ¿µÀÇ °æÀï·ÂÀ» °áÁ¤ÇÏ´Â °¡Àå Áß¿äÇÑ ¿ä¼Ò¶ó´Â °ÍÀÌ´Ù.
18¼¼±â
Áß¿±ºÎÅÍ ½ÃÀÛµÈ »ê¾÷ÈÀÇ ¹°°áÀº Áö³ 200¿©³â µ¿¾È Àηù ¹®¸íÀ» Áö¹èÇÏ¿´´Ù. »ê¾÷»çȸ¿¡¼
ÀηùÀÇ À°Ã¼ÀûÀÎ ³ëµ¿Àº ±â°è·Î ´ëüµÇ¾úÀ¸¸ç, ´ë·® »ý»ê°ú ¼Òºñ¸¦ °¡´ÉÄÉÇÏ¿© ÀÌÀü¿¡´Â
±â´ëÇÒ ¼ö ¾ø¾ú´ø ¹°ÁúÀûÀΠdz¿ä¸¦ Àηù¿¡°Ô Á¦°øÇÏ¿´´Ù. ÀÌ ½Ã±âÀÇ ±â¾÷µéÀº Á¤ºÎÀÇ
º¸È£¿Í ±ÔÁ¦ ¼Ó¿¡¼ ¾÷Á¾º°·Î µ¶°úÁ¡À» Çü¼ºÇÏ¿´À¸¸ç, ÀüÅëÀûÀÎ ÀÚ¿øÀÎ ÀηÂ, ÀÚ±Ý,
±×¸®°í ¹°ÀÚÀÇ È¿À²Àû ¿î¿ëÀ» ÅëÇØ ´Ù·®ÀÇ Á¦Ç°À̳ª ¼ºñ½º¸¦ ¸¸µé¾î³»¸é ¼º°øÀ»
º¸Àå¹ÞÀ» ¼ö ÀÕ¾ú´Ù. ¹°·Ð ÀÚ¿øÀÇ È¿À²Àû ¿î¿ëÀ̳ª Á¦Ç°ÀÇ °³¹ß, ¸¶ÄÉÆÃ È°µ¿ µîÀ»
À§ÇØ Á¤º¸ÀÇ ¼öÁý°ú Ȱ¿ëÀÌ ¿ä±¸µÇ¾úÁö¸¸ ȯ°æÀÇ º¯È°¡ °ÅÀÇ ¾ø¾ú°í ½ÃÀåÀº »ý»êÀÚ
À§ÁÖ·Î Çü¼ºµÇ¾ú±â ¶§¹®¿¡ °æ¿µÀÚ³ª ¼Ò¼ö Àü¹®°¡ÀÇ ¿À·£ °æÇèÀ» ÅëÇØ ¾ò¾îÁø Áö½ÄÀ̳ª
ÁÖ°üÀûÀÎ ÆÇ´Ü, °£´ÜÇÑ Åë°è¼öÄ¡ µî ´Ü¼øÇÑ ¼öÁØÀÇ Á¤º¸·Îµµ ÃæºÐÈ÷ ±â¾÷À» °æ¿µÇÒ
¼ö ÀÖ¾ú´Ù.
ÇÏÁö¸¸ ¿À´Ã³¯ ±â¾÷ÀÌ Ã³ÇÑ È¯°æÀº °ú°Å¿Í´Â ¿ÏÀüÈ÷
´Ù¸£´Ù. ½ÃÀåÀº ´ÙǰÁ¾ ¼Ò·® »ý»êÀÌ ¿ä±¸µÇ´Â ¼ÒºñÀÚ ÁÖµµ·Î ¹Ù²î¾ú°í ¼ÒºñÀÚÀÇ ÃëÇâÀº
ÇÏ·ç°¡ ´Ù¸£°Ô º¯Çϸç, ±â¾÷°£ÀÇ °æÀïÀº ³¯·Î ½Éȵǰí ÀÖ´Ù. ÀÌ·¯ÇÑ È¯°æ¿¡¼ ±â¾÷ÀÌ
»ýÁ¸ÇÏ°í ¹ßÀüÇϱâ À§Çؼ´Â Áö¼ÓÀûÀ¸·Î ¼ÒºñÀÚÀÇ µ¿ÇâÀ» ÆÄ¾ÇÇϰí, ÀÚ»ç´Â ¹°·Ð
°æÀï»çÀÇ °æ¿µ Àü·«À» È¿°úÀûÀ¸·Î ºÐ¼®ÇÏ°í ´ëóÇÒ ¼ö ÀÖ´Â ´É·ÂÀÌ Àý½ÇÇÏ°Ô ¿ä±¸µÇ´Âµ¥,
À̸¦ °¡´ÉÇÏ°Ô ÇÏ´Â °ÍÀÌ ¹Ù·Î Á¤º¸´Ù. µû¶ó¼ Á¤º¸È ½Ã´ëÀÇ ±â¾÷°æ¿µ¿¡¼ Á¤º¸¶õ
ÀüÅëÀûÀÎ ÀÚ¿øµéÀ» È¿°úÀûÀ¸·Î ¿î¿µ·°ü¸®ÇÏ¸ç »õ·Î¿î Á¦Ç°À̳ª ¼ºñ½º¸¦ âÃâÇÏ´Â
¿ªÇÒÀ» ´ã´çÇÏ´Â ¶Ç ´Ù¸¥ ÀÚ¿øÀ¸·Î¼, À̰ÍÀ» Á¦´ë·Î ¼öÁýÇϰí Ȱ¿ëÇÒ ¼ö ÀÖ´Â ±â¾÷¸¸ÀÌ
°æÀï¿¡¼ »ì¾Æ³²°í ¿ìÀ§¸¦ È®º¸ÇÏ°Ô µÇ´Â °ÍÀÌ´Ù.
70³â´ë¸¸ ÇÏ´õ¶óµµ Á¤º¸±â¼úÀº ÀϺΠ¿¬±¸¼Ò³ª ÇÐ°è µî Æ¯Á¤Á÷¿¡ Á¾»çÇÏ´Â »ç¶÷µéÀÇ ÀüÀ¯¹°·Î ¿©°ÜÁ³´Ù. ±×·¯³ª 80³â´ë Áß¹Ý ÀÌÈÄ °³Àοë ÄÄÇ»ÅͰ¡ ½ÃÀåÀ» ÁÖµµÇϱ⠽ÃÀÛÇÏ¸é¼ Àü¹® Áö½ÄÀÌ º°·Î ¾ø´Â ÀÏ¹Ý »ç¿ëÀڵ鵵 ÄÄÇ»Å͸¦ ½±°Ô »ç¿ëÇÒ ¼ö Àִ ȯ°æÀÌ Á¶¼ºµÇ¾ú´Ù. µ¥ÀÌÅ͸¦ ÀúÀåÇϰí ó¸®ÇÏ´Â ¼º´É ¶ÇÇÑ ±Þ¼Óµµ·Î ¹ßÀüÇϰí Àմµ¥ ¿¹¸¦ µé¾î, 2000³â ÀÌÈÄ¿¡³ª °¡´ÉÇϸ®¶ó ¿¹»óÇß´ø ±â°¡ ¹ÙÀÌÆ®±Þ Çϵåµð½ºÅ©³ª 300MHzÀÌ»óÀÇ CPU°¡ ÀÌ¹Ì °³Àοë ÄÄÇ»ÅÍ¿¡ ÀåÂøµÇ°í ÀÖ´Ù. Çϵå¿þ¾îÀÇ ¹ßÀü°ú ´õºÒ¾î ¼ÒÇÁÆ®¿þ¾î Ãø¸é¿¡¼µµ Áö´ÉÀ» °®Ãá µ¥ÀÌÅÍ ºÐ¼®½Ã½ºÅÛÀ» °³¹ßÇϱâ À§ÇÑ ³ë·ÂÀÌ 80³â´ë ÀÌÈĺÎÅÍ ²ÙÁØÈ÷ ÁøÇàµÇ¾î ¿Ô´Âµ¥, ÇнÀ´É·Â(learning ability)À» °®Ãá ¾Ë°í¸®ÁòÀ̳ª ÇÁ·Î±×·¥µéÀÌ ÁÖ¿ä ´ë»óÀ̾ú´Ù. ¿©±â¼ ÇнÀ´É·ÂÀ̶õ ¹Ì¸® Á¤ÇØÁø ¼ø¼¿Í ÀýÂ÷¿¡ µû¶ó ¹®Á¦¸¦ ÇØ°áÇÏ´Â ÀüÅëÀûÀÎ ÇÁ·Î±×·¡¹Ö ¹æ½Ä°ú´Â ´Þ¸® ÁÖ¾îÁø ·¹ÄÚµåµé·ÎºÎÅÍ Ãß·ÐÀ̳ª Á÷°üÀû ÆÇ´ÜÀ» ÅëÇØ ½º½º·Î ¹®Á¦ ÇØ°áÀ» ²ÒÇÏ´Â ´É·ÂÀ» ÀǹÌÇÑ´Ù. ÀÌ·¸µí ÇнÀ´É·ÂÀ» Áö´Ñ ÇÁ·Î±×·¥ÀÇ µîÀåÀº ÄÄÇ»ÅÍÀÇ °¡°øÇÒ ¸¸ÇÑ Á¤º¸Ã³¸® ´É·Â»Ó ¾Æ´Ï¶ó Á¤º¸Åë½Å ±â¼úÀÇ Á¤º¸À¯Åë ±â´É°ú ¿¬°èÇÏ¿© ´ë·®ÀÇ µ¥ÀÌÆ®¸¦ ½Ç½Ã°£¿¡ ºÐ¼®Çϰí À̸¦ ÅëÇØ °æ¿µÀü·«À» ¼ö¸³ÇÒ ¼ö ÀÖ´Â ±æÀ» ¿¾ú´Ù.
Àü¹®°¡½Ã½ºÅÛÀº ÀΰøÁö´ÉÀÇ ÇÑ ºÐ¾ß·Î¼ ƯÁ¤ ºÐ¾ß¿¡¼ Àü¹®°¡ÀÇ
ÃàÀûµÈ Áö½Ä°ú °æÇèÀ» ½Ã½ºÅÛÈÇÏ¿©, ÇÊ¿äÇÒ ¶§ »ç¿ëÇϵµ·Ï ÇÏ´Â ¼ÒÇÁÆ®¿þ¾îÀÌ´Ù.
¿©±â¼ 'Áö½Ä(knowledge)'À̶ó´Â ¿ë¾î´Â 'Á¤º¸(information)'¿Í È¥¿ëÇÏ¿© »ç¿ëµÇ±âµµ
ÇÏ¸ç ±¸ºÐµÇ±âµµ Çϴµ¥, µ¥ÀÌÅÍ °üÁ¡¿¡¼ ¾ö¹ÐÇÏ°Ô Á¤ÀÇÇϸé Á¤º¸¶õ µ¥ÀÌÅ͸¦ °¡°ø·Ã³¸®Çؼ
¾ò¾îÁö´Â »êÃâ¹°À̰í, Áö½ÄÀ̶õ Á¤º¸ÀÇ Ã¼°èÀûÀΠȰ¿ëÀ» ÅëÇØ ÃàÀûµÈ ³ëÇÏ¿ìÀÌ´Ù.
¿¹¸¦ µé¸é, Àϱ⿹º¸¸¦ Çϱâ À§Çؼ´Â ±¸¸§ÀÇ À̵¿, ¹Ù¶÷ÀÇ ¹æÇâ ¹× ¼Óµµ µî°ú °°Àº
µ¥ÀÌÅ͵éÀÌ ÇÊ¿äÇϸç, À̵éÀ» ºÐ¼®ÇÏ¿© "±ÝÀÏ ºñ°¡ ¿Ã È®·üÀº 70%ÀÌ´Ù."¶ó°í
¾òÀº °á·ÐÀÌ Á¤º¸´Ù. ±×¸®°í ÀÌ·¯ÇÑ Á¤º¸¿Í °ú°ÅÀÇ °æÇèÀ» ±Ù°Å·Î "ºñ¿Ã È®·üÀÌ
60% ÀÌ»óÀÌ¸é ¿ì»êÀ» ÁغñÇ϶ó!"¶ó´Â Áö½ÄÀ» µµÃâÇÒ ¼ö ÀÖ´Ù. Á¤º¸´Â ±× ÀÚü·Î¼µµ
±â¾÷ °æÀï·ÂÀÇ ¿øÃµÀÌ µÇÁö¸¸, Áö½ÄÀ¸·Î ¹ßÀüÇÏ°Ô µÇ¸é °æÀï·ÂÀº ´õ¿í °ÈµÈ´Ù.
Àü¹®°¡½Ã½ºÅÛÀº 1960³â´ë¿¡ ÈÇÕ¹°ÀÇ ±¸Á¶¸¦ ÃßÁ¤Çϱâ À§ÇØ ¸¸µé¾îÁø
µ§µå·²(DENDRAL)½Ã½ºÅÛÀÌ ½ÃÃʰ¡ µÇ¾î ¹ßÀüÇÏ¿´´Ù. ±× ÈÄ ÀÇ·áÁø´Ü½Ã½ºÅÛÀÎ ¸¶À̽Å(MYCIN),
±¤¹°Å½»ç½Ã½ºÅÛÀÎ ÇÁ·Î½ºÆåÅÍ(PROSPECTOR) µîÀÌ 1970³â´ë¿¡ ¸¸µé¾îÁ³À¸¸ç, ±â°è°íÀå
Áø´Ü, ¼³°è Áö¿ø, ¼ÕÇØ¹è»ó ÆÇÁ¤ µî »ê¾÷°èÀÇ Àü ºÐ¾ß¿¡¼ ±¤¹üÀ§ÇÏ°Ô ÀÀ¿ëµÇ°í ÀÖ´Ù.
Àü¹®°¡½Ã½ºÅÛÀÇ ±¸¼º¿ä¼Ò Áß ÇÙ½ÉÀÌ µÇ´Â Áö½Äº£À̽º(knowledge-base)¿¡´Â Àü¹®°¡ÀÇ
Áö½ÄÀ» ÀúÀåÇϴµ¥, °ú°Å¿¡´Â ÁÖ·Î ÇØ´ç ºÐ¾ß Àü¹®°¡¿ÍÀÇ ÀÎÅͺ䳪 Àü¹®¼Àû µîÀ»
Åä´ë·Î ±¸ÃàÇÏ¿´´Ù. ±×·¯´ø °ÍÀÌ ±â¾÷ȯ°æÀÇ ±Þ¼ÓÇÑ º¯È¿Í ½Ã½ºÅÛÀ» ÀÌ¿ëÇØ ÇØ°áÇϰíÀÚ
ÇÏ´Â ¹®Á¦¿µ¿ªÀÌ Á¡Â÷ È®´ëµÇ°í º¹ÀâÇØÁü¿¡ µû¶ó ÇØ´ç ºÐ¾ß¿¡ Åë´ÞÇÑ Àü¹®°¡¸¦ ã±â°¡
¾î·Á¿öÁö¸é¼ Áö½Äȹµæ¿¡ Àå±â°£¿¡ °ÉÃÄ ¸¹Àº ºñ¿ëÀ» ÅõÀÚÇØ¾ß ÇÏ´Â °æÁ¦ÀûÀÎ ¹®Á¦¿¡
ºÀÂøÇÏ¿´´Ù. À̰ÍÀ» ¼ÒÀ§ 'Áö½ÄȹµæÀÇ º´¸ñÇö»ó (knowledge acquisition bottle-neck)'À̶ó
Ç¥ÇöÇϴµ¥, ÀÌ·Î ÀÎÇØ µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ¿© ÀÚµ¿ÀûÀ¸·Î Áö½ÄÀ» ÃßÃâÇØ ³»´Â ¹æ¾È¿¡
´ëÇÑ ¿ä±¸°¡ ±Þ¼ÓÈ÷ Áõ°¡Çϰí ÀÖ´Â °ÍÀÌ´Ù.
³²¾Æ¸Þ¸®Ä« Ãâ½Å ÀÛ°¡ Á¶Áö ·çÀ̽º(George Louis)´Â ÀÚ½ÅÀÇ
¼Ò¼³ '¹Ùº§ µµ¼°ü(The Library of Babel)'¿¡¼ ³¡¾øÀÌ ÆîÃÄÁø ¹«ÇÑÇÑ ±Ô¸ðÀÇ µµ¼°ü(infinite
library)¿¡ ´ëÇØ ¹¦»çÇϰí ÀÖ´Ù. ÀÌ µµ¼°ü¿¡´Â ¼Àûµé·Î °¡µæ Âù ¿¶÷½ÇµéÀÌ ¹«¼öÈ÷
¿¬°áµÇ¾î ÀÖÀ¸³ª ¸ðµç ¼ÀûµéÀº ±× ³»¿ëÀ» ¾Ë ¼ö ¾øÀ¸¸ç Á¦¸ñµµ 'a*%$#$^$@!'¿Í °°ÀÌ
ÀÌÇØÇÒ ¼ö ¾ø´Â ¹®ÀÚ·Î ¾º¿©ÀÖ¾î Àǹ̸¦ ÇØ¼®ÇÏ´Â °ÍÀÌ ºÒ°¡´ÉÇÏ´Ù. À̰÷ÀÇ »ç¶÷µéÀº
¿øÇϴ åÀ» ã±â À§ÇØ ¿©±âÀú±â¸¦ Çì¸Å´Ù°¡ ÇÑ Æò»ýÀ» ÇãºñÇϰí ÇÐÀÚµéÀº "µµ¼°ü
¾îµò°¡¿¡ µµ¼ ¸ñ·ÏÀÌ ÀÖÀ» °ÍÀÌ´Ù.", "±× Ã¥ÀÌ µµ¼°ü ¾îµò°¡¿¡ ºÐ¸íÈ÷
ºñÄ¡µÇ¾î ÀÖÀ» °ÍÀÌ´Ù." µîÀÇ ¸»¸¸ µÇÇ®ÀÌÇÑ´Ù (ÀÚ·á¿ø : Data Mining by Adriaans,
P. and Aantinge, D., Syllogic, 1998).
ÀÌ ¼Ò¼³Àº ¿À´Ã³¯ Á¤º¸±â¼ú
¹®¸íÀÇ ÇýÅÃÀ» ¹ÞÀ¸¸ç »ì¾Æ°¡´Â ¿ì¸®¿¡°Ô ÀǹÌÇÏ´Â ¹Ù°¡ Å©´Ù. Á¤º¸±â¼úÀÇ ºü¸¥ ¹ßÀüÀº
¾÷¹«ÀÇ ÀÚµ¿È¸¦ ÃËÁø½ÃÄÑ ¾öû³ ¾çÀÇ µ¥ÀÌÅ͸¦ ÀüÀÚÀûÀ¸·Î ¼öÁýÇÏ°í º¸°üÇÏ´Â °ÍÀ»
°¡´ÉÇÏ°Ô ÇÏ¿´´Ù. ½ÇÁ¦·Î ÃÖ±Ù¿¡ ¹ßÇ¥µÈ ÇÑ º¸°í¼¿¡ µû¸£¸é ¼¼»ó¿¡¼ ÀüÀÚÀûÀ¸·Î
¼öÁýµÇ´Â µ¥ÀÌÅÍÀÇ ¾çÀº ¸Å³â ±âÇϱ޼öÀûÀ¸·Î Áõ°¡Çϰí ÀÖÀ¸¸ç, ´ë±â¾÷¿¡¼ ÀÏÁÖÀÏ
µ¿¾È ±â¾÷ Ȱµ¿À» ÅëÇØ ¼öÁýÇÏ´Â µ¥ÀÌÅÍ´Â ÀϹÝÀÎÀÌ Æò»ý¿¡ °ÉÃÄ Àд µ¥ÀÌÅÍÀÇ ¾çº¸´Ù
¸¹´Ù°í ÇÑ´Ù. ÀÌ·¸µí ¿ì¸®´Â µ¥ÀÌÅÍÀÇ È«¼ö ¼Ó¿¡¼ ¸¹Àº ¾çÀÇ µ¥ÀÌÅ͸¦ ÃàÀûÇØ ¿Ô´Ù.
±×¸®°í ÀÌ·¸°Ô µ¥ÀÌÅ͸¦ ÃàÀûÇÏ°Ô µÈ ¹è°æÀÇ Àϸ鿡´Â ±× ¾È¿¡ ¹«¾ùÀΰ¡°¡ ÀÖÀ¸¸®¶ó´Â
±â´ë°¡ Á¸ÀçÇÑ´Ù. ±â¾÷°æ¿µ Ãø¸é¿¡¼ º¼ ¶§ µ¥ÀÌÅÍ´Â Áß¿äÇÑ ½ÃÀå, °æÀïÀÚ, °í°´
µî¿¡ °üÇÑ Á¤º¸¸¦ ³»ÀçÇϰí ÀÖ´Ù. »ý»ê°ü¸® Ãø¸é¿¡¼ µ¥ÀÌÅʹ ó¸®°úÁ¤À» Çâ»ó½Ã۰í,
¹®Á¦¸¦ ÇØ°áÇÏ´Â ¹æ¹ý»Ó¸¸ ¾Æ´Ï¶ó ¿î¿µÀÇ ÃÖÀûÈ ±âȸ¸¦ Á¦°øÇÑ´Ù. ±×·¯³ª °¡°øµÇÁö
¾ÊÀº µ¥ÀÌÅÍ ÀÚü´Â ¾Æ¹«·± Àǹ̰¡ ¾ø´Ù. µ¥ÀÌÅÍÀÇ ¾çÀÌ ¿À´Ã³¯°ú °°ÀÌ ¹æ´ëÇÏÁö
¾Ê¾Ò´ø °ú°Å¿¡´Â ¼Ò¼öÀÇ Àü¹®°¡µéÀÌ Åë°è±â¹ýÀ̳ª ÁúÀÇ µîÀ» ÅëÇØ µ¥ÀÌÅ͸¦ ºÐ¼®Çϰí
¿ä¾àµÈ °á°ú¸¦ º¸°í¼ Çü½ÄÀ¸·Î Á¦°øÇϰï Çß´Ù. ÀÌ·¯ÇÑ Á¢±Ù¹ýÀº µ¥ÀÌÅÍÀÇ ¾çÀÌ Áõ°¡Çϰí
Â÷¿ø(¼Ó¼º)ÀÇ ¼ö°¡ Áõ°¡ÇÒ¼ö·Ï È¿À²¼ºÀÌ ¶³¾îÁö°í, ºÐ¼®À» ÅëÇØ ¾òÀ» ¼ö ÀÖ´Â Á¤º¸ÀÇ
ǰÁúµµ ±â´ëÇÏ±â ¾î·Æ°Ô µÈ´Ù. °ú¿¬ ´©°¡ ¼ö ¹é°¡ÁöÀÇ ¼Ó¼ºÀ¸·Î ±¸¼ºµÈ ¼ö¹é±â°¡
¶Ç´Â Å×¶ó ¹ÙÀÌÆ® »ó´çÀÇ µ¥ÀÌÅ͸¦ Á¦´ë·Î ÀÌÇØÇÏ°í ºÐ¼®ÇÒ ¼ö Àְڴ°¡? µû¶ó¼
µ¥ÀÌÅÍÀÇ È«¼ö¿Í Á¤º¸ÀÇ ºó°ïÀ̶ó´Â ȯ°æ¿¡ óÇÑ Áö±Ý, ±â¾÷µéÀº Á¤º¸±â¼úÀ» ÀÌ¿ëÇÏ¿©
µ¥ÀÌÅ͸¦ ¿©°úÇϰí, ºÐ¼®Çϸç, °á°ú¸¦ ÇØ¼®ÇÏ´Â ÀÚµ¿È µÈ µ¥ÀÌÅÍ ºÐ¼® ¹æ¾È¿¡ ³ôÀº
°ü½ÉÀ» °®°Ô µÇ¾ú´Ù.
Áö±Ý±îÁö
±â¾÷µéÀº °Å´ëÇÑ ¾çÀÇ ¾÷¹« µ¥ÀÌÅ͸¦ ÃàÀûÇØ ¿Ô°í ±×¾çÀº ¾Õ¼µµ ¼³¸íÇßµíÀÌ ÇâÈÄ¿¡µµ
°è¼Ó Áõ°¡ÇÒ Àü¸ÁÀÌ´Ù. ¿¹¸¦ µé¾î ¾à 2õ°³ÀÇ ¼Ò¸ÅÁ¡ üÀθÁÀ» °¡Áö°í ÀÖ´Â ¹Ì±¹ÀÇ
¿ù¸¶Æ®(Wal-Mart)¿¡´Â ¸ÅÀÏ 2õ¸¸°ÇÀÇ ÆÇ¸Å ·¹Äڵ尡 Ãß°¡ ¶Ç´Â °»½ÅµÇ°í ÀÖ°í, ¿¡ÀÌÆ¼¿£Æ¼(AT&T)ÀÇ
Åë½Å¸Á ÀÌ¿ë¿ä±Ý °ü¸®½Ã½ºÅÛÀÇ °æ¿ì, ±â·ÏµÇ´Â ·¹Äڵ尡 ÇÑ ´Þ¿¡¸¸ ¼ö±â°¡ ¹ÙÀÌÆ®¿¡
À̸¥´Ù. ÀÌµé µ¥ÀÌÅÍ´Â °ü·Ã ¾÷¹«¸¦ ó¸®ÇÑ °á°ú·Î ÃàÀûµÈ °ÍÀÌÁö¸¸ ´Ù¸¥ ÇÑÆíÀ¸·Î
»ý°¢ÇØ º¸¸é ½ÇÁ¦·Î ¾÷¹« ÇöÀåÀÇ ´Ù¾çÇÑ Æ¯¼ºÀ» ¹Ý¿µÇϰí Àֱ⠶§¹®¿¡ ±× ¼Ó¿¡´Â
±â¾÷µéÀÌ ¹Ìó ¹ß°ßÇÏÁö ¸øÇÑ ±ÍÁßÇÑ Á¤º¸¿Í ±â¾÷ÀÇ Àü·« ¼ö¸³¿¡ µµ¿òÀÌ µÉ ¸¸ÇÑ
ÈùÆ®°¡ ¼û¾î ÀÖÀ» ¼ö ÀÖ´Ù. ¿¹ÄÁ´ë ÇÑ ¹éÈÁ¡¿¡¼´Â ȸ¿øµéÀÇ ±¸¸Å µ¥ÀÌÅ͸¦ ºÐ¼®ÇÑ
°á°ú "¹ÖÅ©ÄÚÆ®¸¦ ±¸ÀÔÇÑ °í°´ÀÇ »ó´ç¼ö°¡ °¡Á×Ä¡¸¶¸¦ ÇÔ²² ±¸ÀÔÇÑ´Ù."¶ó´Â
´Ù¼Ò ¿¹±âÄ¡ ¸øÇÑ Á¤º¸¸¦ ¾òÀ» ¼ö ÀÕ´Ù. ÀÌ·¯ÇÑ Á¤º¸´Â "°¡Á×Ä¡¸¶¸¦ ±¸ÀÔÇÏ´Â
°í°´Àº ·ÕºÎÃ÷µµ ±¸ÀÔÇÒ °ÍÀÌ´Ù."¿Í °°ÀÌ ÀÏ¹Ý ¸¶ÄÉÆÃ Àü¹®°¡µéÀÌ Åë»óÀûÀ¸·Î
»ý°¢ÇØ ³¾ ¼ö ÀÖ´Â Á¤º¸°¡ ¾Æ´Ò»Ó´õ·¯ ´Ù¸¥ ¹éÈÁ¡µé¿¡ Àû¿ëÇÒ ¸¸ÇÑ Á¤º¸µµ ¾Æ´Ï´Ù.
±×·¯³ª ÀÌ·¯ÇÑ Á¤º¸°¡ »ý¼ºµÈ °÷, Áï »ó±â ¹éÈÁ¡ÀÇ °æ¿ì´Â ÀÌ Á¤º¸¸¦ ¹Ù·Î ¸¶ÄÉÆÃ
Ȱµ¿¿¡ Ȱ¿ëÇÒ ¼ö°¡ Àִµ¥, ¿¹¸¦ µé¾î ¹ÖÅ©ÄÚÆ®¸¸À» ±¸ÀÔÇÑ È¸¿øµéÀ» ´ë»óÀ¸·Î ÇÏ¿©
°¡Á×Ä¡¸¶ »óǰÇÒÀαÇÀ» ¹ß¼ÛÇÑ´ÙµçÁö, »óǰ īŻ·Î±×¸¦ Á¦ÀÛÇÒ ¶§ ¹ÖÅ©ÄÚÆ®¿Í °¡Á×Ä¡¸¶¸¦
ÇÔ²² º¸¿©ÁÖ´Â Àü·«À» ±¸»óÇÒ ¼ö ÀÖ´Ù. ±×·¯³ª ¸î ±â°¡ ¹ÙÀÌÆ® ȤÀº Å×¶ó ¹ÙÀÌÆ®¿¡
À̸£´Â °Å´ëÇÑ ¾çÀÇ µ¥ÀÌÅ͸¦ ºÐ¼®Çϱâ¶õ ½±Áö ¾Ê±â ¶§¹®¿¡ ¸¹Àº ±â¾÷µéÀº ´Ü¼øÇÑ
Åë°è Á¤º¸¸¸À» ¾ò´Âµ¥ ±×Ä¡°Å³ª ¾Æ¿¹ ºÐ¼®ÇÒ ¾öµÎÁ¶Â÷ ³»Áö ¸øÇϰí, ÀÌ ±ÍÁßÇÑ ÀÚ»êÀ»
Á¦´ë·Î ÀÌ¿ëµÇÁö ¸øÇϰí ÀÖ´Ù. ÀÌ·¯ÇÑ ºÐ¼® ÀÛ¾÷À» Áö¿øÇÏ´Â Á¤º¸±â¼úÀÌ ¹Ù·Î data
miningÀÌ´Ù.
data miningÀ̶õ ÀÚµ¿ÈµÇ°í Áö´ÉÀ» °®Ãá(automated and intelligent)
µ¥ÀÌÅͺ£À̽º ºÐ¼®±â¹ýÀ¸·Î 90³â´ë ÃʹݺÎÅÍ Áö½Ä¹ß°ß(KDD: Knowledge Discovery
in Databases), Á¤º¸¹ß°ß(information discovery), Á¤º¸¼öÈ®(information harvesting)
µîÀÇ À̸§À¸·Îµµ ¼Ò°³µÇ¾î ¿Ô´Âµ¥ ÀϹÝÀûÀ¸·Î "´ë·®ÀÇ µ¥ÀÌÅͷκÎÅÍ »õ·Ó°í
ÀǹÌÀÖ´Â Á¤º¸¸¦ ÃßÃâÇÏ¿© ÀÇ»ç°áÁ¤¿¡ Ȱ¿ëÇÏ´Â ÀÛ¾÷"À̶ó Á¤ÀǵȴÙ. ¿ë¾î¿¡
'ä±¼ÇÏ´Ù'¶ó´Â ÀǹÌÀÇ 'mining'À» Æ÷ÇÔ½ÃŲ ÀÌÀ¯´Â µ¥ÀÌÅͷκÎÅÍ Á¤º¸¸¦ ã¾Æ³»´Â
ÀÛ¾÷ÀÌ ¸¶Ä¡ ±ÝÀ̳ª ´ÙÀ̾Ƹóµå¸¦ ¹ß°ßÇϱâ Àü¿¡ ¼ö ¸¹Àº ¾çÀÇ Èë°ú Àâ¼®µéÀ» ÆÄÇìÄ¡°í
Á¦°ÅÇÏ´Â °Í°ú À¯»çÇÏ´Ù´Â µ¥¿¡ ±âÀÎÇÑ´Ù.
¼ÀûÀ̳ª ³í¹®µéÀ» Á¢Çغ¸¸é data mining°ú Áö½Ä¹ß°ß(KDD)À̶ó´Â ¿ë¾î¸¦ È¥¿ëÇØ¼ »ç¿ëÇÏ´Â °æ¿ì°¡ ¸¹¾Æ µ¶ÀÚµéÀÌ È¥µ¿ÇϱⰡ ½±´Ù. °³³äÀÌ ¼Ò°³µÇ´ø ÃÊâ±â¿¡´Â data miningÀ̶ó´Â ¿ë¾î´Â ƯÈ÷ Åë°èÇÐÀÚ, µ¥ÀÌÅͺ£À̽º ¿¬±¸°¡, ±×¸®°í ±â¾÷ü¿¡¼ ¸¹ÀÌ »ç¿ëÇÑ ¹Ý¸é, Áö½Ã¹ß°ßÀÇ °æ¿ì´Â ÀΰøÁö´ÉÀ̳ª Àü¹®°¡½Ã½ºÅÛ °ü·Ã ¿¬±¸¿¡ ÁÖ·Î µîÀåÇÏ¿´´Ù. ±×·¯³ª 1995³â ij³ª´Ù ¸óÆ®¸®¾ó¿¡¼ °³ÃÖµÈ Áö½Ä¹ß°ß°ú data mining¿¡ °üÇÑ ±¹Á¦ Çмú´ëȸ (The first international conference on knowledge discovery & data mining)¿¡¼ Áö½Ä¹ß°ßÀº µ¥ÀÌÅͷκÎÅÍ À¯¿ëÇÑ Á¤º¸¸¦ ¹ß°ßÇÏ´Â ÇÁ·Î¼¼½ºÀÇ Àü °úÁ¤À̶ó ÇÏ¿´°í, data miningÀº Áö½Ä¹ß°ß ÇÁ·Î¼¼½º Áß¿¡¼ µ¥ÀÌÅͷκÎÅÍ Á¤º¸¸¦ ÃßÃâÇϱâ À§Çؼ ±â¹ýÀ» Àû¿ëÇϴ ƯÁ¤ ´Ü°è¶ó Á¦¾ÈÇß´Ù. ÀÌ Ã¥¿¡¼ ¿ì¸®´Â À§ÀÇ Á¤ÀǸ¦ µû¸£°íÀÚ ÇÑ´Ù. ÀϹÝÀûÀ¸·Î Áö½Ä¹ß°ß ÇÁ·Î¼¼½º´Â µ¥ÀÌÅÍ ¼±ÅÃ, Á¤Á¦, º¸¿Ï, º¯È¯, data mining ±â¹ý ¼±Åà ¹× Àû¿ë, ¸ðÇüÀÇ Æò°¡¿Í °°Àº ¿©¼¸ ´Ü°è·Î ±¸¼ºµÈ´Ù.
data mining˼ OLAP(On-Line
Analytical Processing)°ú °°Àº ´ÙÂ÷¿øºÐ¼®(multi-dimensional analysis) µµ±¸³ª
ÀϹÝÁúÀÇ(query) µî°ú °°Àº ±âÁ¸ÀÇ µ¥ÀÌÅͺ£À̽º Á¶È¸ µµ±¸¿Í ¾î¶»°Ô ´Ù¸¥°¡? °ú¿¬
data miningÀº ±âÁ¸ÀÇ ¹æ½ÄÀ¸·Î´Â Á¶È¸ÇÒ ¼ö ¾ø¾ú´ø Á¤º¸¸¦ ã¾Æ Áִ°¡?
°á·ÐºÎÅÍ
¸»ÇÏÀÚ¸é data miningÀº ±âÁ¸ÀÇ Á¶È¸ µµ±¸¸¦ ´ëüÇÏ´Â °ÍÀÌ ¾Æ´Ï¶ó º¸¿ÏÇÏ´Â ±â´ÉÀ»
Á¦°øÇÏ´Â °ÍÀÌ´Ù. ÇÏÁö¸¸ data miningÀ» ÅëÇØ Ãß°¡ÀûÀ¸·Î ¾ò°ÔµÇ´Â Á¤º¸ÀÇ °¡Ä¡´Â
±×¾ß¸»·Î ¹«ÇÑÇÏ´Ù. ¾î´À À¯Åë¾÷ü°¡ ¼ö³â°£ÀÇ ¿µ¾÷Ȱµ¿À» ÅëÇØ »ó´çÇÑ ¾çÀÇ °í°´
±¸¸Åµ¥ÀÌÅ͸¦ ¼öÁýÇÏ¿© °ü¸®Çϰí ÀÖ´Ù°í °¡Á¤ÇØ º¸ÀÚ. µ¥ÀÌÅÍ Á¶È¸¸¦ À§ÇØ °¡Àå ¸¹ÀÌ
»ç¿ëÇÏ´Â ÀϹÝÁúÀÇ´Â "1998³â 12¿ù¿¡ AÁ¦Ç°À» ±¸¸ÅÇÑ °í°´ ¸í´ÜÀ» Á¶È¸ÇϽÿÀ.",
"1999³â »ó¹Ý±â¿¡ RÁö¿ªÀÇ AÁ¦Ç° ÆÇ¸ÅÇöȲÀ» º¸¿©ÁֽÿÀ." µîÀÇ Çü½ÄÀ»
ÃëÇϸç, Å×À̺íÀÇ ÇüÅ·Π°á°ú¸¦ Á¦°øÇÑ´Ù. ÀÌ¿¡ ¹ÝÇØ N°³ÀÇ µ¶¸³µÈ ¼Ó¼ºÀ¸·Î ±¸¼ºµÈ
µ¥ÀÌÅ͸¦ NÂ÷¿ø(dimension) °ø°£¿¡¼ ºÐ¼®ÇÑ´Ù´Â °³³äÀ» ±â¹ÝÀ¸·Î ÇÏ´Â OLAP µµ±¸´Â
µ¥ÀÌÅ͸¦ ´ÙÂ÷¿øÀ¸·Î ºÐ¼®Çϸç, °á°ú¸¦ ÁÖ·Î ÀÌÇØÇϱ⠽¬¿î Â÷Æ®ÀÇ ÇüÅ·ΠÁ¦°øÇÑ´Ù.
OLAP µµ±¸¸¦ ÀÌ¿ëÇÏ¿© "RÁö¿ª¿¡¼´Â ¾î¶² »óǰµéÀÌ ÆÈ·È´ÂÁö¸¦ ¿ùº° ¹× °í°´
¿¬·É´ëº°·Î º¸¿©ÁֽÿÀ."¶ó´Â Á¶È¸¸¦ ÇÒ °æ¿ì À̰ÍÀº 4Â÷¿ø(»óǰ, Áö¿ª, ±â°£,
¿¬·É) ÁúÀÇ¿¡ ÇØ´çÇÑ´Ù. ±×¸² 1Àº °¡ÀüÁ¦Ç°»ç¿¡¼ OLAPÀ» ÀÌ¿ëÇÏ¿© ƯÁ¤Áö¿ªÀÇ
Á¦Ç° ÆÇ¸ÅÇöȲÀ» ¿ùº°, ¿¬·É´ëº°·Î Á¶È¸ÇÑ °á°úÀ̸ç, ±×¸² 2´Â ½Å¿ëÄ«µå»ç¿¡¼
°í°´µéÀÇ Ä«µå µµ¿ëÇöȲÀ» Áö¿ªº°, µµ¿ëÀ¯Çüº°·Î ºÐ¼®ÇÑ È¸éÀÌ´Ù.
±×¸² 1 OLAPÀ» ÀÌ¿ëÇÑ ¿ùº°, ¿¬·É´ëº° ¸ÅÃâÇöȲ ºÐ¼®
±×¸² 2 OLAPÀ» ÀÌ¿ëÇÑ Áö¿ªº°, »ç±âÀ¯Çüº° ½Å¿ëÄ«µå µµ¿ëÇöȲ ºÐ¼®
ÀϹÝÁúÀdzª OLAP µµ±¸ µîÀÇ ±âÁ¸ Á¶È¸ ¹æ½Ä°ú´Â ´Þ¸® data miningÀº µ¥ÀÌÅÍ¿¡ ¼û°ÜÁ® ÀÖ´Â Á¤º¸¸¦ ã¾Æ³»´Âµ¥ »ç¿ëÇÑ´Ù. ¿¹¸¦ µé¾î "A¶ó´Â Á¦Ç°À» ±¸¸ÅÇÏ´Â °í°´µéÀÇ Æ¯¼ºÀº ¹«¾ùÀΰ¡?", "B»óǰÀ» À§ÇÑ À̺¥Æ®¿¡ ¾î¶² °í°´µéÀ» ÃÊ´ëÇÒ °ÍÀΰ¡?" µî°ú °°Àº Á¶È¸ÀÇ °á°ú¸¦ µµÃâÇϱâ À§ÇØ ±âÁ¸ÀÇ Á¶È¸¹æ½ÄÀ» ÀÌ¿ëÇÑ´Ù°í °¡Á¤Çغ¸ÀÚ. ¹°·Ð ±â´ëÇÏ´Â °á°ú¸¦ ¾òÀ» ¼öµµ ÀÖ´Ù. ±×·¯³ª ±âÁØÀÌ µÇ´Â ¼Ó¼ºµéÀ» »çÀü¿¡ ÆÄ¾ÇÇÒ ¼ö ¾ø±â ¶§¹®¿¡ °á°ú¸¦ ¾ò±â À§Çؼ´Â ¼ö¸¹Àº ½Ãµµ¿Í ½ÇÆÐ°¡ ¿ä±¸µÈ´Ù. ´Ù½Ã ¸»ÇÏÀÚ¸é Áö±Ý±îÁö µ¥ÀÌÅÍÀÇ ºÐ¼®°ú Ȱ¿ë¿¡ »ç¿ëµÇ¾î ¿Â ÁúÀdzª OLAP µµ±¸, ±×¸®°í À̵éÀ» ±â¹ÝÀ¸·Î ¸¸µé¾îÁø ÀÇ»ç°áÁ¤Áö¿ø½Ã½ºÅÛ(decision support systems)À̳ª Áß¿ªÁ¤º¸½Ã½ºÅÛ(executive information systems)µîÀº ±×¸² 3¿¡¼ º¸¿©ÁÖµíÀÌ ¿øÄ¢ÀûÀ¸·Î ¹Ì¸® °¡¼³(Á¤º¸)À» ¼¼¿ì°í µ¥ÀÌÅ͸¦ ÅëÇØ ±× °¡¼³À» È®ÀÎÇÏ´Â ¹æ½ÄÀ̾ú´Ù. Áï »ç¿ëÀÚ°¡ ÀÚ½ÅÀÇ °æÇè¿¡ ºñÃß¾î °¡¼³À» ¼¼¿ì°í, ¿©±â¿¡ ¸ÂÃß¾î ÁúÀǸ¦ ¸¸µé¾î ½ÇÇàÇϸç, °á°ú¸¦ °ËÅäÇÏ¿© °¡¼³ÀÌ ¸Â´ÂÁö Ʋ¸®´ÂÁö¸¦ È®ÀÎÇÏ´Â °ÍÀÌ´Ù. ¸¸¾à °¡¼³ÀÌ Æ²¸®´Ù´Â °á°ú°¡ ³ª¿Â °æ¿ì¿¡´Â È®ÀεǴ °á°ú°¡ ³ª¿Ã ¶§±îÁö, ȤÀº »ç¿ëÀÚ°¡ °¡¼³ÀÌ Æ²·È´Ù°í »ý°¢ÇÒ ¶§±îÁö ÁúÀǸ¦ ¹Ýº¹ÇÑ´Ù. ±×·¯³ª ÀÌ·¯ÇÑ ¹æ½ÄÀº ÀûÀýÇÑ °¡¼³À» ¼¼¿ï ¼ö ¾ø´Â »óȲ¿¡¼´Â Àû¿ëÇϱ⠰ï¶õÇϸç, °¡¼³ÀÌ È®Àεǰųª ºÎÁ¤µÇ´Â °Í ¿Ü¿¡´Â »õ·Î¿î Á¤º¸°¡ °ÅÀÇ »ý¼ºµÇÁö ¾Ê´Â´Ù. ¾Õ¿¡¼ ¾ð±ÞÇßµíÀÌ ¹ÖÅ©ÄÚÆ®¿Í °¡Á×Ä¡¸¶ÀÇ °ü°è´Â ¿¹Àü¿¡´Â ÀüÇô ¿¹»óÇÏÁö ¸øÇß´ø Á¤º¸À̹ǷΠ°¡¼³Á¶Â÷ ¼¼¿ìÁö ¾Ê¾Æµµ ÄÄÇ»ÅͽýºÅÛÀÌ °¡´ÉÇÑ °¡¼³À» ½º½º·Î »ý¼ºÇϰí À̸¦ °ËÁõÇÏ´Â data miningÀº ±×¸² 4¿Í °°ÀÌ °¡¼³À» ¹ß°ßÇÏ´Â ¹æ½ÄÀ¸·Î »ç¿ëÀÚÀÇ °¡À̵带 °ÅÀÇ ¹ÞÁö ¾Ê°í Á¤º¸¸¦ ã´Â´Ù. Àß ¼³°èµÈ data mining µµ±¸´Â µ¥ÀÌÅͷκÎÅÍ ÂªÀº ½Ã°£ ³»¿¡ °¡´ÉÇÑ ÇÑ ´Ù¼öÀÇ À¯¿ëÇÑ °¡¼³À» »êÃâÇØ³»´Â ¹æ½ÄÀ¸·Î Á¤º¸¸¦ ¹ß°ßÇϵµ·Ï ¼³°èµÇ¾î ÀÖ´Ù.
±×¸² 3 °¡¼³ È®ÀÎ Áß½ÉÀÇ ±âÁ¸ Á¶È¸ ¹æ½Ä
±×¸² 4 °¡¼³ ¹ß°ß Áß½ÉÀÇ data mining ¹æ½Ä
ÀçÂ÷ °Á¶ÇϰíÀÚ ÇÏ´Â ¹Ù´Â ±âÁ¸ÀÇ Á¶È¸ ¹æ½Ä°ú data mining ¹æ½ÄÀº »óÈ£ º¸¿Ï °ü°è¿¡ ÀÖ´Ù´Â °ÍÀÌ´Ù. data miningÀº »óÈ£ º¸¿Ï °ü°è¿¡ ÀÖ´Ù´Â °ÍÀÌ´Ù. data miningÀº ±âÁ¸ÀÇ ¹æ½ÄÀ¸·Î´Â ¾òÀ» ¼ö ¾ø´Â Ãß°¡ÀûÀÎ Á¤º¸¸¦ Á¦°øÇÑ´Ù. ±×¸®°í ÀÌ·¯ÇÑ Á¤º¸´Â ±âÁ¸ÀÇ ¹æ½ÄÀ» ÅëÇØ °ËÁõµÈ´Ù. µû¶ó¼ ±âÁ¸ÀÇ Á¶È¸¹æ½ÄÀÌ Áö¿øÇÏÁö ¸øÇϴ ȯ°æ¿¡¼ data miningÀ» »ç¿ëÇÏ·Á´Â °ÍÀº ÀϹÝÀûÀ¸·Î µ¥ÀÌÅÍ¿¡ ³»ÀçµÇ¾î ÀÖ´Â Á¤º¸ÀÇ 90% Á¤µµ¸¦ Â÷ÁöÇÏ´Â ±âº» Á¤º¸´Â ¹«½ÃÇÑ Ã¤ 10% À̳»ÀÇ ¼û°ÜÁø Á¤º¸¸¸À» ã°Ú´Ù´Â ¹ß»óÀ¸·Î, ÀÌ´Â °ÈÁöµµ ¸øÇÏ´Â ¾Æ±â¿¡°Ô Áٳѱ⸦ °¡¸£Ä¡´Â °Í¿¡ ºñÀ¯ÇÒ ¼ö ÀÖ´Ù. ±×¸² 5´Â ÀϹÝÁúÀÇ, OLAP, ±×¸®°í data miningÀ» ÅëÇØ ¾òÀ» ¼ö ÀÖ´Â Á¤º¸ÀÇ ±íÀ̸¦ º¸¿©ÁÖ´Â ±×¸²ÀÌ´Ù.
±×¸² 5 ºÐ¼® ¹æ½Ä¿¡ µû¸¥ Á¤º¸ÀÇ ±íÀÌ
data mining ÀÛ¾÷ À¯ÇüÀº µ¥ÀÌÅ͸¦ ºÐ¼®ÇÏ¿© ¾î¶² Á¾·ùÀÇ Á¤º¸¸¦ ã°íÀÚ Çϴ°¡¿¡ µû¶ó ±¸ºÐµÈ´Ù. data miningÀ» ÅëÇØ µµÃâµÇ´Â Á¤º¸ÀÇ Á¾·ù´Â ´Ù¾çÇϳª ¿©±â¼´Â ³Î¸® ¾Ë·ÁÁø ´ëÇ¥ÀûÀÎ Á¾·ù ¸î °¡Áö¸¦ »ìÆìº¸°Ú´Ù.
"¾î¶² »óǰµéÀÌ
ÇÔ²² Àß ÆÈ¸®³ª?", "AÁ¦Ç°À» ±¸ÀÔÇÑ °í°´¿¡°Ô ¾î¶² Á¦Ç°À» ÇÔ²² ÆÈ ¼ö
ÀÖÀ»±î?", "Ä«µå»ç±â À¯Çü°£¿¡´Â ¾î¶² °ü°è°¡ ÀÖ³ª?" ÇÑ Ç׸ñÀÇ °ªÀ»
¾Ë °æ¿ì ´Ù¸¥ Ç׸ñÀÇ °ªÀ» ¿¹ÃøÇÒ ¼ö ÀÖ´Ù¸é µÎ Ç׸ñ°£¿¡´Â Á¾¼Ó(dependency) °ü°è°¡
Á¸ÀçÇÑ´Ù. ¿¬°ü ±ÔÄ¢À» ¹ß°ßÇÏ´Â ÀÛ¾÷À̶õ µ¥ÀÌÅÍ ¾È¿¡ Á¸ÀçÇÏ´Â Ç׸ñ°£ÀÇ Á¾¼Ó°ü°è¸¦
ã¾Æ³»´Â ÀÛ¾÷À̸ç, ¸¶ÄÉÆÃ¿¡¼´Â ¼Õ´ÔÀÇ Àå¹Ù±¸´Ï¿¡ µé¾îÀִ ǰ¸ñ°£ÀÇ °ü°è¸¦ ¾Ë¾Æº»´Ù´Â
Àǹ̿¡¼ Àå¹Ù±¸´Ï ºÐ¼®(market basket analysis)À̶ó°íµµ ÇÑ´Ù.
¿¬°ü±ÔÄ¢Àº
'(Ç׸ñA) & (Ç׸ñB) ¢¡ (Ç׸ñC)'ÀÇ ÇüÅ·εµ Ç¥ÇöÇϴµ¥, "Ç׸ñA¿Í Ç׸ñB¸¦
ÆûÇÔÇÑ °Å·¡´Â Ç׸ñCµµ Æ÷ÇÔÇÑ´Ù." ¶Ç´Â "ǰ¸ñA¿Í ǰ¸ñB¸¦ ±¸ÀÔÇÑ °í°´Àº
C¶ó´Â ǰ¸ñµµ ±¸ÀÔÇÑ´Ù." µîÀ¸·Î ÇØ¼®ÇÑ´Ù. ±×·¯³ª ÀÌ·¯ÇÑ ±ÔÄ¢µéÀº ½ÇÁ¦ µ¥ÀÌÅ͸¦
ºÐ¼®ÇÒ ¶§¿¡´Â 100% ½Å·Úµµ¸¦ °¡Áö´Â °æ¿ì°¡ °ÅÀÇ µå¹°±â ¶§¹®¿¡ Åë»óÀûÀ¸·Î È®·ùÀ̳ª
µµÇ¥ µîÀ» ÀÌ¿ëÇÏ¿© Á¤·®ÈÇÑ´Ù.
±×¸² 6Àº ³²¼ºÀÇ·ù »óÁ¡ÀÇ
POS½Ã½ºÅÛ¿¡ ÀúÀåµÈ µ¥ÀÌÅͷκÎÅÍ Á¦Ç°°£ÀÇ ¿¬°ü°ü°è¸¦ ã¾Æº¸´Â ¿¹·Î "³ØÅ¸ÀÌ(NT011)¸¦
±¸ÀÔÇÑ °í°´Àº ¼Åó(ST001)µµ ±¸ÀÔÇÑ´Ù."¿Í "Á¤Àå(FS123)°ú º§Æ®(BT432)¸¦
±¸ÀÔÇϸé ÄÚÆ®(CT005)µµ ÇÔ²² ±¸ÀÔÇÑ´Ù."°í ÇÏ´Â µÎ °¡Áö ¿¬°ü±ÔÄ¢À» ¹ß°ßÇÏ¿´´Ù.
ÀÌ¿Í °°Àº °á°ú¸¦ ÀÌ¿ëÇÏ¿© ¸ÅÀå¿¡ ³ØÅ¸ÀÌ(NT011)¿Í ¼ÅÃ÷(ST001)¸¦ ÇÔ²² Áø¿ÇÑ´ÙµçÁö,
īŻ·Î±× Á¦À۽à Á¤Àå(FS123)°ú º§Æ®(BT432)¸¦ ÄÚÆ®(CT005)¿Í ÇÔ²² ÆÐŰÁöÈÇÏ´Â
¸¶ÄÉÆÃ Àü·«À» ¼ö¸³ÇÒ ¼ö ÀÖ´Ù. ÀϹÝÀûÀ¸·Î ¿¬°ü±ÔÄ¢Àº Á¦Ç°À̳ª ¼ºñ½ºÀÇ ±³Â÷ÆÇ¸Å(cross
selling), ¸ÅÀåÁø¿(display), ÷ºÎ¿ìÆí(attached mailings), »ç±âÀû¹ß(fraud detection)
µîÀÇ ´Ù¾çÇÑ ºÐ¾ß¿¡ Ȱ¿ëµÈ´Ù.
±×¸² 6 POSµ¥ÀÌÅ͸¦ ÀÌ¿ëÇÑ ¿¬°ü±ÔÄ¢ ¹ß°ß
¿¬¼Ó±ÔÄ¢À̶õ
¿¬°ü±ÔÄ¢¿¡ ½Ã°£°ü·Ã Á¤º¸°¡ Æ÷ÇÔµÈ ÇüÅÂÀÌ´Ù. ¿¹¸¦ µé¾î, "Áö³ÁÖ¿¡ XÁÖ½ÄÀÌ
5ÀÏ µ¿¾È 10% ¿À¸£°í YÁÖ½ÄÀÌ °°Àº ±â°£ µ¿¾È 10~20% ¿Ã¶úÀ» ¶§, ±ÝÁÖ¿¡ ZÁÖ½ÄÀÌ
¿À¸¦ È®·üÀº 70%ÀÌ´Ù.", "»õ ³ÃÀå°í¸¦ ±¸ÀÔÇÑ °í°´ Áß ÇÑ ´Þ À̳»¿¡ »õ
¿ÀºìÀ» ±¸ÀÔÇÏ´Â °æÇâÀÌ ¸¹´Ù." µî°ú °°ÀÌ ½Ã°£»ó¿¡ ¼øÂ÷ÀûÀ¸·Î ³ªÅ¸³ª´Â »ç°ÇÀ̳ª
°Å·¡ÀÇ Á¾¼Ó°ü°è¸¦ ÀǹÌÇÑ´Ù.
±×¸² 7Àº ¿¬¼Ó±ÔÄ¢À» ã¾Æ³»´Â
¿¹¸¦ »óǰÆÇ¸Å µ¥ÀÌÅ͸¦ ÀÌ¿ëÇÏ¿© ¼³¸íÇϰí ÀÕ´Ù. µ¥ÀÌÅʹ ȸ¿øº°, °Å·¡ÀϺ°¿¡ µû¶ó
¿À¸§Â÷¼øÀ¸·Î Á¤¸®µÇ¾î Àִµ¥, 99³â 2¿ù 5ÀÏ¿¡ Aǰ¸ñÀ» ±¸ÀÔÇÑ 1¹ø ȸ¿øÀÌ 99³â
2¿ù 19ÀÏ¿¡ Hǰ¸ñµµ ±¸ÀÔÇÑ °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. ¸¶Âù°¡Áö·Î ȸ¿ø¹øÈ£°¡ 2¹ø, 4¹øÀÎ
°í°´µµ Aǰ¸ñÀ» ±¸ÀÔÇÑ ÈÄ Hǰ¸ñÀ» ±¸ÀÔÇß´Ù. ÀÌ·¯ÇÑ µ¥ÀÌÅ͸¦ ±Ù°Å·Î "Aǰ¸ñÀ»
±¸ÀÔÇÑ È¸¿øÀÌ ÇâÈÄ Hǰ¸ñÀ» ±¸ÀÔÇÒ °¡´É¼ºÀº 75%ÀÌ´Ù."¶ó´Â ¿¬¼Ó±ÔÄ¢À» µµÃâÇØ
³¾ ¼ö ÀÖÀ¸¸ç, 99³â 2¿ù 21ÀÏ¿¡ Aǰ¸ñÀ» ±¸ÀÔÇÑ 5¹ø ȸ¿ø¿¡°Ô Hǰ¸ñÀ» ±ÇÇÏ´Â ¸¶ÄÉÆÃ
Àü·«À» ¼¼¿ï ¼ö ÀÖ´Ù. À§¿¡¼ º¸µíÀÌ ¿¬¼Ó±ÔÄ¢¿¡´Â ½Ã°£ÀÇ È帧ÀÌ Æ÷ÇԵǾî ÀÖ±â
¶§¹®¿¡ ¿¬°ü±ÔÄ¢¿¡ ºñÇØ ´õ ±¸Ã¼ÀûÀ̸ç, ¸ñÇ¥(target) ¸¶ÄÉÆÃÀ̳ª ÀÏ´ëÀÏ(one-to-one)
¸¶ÄÉÆÃ¿¡ ¹Ù·Î Ȱ¿ëÇÒ ¼ö ÀÖ´Ù. ±×·¯³ª ¿¬¼Ó±ÔÄ¢À» ã±â À§Çؼ´Â µ¥ÀÌÅÍ¿¡ °Å·¡ÀÏÀ̳ª
°Å·¡Ç°¸ñ À̿ܿ¡µµ °í°´ÀÇ ±¸¸Å ÀÌ·Â(history) ¼Ó¼ºÀÌ ¹Ýµå½Ã ÇÊ¿äÇÏ´Ù´Â Á¶°ÇÀÌ
¸¸Á·µÇ¾î¾ß ÇÑ´Ù.
±×¸² 7 POSµ¥ÀÌÅ͸¦ ÀÌ¿ëÇÑ ¿¬¼Ó±ÔÄ¢ ¹ß°ß
µ¿¹°À» ÆÄÃæ·ù, Æ÷À¯·ù, ¾ç¼·ù µîÀ¸·Î, Àΰ£À» ȲÀÎÁ¾, ¹éÀÎÁ¾, ÈæÀÎÁ¾À¸·Î, ±×¸®°í ¼Ò°í±â¸¦ 1µî±Þ, 2µî±Þ, 3µî±ÞÀ¸·Î ºÐ·ùÇϵíÀÌ »ç¶÷µéÀº ÆíÀǸ¦ À§ÇØ ¼¼»óÀÇ ¸¹Àº »ç¹°À̳ª »ç°Ç µîÀÇ °³Ã¼¸¦ ºÎ·ù³ª µî±ÞÀ¸·Î ³ª´©°ï ÇÑ´Ù. ºÐ·ù´Â data mining¿¡¼ °¡Àå ¸¹ÀÌ »ç¿ëµÇ´Â ÀÛ¾÷À¸·Î ºÎ·ù°ªÀÌ Æ÷ÇÔµÈ °ú°ÅÀÇ µ¥ÀÌÅͷκÎÅÍ ºÎ·ùº° Ư¼ºÀ» ã¾Æ³»¾î ºÐ·ù¸ðÇüÀ» ¸¸µé°í, À̸¦ Åä´ë·Î »õ·Î¿î ·¹ÄÚµåÀÇ ºÎ·ù°ªÀ» ¿¹ÃøÇÏ´Â °ÍÀ» ÀǹÌÇÑ´Ù. ¿¹¸¦ µé¾î A¾÷ü°¡ »õ·Î¿î Åë½Å±â±âÀÇ ÇÁ·Î¸ð¼Ç ´ë»ó°í°´À» ¼±Á¤Çϱâ À§ÇØ ÀÓÀÇ·Î °í°´ Ç¥º»À» ÃßÃâÇÏ¿© ¿ìÆí¹°À» ¹ß¼ÛÇÏ¿´´Ù°í °¡Á¤ÇØ º¸ÀÚ. °í°´ ¹× ÀÀ´ä °á°ú µ¥ÀÌÅÍ¿Í ±àÁ¤ÀûÀÎ ¹ÝÀÀÀ» º¸ÀÎ ÀÀ´äÀÚÀÇ Æ¯¼ºÀº ±×¸² 8°ú °°´Ù. ¿©±â¼ ºÐ·ù±ÔÄ¢À» ¹ß°ßÇÏ´Â ÀÛ¾÷À̶õ '¿¹'¶ó°í ÀÀ´äÇÑ °í°´À̳ª '¾Æ´Ï¿À'¶ó°í ÀÀ´äÇÑ °í°´ÀÇ ÀϹÝÀûÀΠƯ¼ºÀ» ã¾Æ³»´Â °ÍÀε¥, ºÐ¼®°á°ú '¿¹'¶ó°í ÀÀ´äÇÑ °í°´µéÀº ³ªÀ̳ª °ÅÁÖÁö¿¡ °ü°è¾øÀÌ Á÷¾÷ÀÌ 'ÀÚ¿µ'À̰ųª, 43¼¼ ÀÌÇÏÀÇ °í¿ëÁ÷, ¶Ç´Â Á÷¾÷Àº ¾øÀ¸³ª °³²¿¡ °ÅÁÖÇѴٴ Ư¼ºÀ» °¡Áö°í ÀÖ´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ ±ÔÄ¢À» ¹ÙÅÁÀ¸·Î °í°´ ÀüüÀÇ ¸ðÁý´Ü¿¡¼ ÇÁ·Î¸ð¼Ç ´ë»óÀ» ¼±Á¤ÇÑ´Ù¸é ³·Àº ºñ¿ëÀ¸·Î ±¸¸Å °¡´É¼ºÀÌ ³ôÀº °í°´¸¸À» ¸ñÇ¥¸¶ÄÉÆÃÀ» Àü°³ÇÒ ¼ö ÀÖ´Ù. ºÐ·ù±ÔÄ¢ÀÇ ´Ù¸¥ ¿¹·Î´Â ½Å¿ëÄ«µå ȸ»çÀÇ °í°´ ½Å¿ëÆò°¡ ¸ðÇüÀÌ´Ù. ÀÌ È¸»ç¿¡¼´Â Áö±Ý±îÁöÀÇ °Å·¡¸¦ Åä´ë·Î °í°´µéÀÇ ½Å¿ëÀ» <¿ì¼ö, º¸Åë, ºÒ·®>À¸·Î ºÐ·ùÇß´Ù. 'ºÒ·®' Æò°¡¸¦ ¹ÞÀº °í°´ÃþÀÇ Æ¯¼º Áß Çϳª°¡ "25~30¼¼ °¡·®ÀÇ ¹ÌÈ¥³²À¸·Î ¿ù Æò±Õ ¼öÀÔÀÌ 200¸¸¿ø ÀÌÇÏÀÎ °í°´"À̶ó¸é, ½Å±Ô Ä«µå °¡ÀÔÀÚµéÀÇ ½Å¿ëÆò°¡½Ã ÀÌ·¯ÇÑ ±ÔÄ¢À» Ȱ¿ëÇÔÀ¸·Î½á º¸´Ù °´°üÀûÀÎ ÀÇ»ç°áÁ¤À» À¯µµÇÒ ¼ö ÀÖ´Ù.
±×¸² 8 ÀÀ´ä µ¥ÀÌÅÍ ºÐ¼®À» ÅëÇÑ ºÐ·ù±ÔÄ¢ ¹ß°ß
±ºÁýȶõ ·¹ÄÚµåµéÀ» À¯»çÇÑ Æ¯¼ºÀ» Áö´Ñ ¸î °³ÀÇ ¼Ò±×·ìÀ¸·Î ºÐÇÒÇÏ´Â ÀÛ¾÷À» ¶æÇÑ´Ù. ÀÛ¾÷ÀÇ Æ¯¼ºÀÌ ºÐ·ùÀÛ¾÷°ú Èí»çÇÏ´Ù°í »ý°¢ÇÒ ¼ö ÀÖÀ¸³ª, ºÐ¼®ÇϰíÀÚ ÇÏ´Â µ¥ÀÌÅÍ¿¡ ºÎ·ù°¡ Æ÷ÇԵǾî ÀÖÁö ¾Ê´Ù´Â Á¡¿¡¼ Â÷À̰¡ ÀÖÀ¸¸ç, ´Ù¸¥ data mining ÀÛ¾÷À» À§ÇÑ ¼±Çà ÀÛ¾÷À¸·Î¼ÀÇ ¿ªÇÒÀ» ¼öÇàÇÏ´Â °æ¿ì°¡ ¸¹´Ù. ¿¹¸¦ µé¾î ¾î¶² ¹éÈÁ¡¿¡¼ °í°´À» È¿À²ÀûÀ¸·Î °ü¸®Çϱâ À§ÇØ °í°´µéÀ» ¸î °³ÀÇ ºÎ·ù·Î ±¸ºÐÇÏ·Á ÇÑ´Ù°í °¡Á¤ÇØ º¸ÀÚ. ÀÌ ¹éÈÁ¡¿¡¼´Â Áö±Ý±îÁö °í°´ÀÇ ÃÖ±Ù ±¸¸Å°æ·Â, ±¸¸Åºóµµ, ±¸¸Å¾×(RFM: Recency, Frequency, Monetary) µîÀ» ±âÁØÀ¸·Î °í°´À» VIP°í°´, ¿ì¼ö°í°´, ÀÏ¹Ý°í°´ µîÀ¸·Î ºÐ·ùÇÏ¿© °ü¸®ÇÏ¿´´Ù. ±×·¯³ª À̺¥Æ®³ª ÇÁ·Î¸ð¼Ç ´ë»óÀ» ¼±Á¤Çϴµ¥ ÀÖ¾î ÇöÀçÀÇ °í°´ºÎ·ù´Â ³Ê¹«³ª Ãß»óÀûÀÌ°í °í°´ÀÇ °³Àκ° Ư¼ºÀ» ÀüÇô °í·ÁÇÏÁö ¸øÇϰí ÀÖ¾î Ȱ¿ëµµ°¡ ±×´ÙÁö ³ôÁö ¾Ê´Ù. ±×¸² 9´Â °í°´ÀÇ ±¸¸ÅÀ̷»Ӹ¸ ¾Æ´Ï¶ó ÀηùÅë°èÇÐÀû µ¥ÀÌÅÍ, ¶óÀÌÇÁ½ºÅ¸ÀÏ µ¥ÀÌÅÍ, ±×¸®°í ÁöºÒÀ¯Çü µîÀÇ ´Ù¾çÇÑ µ¥ÀÌÅÍ¿¡ ±ºÁýÈ ±â¹ýÀ» Àû¿ëÇÏ¿© ¿©¼¸ °³ÀÇ °í°´ ºÎ·ù¸¦ »õ·Ó°Ô Çü¼ºÇÑ ÈÄ, °¢ ±ºÁýº° Ư¼ºÀ» ºÐ·ù¸ðÇüÀ» ÅëÇØ ¾Ë¾Æº¸´Â ÀýÂ÷¿Í B±ºÁý¿¡ ¼ÓÇÑ °í°´µéÀÇ Æ¯¼ºÀ» º¸¿©ÁÖ°í ÀÖ´Ù. ÀÌ¿Í °°ÀÌ °í°´ÀÇ ±ºÁýº° Ư¼ºÀ» ÆÄ¾ÇÇÒ ¼ö ÀÖ´Ù¸é, Àû¾îµµ B±ºÁý¿¡ ¼ÓÇÑ °í°´µé¿¡°Ô ¾î¸°ÀÌ ÀÇ·ù³ª Àå³°¨ īŻ·Î±×¸¦ ¹ß¼ÛÇÏ´Â ¿ì·Á´Â ÇÇÇÒ ¼ö ÀÖ´Ù.
±¹³»ÀÇ °æ¿ì data miningÀº
¾ÆÁ÷Àº °³³äÀ̳ª ±â¹ý, Á¦Ç° µîÀÌ ¼Ò°³µÇ´Â Ãʱ⠵µÀÔ ´Ü°èÀÌ´Ù. ±×·¯³ª Á¤º¸È¿¡
¾Õ¼°¡´Â ¸¹Àº ¿Ü±¹ ¼±Áø±â¾÷µéÀ» ÅëÇØ ½ÇÁ¦ ÀÀ¿ë »ç·ÊµéÀ» Á¢ÇÒ ¼ö Àִµ¥ ¿¹¸¦
µé¾î ¹Ì±¹ÀÇ Ä«µåȸ»çÀÎ ¾Æ¸Þ¸®Ä ÀͽºÇÁ·¹½º»ç(American Express)¿Í Åë½Å¾÷üÀÎ
¿¡Æ¼¿£Æ¼»ç(AT&T)´Â °í°´µ¥ÀÌÅÍ ºÐ¼®À» ÅëÇÑ ¸¶ÄÉÆÃ È°µ¿ Áö¿øÀ» À§ÇØ, ¿µ±¹ÀÇ
BBC¹æ¼ÛÀº ÇÁ·Î±×·¥¿¡ ´ëÇÑ °í°´º° ¼±È£µµ¸¦ ºÐ¼®Çϱâ À§ÇØ data mining ÇÁ·ÎÁ§Æ®¸¦
¼öÇàÇÏ¿´´Ù. À̿ܿ¡µµ ÀºÇàÀ̳ª º¸Çè»ç µî¿¡¼ÀÇ ½Ç±¸Ãà »ç·Ê¸¦ ´Ù¼ö Á¢ÇÒ ¼ö Àִµ¥
À̵éÀº data miningÀÌ ¾ÕÀ¸·Î ÀÚ»çÀÇ °æÀï·Â Çâ»ó¿¡ »ó´çÇÑ ¿ªÇÒÀ» ÇÒ °ÍÀ¸·Î ±â´ëÇϰí
ÀÖ´Ù. ±×·¯³ª data miningÀº À§¿¡¼ ¾ð±ÞÇÑ Æ¯¼º ¾÷Á¾¿¡¸¸ ±¹ÇÑµÈ °ÍÀÌ ¾Æ´Ñ ¸ðµç
ºÐ¾ß¿¡ Àû¿ëÇÒ ¼ö ÀÖ´Â ¼öÆòÀû ÀÀ¿ëÀû ±â¼úÀÌ´Ù. »ç½Ç "´©°¡ ÇÊ¿ä·Î Çϴ°¡?"
º¸´Ù´Â "´©°¡ ÇÊ¿ä·Î ÇÏÁö ¾Ê´Â°¡?" ¶ó°í ¹¯´Â ÆíÀÌ ´õ ³ªÀ» °ÍÀÌ´Ù. ´ÜÁö
¾ÆÁ÷±îÁö´Â data miningÀÇ ¼º°ø»ç·Ê°¡ ÁÖ·Î µ¥ÀÌÅÍÀÇ Ãæ½Çµµ°¡ »ó´ëÀûÀ¸·Î ³ôÀº
ÀºÇà, Ä«µå, º¸Çè µîÀÇ ±ÝÀ¶ºÐ¾ß¿Í Åë½ÅºÐ¾ß¿¡¼ ÁÖ·Î ¹ßÇ¥µÇ°í ÀÖÀ» »ÓÀÌ´Ù.
Ç¥ 1¿¡¼´Â data miningÀ» Àû¿ëÇÒ ¼ö ÀÖ´Â ºÐ¾ß ¹× »ç·ÊµéÀÇ ÀϺθ¦
³ª¿ÇÏ¿´´Ù. data miningÀÌ Á¦°øÇÏ´Â Á¤º¸µéÀº È£°úÀûÀÎ ±¤°íÀü·« °³¹ßÀ̳ª »óǰ
¹èÄ¡, ¸ñÇ¥°í°´ ¼±Á¤, ÇÁ·Î¼¼½ºÀÇ °³¼± µî¿¡ Ȱ¿ëµÊÀ¸·Î½á ÀüüÀûÀÎ ºñÁî´Ï½º È¿À²
Çâ»ó°ú ºñ¿ë Àý°¨À» ²ÒÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ data mining¿¡¼ ¹ß±¼µÇ´Â Á¤º¸¸¦ ÅëÇØ
±â¾÷Àº ¼±Á¡ È¿°ú¸¦ ´©¸± ¼ö ÀÖ´Â °æ¿ì°¡ ¸¹´Ù. Áï ¸ÕÀú ±× Á¤º¸¸¦ È®º¸ÇÏ¿© Ȱ¿ëÇÔÀ¸·Î½á
°í°´À» ¸ðÀ¸°í ¼ºñ½º¸¦ Á¦°øÇϴµ¥ À¯¸®ÇÑ À§Ä¡¸¦ È®º¸ÇÏ°Ô µÇ´Â °ÍÀÌ´Ù.
Ç¥ 1 data miningÀÇ ÀÀ¿ëºÐ¾ß
¹× Àû¿ë »ç·Ê
ºÐ ¾ß |
Àû¿ë »ç·Ê |
¼Ò¸Å/¸¶ÄÉÆÃ |
|
ÀºÇà, Ä«µå |
|
º¸Çè |
|
Åë½Å |
|
Á¦Á¶ |
|
À¯Åë |
|
ÀÇ·á |
|
data mining Á¦Ç°À» ±¸ÀÔÇÏ¿© ±âÁ¸ÀÇ µ¥ÀÌÅ͸¦ ºÐ¼®Çϸé À¯¿ëÇÑ Á¤º¸°¡ ½ñ¾ÆÁ® ³ª¿Ã °ÍÀ̶ó´Â ȯ»óÀ» °¡Áö°í ¼²ºÒ¸® ÇÁ·ÎÁ§Æ®¸¦ ½ÃÀÛÇÏ¸é ½ÊÁßÆÈ±¸ ³¶ÆÐ¸¦ º»´Ù. À̰ÍÀº data miningÀ» ´ÜÁö ÇϳªÀÇ ±â¼ú(technology)·Î ÀνÄÇϰí, ±â¹ýÀ̳ª µµ±¸ÀÇ ¼±Åðú ±â¼úÀûÀÎ Áö¿ø µî¿¡¸¸ °ú´ÙÇÏ°Ô Ä¡ÁßÇÏ´Â °ÍÀÌ ÁÖ¿ä ¿øÀÎÀÌ´Ù. ¿©±â¿¡¼´Â ±â¾÷ÀÇ ±Ô¸ð³ª ÇÁ·ÎÁ§Æ®ÀÇ Å©±â¿¡ °ü°è¾øÀÌ ¼º°øÀûÀ¸·Î data mining ½Ã½ºÅÛÀ» ±¸ÃàÇϱâ À§ÇØ ¹Ýµå½Ã °í·ÁÇØ¾ß ÇÏ´Â »çÇ×µéÀ» Á¡°ËÇØ º¸°Ú´Ù.
"µ¥ÀÌÅͷκÎÅÍ ¹«¾ùÀ» ¾òÀ» °ÍÀΰ¡?" ÀÌ Áú¹®¿¡ ´ëÇÑ ¸íÈ®ÇÑ ÇØ´äÀ» °®°í ÀÖ¾î¾ß ÇÑ´Ù. À̸¦ À§Çؼ´Â ±â¾÷ÀÇ °æÀï·Â Á¦°í Ãø¸é¿¡¼ »ç¾÷¸ñÇ¥¸¦ Á¦´ë·Î ÀÌÇØÇϰí, ÇØ´ç ¸ñÇ¥¸¦ ¼ºÃëÇϱâ À§ÇØ ¼ö¹ÝµÇ´Â ÁÖ¿ä ¼º°ø¿ä¼Ò(critical success factor)µéÀ» È®ÀÎÇØ¾ß ÇÑ´Ù. ¿¹¸¦ µé¾î ÀÚµ¿Â÷º¸Çè»çÀÇ »ç¾÷¸ñÇ¥ Áß Çϳª°¡ 'ƯÁ¤ »óǰÀÇ ½ÃÀåÁ¡À¯À² À¯Áö'¶ó°í ÇÑ´Ù¸é ÁÖ¿ä ¼º°ø¿ä¼Ò·Î´Â °è¾à ¸¸±â Àü¿¡ ÇØ¾àÇÏ´Â °í°´À̳ª ¸¸±â ÈÄ Àç°è¾à ÇÏÁö ¾Ê´Â °í°´µéÀ» ´ë»óÀ¸·Î ÇÏ´Â 'ÀÌÅ»°í°´ ÃÖ¼ÒÈ', ±×¸®°í »õ·Î ½ÅÂ÷¸¦ ±¸ÀÔÇÑ °í°´À̳ª Ÿ º¸Çè»ç °í°´À» ´ë»óÀ¸·Î ÇÏ´Â '½Å±Ô°í°´ À¯Ä¡' µîÀ» µé ¼ö ÀÖ´Ù. ±×·¯³ª ¸¸¾à »ç¾÷¸ñÇ¥°¡ ÀÌÀ±À» ±Ø´ëÈÇÏ´Â °ÍÀ̶ó¸é, ÁÖ¿ä ¼º°ø¿ä¼Ò ÁßÀÇ Çϳª´Â ¸¶Âù°¡Áö·Î 'ÀÌÅ»°í°´ÀÇ ÃÖ¼ÒÈ'ÀÏ ¼ö ÀÖÀ¸³ª, ¿©±â¿¡¼ ÀÌÅ»°í°´ÀÇ ÀÇ¹Ì´Â ÇØ¾àÀ̳ª ¹Ì°è¾à °í°´ Áß¿¡¼µµ °è¾à ±â°£ µ¿¾È »ç°í°æ·ÂÀÌ ¾ø°Å³ª °æ¹ÌÇÑ °í°´À¸·Î ÇÑÁ¤ÇØ¾ß ÇÑ´Ù. data mining ÇÁ·ÎÁ§Æ®¸¦ ¼öÇàÇÒ ¶§ ¸ñÇ¥°¡ ºÒºÐ¸íÇϰí ÁÖ¿ä ¼º°ø¿ä¼Ò°¡ ±¸Ã¼ÀûÀÌÁö ¸øÇÏ¸é ¿øÃµ µ¥ÀÌÅÍ(source data)ÀÇ ¼±Á¤¿¡ ¾î·Á¿òÀÌ µû¸£¸ç, µµÃâµÇ´Â Á¤º¸ÀÇ ½Å·Úµµ ¶ÇÇÑ ¶³¾îÁø´Ù. ÀÌÁ¦ »õ·Ó°í Èï¹ÌÀÖ´Â Á¤º¸¸¦ ¾ò¾ú´Ù°í ÇÏÀÚ. µÎ ¹øÂ° Áú¹®Àº "¾ÕÀ¸·Î À̵é Á¤º¸¸¦ ¾î¶»°Ô Ȱ¿ëÇÒ °ÍÀΰ¡?"ÀÌ´Ù. data mining°ú °ü·ÃµÈ ´ëºÎºÐÀÇ ¿¬±¸³ª ÇÁ·ÎÁ§Æ®¸¦ »ìÆìº¸¸é Á¤º¸¸¦ ¾òÀ» ¶§±îÁöÀÇ °èȹÀ̳ª ½ÇÇà°úÁ¤Àº ºñ±³Àû »ó¼¼Çϳª ±× ÀÌÈİ¡ ºÒºÐ¸íÇÑ °æ¿ì°¡ ¸¹´Ù. Áï Á¤º¸¸¦ ¾÷¹«¿¡ ¾î¶»°Ô Ȱ¿ë(business action)ÇÒ °ÍÀΰ¡¿¡ ´ëÇÑ ¹æ¾ÈÀÌ ¹ÌÈíÇÏ´Ù´Â °ÍÀÌ´Ù. À̰ÍÀº »õ·Î¿î °Ç¹°À» ±Ù»çÇÏ°Ô °ÇÃàÇÏ¿© ³õ¾ÒÀ» »Ó ¿î¿µ°èȹµµ ¾øÀÌ ±×³É ¹æÄ¡Çϰí ÀÖ´Â °æ¿ì¿Í ¸¶Âù°¡ÁöÀÌ´Ù. µû¶ó¼ µµÃâÇÑ Á¤º¸¿¡ ´ëÇÑ ±¸Ã¼ÀûÀ̰í Çö½Ç¼ºÀÌ Àִ Ȱ¿ë¹æ¾ÈÀ» ¸¶·ÃÇÏ¿©¾ß ÇÑ´Ù. À§ÀÇ ¿¹¿¡¼ ¸¸¾à °ú°Å¿¡ ÀÌÅ»ÇÑ °í°´µéÀÇ Æ¯¼ºÀÌ ÆÄ¾ÇµÇ¾ú´Ù¸é, ³»´Þ¿¡ °è¾àÀÌ ¸¸·áµÇ´Â °í°´ Áß¿¡¼ ÀÌÅ»°í°´µé°ú À¯»çÇÑ Æ¯Â¡À» Áö´Ñ °í°´µéÀ» Ưº° °ü¸®´ë»óÀ¸·Î »ï¾Æ ÀÛ°Ô´Â º¸´Ù Ä£ÀýÇÏ°í °ü½É¾î¸° Àüȸ¦ °É ¼ö ÀÖÀ¸¸ç, ³ª¾Æ°¡¼´Â ºñ¿ëÀÌ Çã¶ôÇÏ´Â Çѵµ ³»¿¡¼ °í°´ Ư¼º¿¡ ¸Â´Â °£´ÜÇÑ ¼±¹°À» ¹ß¼ÛÇÑ´ÙµçÁö º¸Çè¿ä±ÝÀ» Á¶Á¤ÇØ ÁÖ´Â °Í°ú °°Àº Àμ¾Æ¼ºê¸¦ Á¦°øÇÏ´Â Àü·«À» ±¸»óÇÒ ¼ö ÀÖ´Ù.
"Garbage in garbage out!" Áï, ¾²·¹±â°¡ µé¾î°¡¸é ¾²·¹±â°¡ ³ª¿Â´Ù´Â ¸»ÀÌ´Ù. data miningÀ» ÅëÇÏ¿© ¾òÀº Á¤º¸ÀÇ ¿øÃµÀº ÀԷµǴ µ¥ÀÌÅÍÀ̱⠶§¹®¿¡ µµÃâµÇ´Â Á¤º¸ÀÇ ½Å·Úµµ´Â ¹Ù·Î ¿øÃµ µ¥ÀÌÅÍÀÇ Ç°Áú¿¡ ´Þ·ÁÀÖ´Ù°í ÇØµµ °ú¾ðÀÌ ¾Æ´Ï´Ù. µû¶ó¼ data mining ÀÛ¾÷À» ¼öÇàÇϱâ Àü¿¡ ¹Ýµå½Ã Á¡°ËÇØ¾ß ÇÒ »çÇ×ÀÌ µ¥ÀÌÅÍÀÇ Ãæ½ÇµµÀÌ´Ù. Ãæ½Çµµ¶õ µ¥ÀÌÅ͸¦ ±¸¼ºÇÏ´Â ·¹ÄÚµå¿Í ¼Ó¼ºÀÇ ¼ö°¡ ÃæºÐÇѰ¡¿¡ ´ëÇÑ ¾çÀû ôµµ¿Í ¼Ó¼ºÀÌ ÃëÇÑ °ªµéÀÌ Á¤È®ÇѰ¡ ¶Ç´Â ºüÁø ¼Ó¼º °ªÀº ¾î´À Á¤µµÀΰ¡¿¡ ´ëÇÑ ÁúÀû ôµµ, ÀÌ µÎ °¡Áö¸¦ ÇÔ²² ÀǹÌÇÑ´Ù. µ¥ÀÌÅÍÀÇ Ãæ½Çµµ´Â data mining ÇÁ·ÎÁ§Æ®ÀÇ ¼ºÆÐ¸¦ Á¿ìÇÏ´Â °¡Àå Áß¿äÇÑ ¿ä¼Ò·Î¼ ½ÇÁ¦ ÇÁ·ÎÁ§Æ®ÀÇ ´ëºÎºÐÀÌ À̰ÍÀ» ³ôÀ̴µ¥ ÇҾֵȴÙ.
°³ÀÎÀÇ ÇÁ¶óÀ̹ö½Ã¸¦ º¸È£ÇÑ´Ù´Â °Í ¶ÇÇÑ Áß¿äÇÑ ¹®Á¦ÀÌ´Ù. ÇÁ¶û½º¿¡¼´Â 2¸íÀÇ º¸Çè ´ë¸®ÀÎÀÌ °³ÀÎÀÇ µ¥ÀÌÅ͸¦ ºÒ¹ýÀ¸·Î »ç¿ëÇÏ¿© 10°³¿ùÀÇ Â¡¿ª°ú ¹ÌÈ 3000´Þ·¯ Á¤µµÀÇ ¹ú±ÝÀ» ¼±°í¹ÞÀº »ç·Ê°¡ ÀÖ´Ù. À̵éÀº ÇÁ¶û½ºÀÇ Àü·Âȸ»çÀÎ EDF(Electricite De France)·ÎºÎÅÍ »õ·Î¿î Àü¼±À» ¼³Ä¡ÇÑ »ç¶÷µéÀÇ ¸í´ÜÀ» È®º¸ÇÑ ÈÄ, °ü°èºÎó¿¡ À̸¦ ¾Ë¸®Áö ¾Ê°í ¸ñÇ¥¸¶ÄÉÆÃ¿¡ »ç¿ëÇÏ¿´´Ù. ±¹³»ÀÇ °æ¿ì¿¡µµ ¾ó¸¶ Àü ÇÑ µµ¼ÆÇ¸Å¾÷ü°¡ ¸ð ´ëÇÐÀÇ ½ÅÀÔ»ý ¸í´ÜÀ» ÀÎÅͳÝÀ» ÅëÇØ È®º¸ÇÑ ÈÄ, ÀÏ´ëÀÏ ¸¶ÄÉÆÃ¿¡ Ȱ¿ëÇÏ¿© ¹®Á¦°¡ ¹ß»ýÇϱ⵵ ÇÏ¿´´Ù. ½ÇÁ¦·Î ¸¹Àº ¼±Áø±¹°¡µéÀº ±â¾÷ÀÌ °³ÀÎÀÇ µ¥ÀÌÅ͸¦ ¼öÁý, Á¤¸® ¶Ç´Â ó¸®ÇÏ´Â °Í°ú °ü·ÃµÈ ÁöħÀ̳ª ¹ýÀ» ÁöÁ¤Çϰí ÀÖµû. ¿ì¸®³ª¶óÀÇ °æ¿ìµµ À¯»ç¹ý·üÀÌ Á¦Á¤µÇ¾î Àִµ¥ ¿¹¸¦ µé¾î, ½Å¿ëÁ¤º¸ÀÇ ÀÌ¿ë ¹× º¸È£¿¡ °üÇÑ ¹ý·ü Á¦23Á¶ ¹× Á¦24Á¶¿¡ ÀÇÇÏ¸é ±â¾÷ÀÌ °³ÀÎÀÇ ½Å¿ëµ¥ÀÌÅ͸¦ »ç¿ëÇϱâ À§Çؼ´Â °³ÀÎÀÇ µ¿ÀǸ¦ ¹Þµµ·Ï µÇ¾î ÀÖÀ¸¸ç, Á¦3ÀÚ¸¦ ÅëÇØ ¼öÁýÇÑ µ¥ÀÌÅ͸¦ »ç¿ëÇϱâ À§Çؼ´Â ÇØ´ç ±â¾÷»Ó ¾Æ´Ï¶ó Á¦3ÀÚ ¶ÇÇÑ °³ÀÎÀÇ µ¿ÀǸ¦ ¹Þ¾Æ¾ß ÇÑ´Ù. À̰ÍÀº ¸¸¾à ÀüÀÚÁ¦Ç°À» Á¦Á¶ÇÏ°í ÆÇ¸ÅÇϴ ȸ»ç°¡ °¢ ´ë¸®Á¡À» ÅëÇØ ¼öÁýÇÑ °í°´ µ¥ÀÌÅ͸¦ ÀÌ¿ëÇÏ¿© ¸¶ÄÉÆÃ È°µ¿À» Àü°³ÇÏ·Á ÇÑ´Ù¸é, ÀüÀÚȸ»ç¿Í ´ë¸®Á¡ °øÈ÷ °³ÀÎÀÇ µ¿ÀǸ¦ ¾ò¾î¾ß¸¸ ÇÑ´Ù´Â °ÍÀ» ÀǹÌÇÑ´Ù. ±×·¯³ª °³ÀÎÀÇ µ¥ÀÌÅ͸¦ ¸ô·¡ ¼öÁýÇϰí À̸¦ ¹üÁË¿¡ »ç¿ëÇÏ´Â »ç°ÇÀÌ Áõ°¡ÇÔ¿¡ µû¶ó °³ÀÎÀÌ ÀÚ½ÅÀÇ µ¥ÀÌÅÍ¿¡ ´ëÇÑ °ø°³¸¦ ²¨¸®´Â °æÇâÀÌ ´Ã¾î³ª°í ÀÖÀ¸¸ç, ±¹³»ÀÇ °æ¿ì´Â ±× Á¤µµ°¡ ´õ ½ÉÇÑ »óȲÀÌ´Ù. µû¶ó¼ ÇÕ¹ýÀûÀ¸·Î °³ÀÎÀÇ µ¥ÀÌÅ͸¦ »ç¿ëÇϰųª ¼öÁý ¶Ç´Â º¸°ÇÏ´Â ¹æ¾ÈÀ» ¹Ýµå½Ã °±¸ÇØ¾ß ÇÑ´Ù.
data miningÀº µ¥ÀÌÅͷκÎÅÍ ÀÚµ¿À¸·Î Á¤º¸¸¦ ÃßÃâÇϱ⠶§¹®¿¡ Àü¹®°¡ÀÇ Àü¹®Áö½ÄÀ̳ª °æÇèÀ» ´ëüÇÒ ¼ö ÀÖ´Ù. ¶ÇÇÑ ÀϹÝÁúÀdzª OLAP°ú´Â ´Þ¸® »ç¿ëÀÚ°¡ ¹Ì¸® °¡¼³À» ¼¼¿ì°Å³ª ÁöħÀ» Á¦°øÇÏÁö ¾Ê´Â´Ù. ÀÌ ¸»µéÀº »ç¿ëÀڵ鿡°Ô data miningÀº ¸¶Ä¡ À̾߱⠼ӿ¡ ³ª¿À´Â µµ±úºñ ¹æ¸ÁÀÌ¿Í °°Àº °ÍÀ̶ó´Â ȯ»óÀ» °®°Ô Çϱ⠽±´Ù. ±×·¯³ª data miningÀº ¿ÀÁ÷ ÁÖ¾îÁø µ¥ÀÌÅÍ¿¡¼¸¸ Á¤º¸¸¦ ã±â ¶§¹®¿¡ "ÇÊ¿äÇÑ Á¤º¸¸¦ ¾ò±â À§Çؼ´Â ¾î¶² µ¥ÀÌÅÍ, ƯÈ÷ ¾î¶°ÇÑ ¼Ó¼ºµé·Î ±¸¼ºµÈ µ¥ÀÌÅͰ¡ ÇÊ¿äÇÏ´Ù."¿Í °°Àº Á¤º¸´Â ¾Ë·ÁÁÖÁö ¸øÇÑ´Ù. ¿¹¸¦ µé¾î, A»óǰÀ» ±¸¸ÅÇÒ ¸¸ÇÑ °í°´ÀÇ Æ¯¼ºÀ» ¾Ë¾Æ³»°í ±×·± Ư¼ºÀ» °¡Áø °í°´µé¸¸À» ´ë»óÀ¸·Î À̺¥Æ®¸¦ °³ÃÖÇÏ·Á ÇÑ´Ù°í ÇÏÀÚ. ¸¸¾à A»óǰÀ» ±¸¸ÅÇÒ °í°´µéÀÇ ½ÇÁ¦ Ư¼ºÀÌ '¿ù¼öÀÔÀÌ 200¸¸¿ø ÀÌ»ó'ÀÓ¿¡µµ ºÒ±¸Çϰí data mining¿¡ ÀÌ¿ëµÈ µ¥ÀÌÅÍ¿¡ ¿ù¼öÀÔÀ̶ó´Â ¼Ó¼ºÀÌ ¾ø´Ù¸é, data miningÀº '¿©¼ºÀÌ¸ç °ÅÁÖÁö¿ªÀº ¼ÛÆÄ±¸'¶ó´Â ´Ù¼Ò ¾û¶×ÇÑ Æ¯¼ºÀ» ã¾Æ³»¾î Á¦½ÃÇÒ ¼öµµ ÀÖ´Ù. ¶ÇÇÑ data miningÀ» ÅëÇØ ÀÏÂ÷ÀûÀ¸·Î ÃßÃâµÇ´Â Á¤º¸ÀÇ ¾çÀº »ó´çÈ÷ ¸¹À» ¼ö°¡ ÀÖ´Ù. ÀÌ Áß¿¡´Â data miningÀÇ Á¤ÀÇ¿¡¼ ¾Ë ¼ö ÀÕµíÀÌ °ú°Å¿¡ ¾ËÁö ¸øÇß´ø °¡Ä¡ÀÖ´Â Á¤º¸µéµµ Á¸ÀçÇÏÁö¸¸, µ¥ÀÌÅÍ¿¡ ³»ÀçµÇ¾î ÀÖ´Â ¿À·ù°ª(incorrect value)À̳ª ƯÀ̰ª(outlier) µîÀ¸·Î ÀÎÇØ Àǹ̰¡ ¾ø°Å³ª Ʋ¸° Á¤º¸µéµµ ´Ù¼ö Æ÷ÇԵǰï ÇÑ´Ù. ÀÌ¿Í °°Àº Á¤º¸¸¦ ¾Æ¹«·± ¿©°ú¾øÀÌ ±â¾÷°æ¿µ¿¡ ±×´ë·Î Ȱ¿ëÇÑ´Ù¸é ±× °á°ú°¡ ±â¾÷¿¡ ¹ÌÄ¡´Â ¼Õ½ÇÀº ¾öû³¯ ¼ö°¡ ÀÖ´Ù. µû¶ó¼ ÀûÀýÇÑ µ¥ÀÌÅÍÀÇ ¼±ÅÃÀ̳ª ÃßÃâµÇ´Â Á¤º¸ÀÇ ¿Ã¹Ù¸¥ ÇØ¼®À» À§ÇØ ¹Ýµå½Ã ¿ª·®ÀÖ´Â ¾÷¹« Àü¹®°¡³ª µ¥ÀÌÅÍ ºÐ¼®°¡ÀÇ µµ¿òÀ» ¹Þ¾Æ¾ß ÇÑ´Ù.
data mining ÀÛ¾÷¿¡´Â ÀüÅëÀûÀÎ Åë°è, ÀÇ»ç°áÁ¤³ª¹«(decision tree), ½Å°æ¸Á(neural networks) µî ´Ù¾çÇÑ ±â¹ýµéÀÌ µ¶ÀÚÀûÀ¸·Î ȤÀº °áÇյǾî ÀÌ¿ëµÇ¸ç, ÃÖ±Ù µé¾î ÀÌ·¯ÇÑ ±â¹ýµéÀ» ±â¹ÝÀ¸·Î ÇÏ´Â »ç¿ëÈµÈ data mining µµ±¸µéÀÌ ¼ÒÇÁÆ®¿þ¾î³ª Çϵå¿þ¾î °ø±Þ¾÷ü(vendor)µéÀ» ÅëÇØ ´ë·®À¸·Î ¼Ò°³µÇ°í ÀÖ´Ù. ±× Áß¿¡´Â ¾ó¸¶Àü±îÁö¸¸ ÇØµµ ÃֽŠÁúÀÇ µµ±¸³ª OLAP µµ±¸¶ó°í ¼±ÀüµÇ¾î¿À´ø Á¦Ç°µéÀÌ ¼±Áø data mining µµ±¸·Î µÐ°©ÇØ ÀÖ´Â °æ¿ìµµ °£È¤ ¹ß°ßÇÒ ¼ö ÀÖ´Ù. data mining µµ±¸´Â SASÀÇ Enterprise Miner, SPSSÀÇ Clementine, ±×¸®°í IBMÀÇ Intelligent Miner µî°ú °°ÀÌ ¿©·¯ °¡Áö ±â¹ýµéÀ» Áö¿øÇÏ¿© data miningÀÇ ´Ù¾çÇÑ ÀÛ¾÷À» °¡´ÉÇÏ°Ô ÇÏ´Â ¹ü¿ëÁ¦Ç°±º¿¡¼, Rulequest»çÀÇ C5.0À̳ª Neuro Dimension»çÀÇ NeuroSolutions µî°ú °°ÀÌ Æ¯º°È÷ ÇϳªÀÇ ±â¹ý¸¸À» Áö¿øÇÏ´Â Àü¿ëÁ¦Ç°±º±îÁö ´Ù¾çÇÏ´Ù. Á¦Ç°µé¿¡ ´ëÇÑ ¸®½ºÆ®¿Í ÀÚ¼¼ÇÑ ³»¿ëÀº ºÎ·ÏÀ» Âü°íÇϱ⠹ٶõ´Ù. ÀϹÝÀûÀ¸·Î data mining µµ±¸¸¦ ¼±ÅÃÇÒ ¶§´Â °¡°Ý°ú Áö¿øÇÏ´Â Çϵå¿þ¾î Ç÷§ÆûÀÌ ÀûÀýÇѰ¡¸¦ Æò°¡ÇÏ´Â °Í ¿Ü¿¡µµ ´ÙÀ½ÀÇ »çÇ×µéÀ» Ç×»ó °í·ÁÇØ¾ß ÇÑ´Ù.