º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇÑ ÇнÀ°ú Çൿ
(Learning and Acting with Bayes Nets)
ÀΰøÁö´É-Áö´ÉÇü ¿¡ÀÌÀüÆ®¸¦ Áß½ÉÀ¸·Î : Nils J.Nilsson Àú¼, ÃÖÁß¹Î. ±èÁØÅÂ. ½É±¤¼·. À庴Ź °ø¿ª, »çÀÌÅØ¹Ìµð¾î, 2000 (¿ø¼ : Artificial Intelligence : A New Synthesis 1998), Page 371~388
º£ÀÌÁö¾È ³×Æ®¿öÅ© (Bayes network) ¸¦ ÇнÀÇÏ´Â ¹®Á¦´Â ÁÖ¾îÁø Æò°¡ ôµµ¿¡ µû¶ó µ¥ÀÌÅÍÀÇ ÈÆ·Ã ÁýÇÕ (training set) ¥Î ¿¡ °¡Àå Àß ºÎÇյǴ ³×Æ®¿öÅ©¸¦ ±¸ÇÏ´Â °ÍÀ̸ç, ¿©±â¼ ¥Î ´Â ¸ðµç (¶Ç´Â Àû¾îµµ ¸î¸î) º¯¼ö¿¡ ´ëÇÑ °ªÀÇ »ç·Ê ÁýÇÕÀÌ´Ù. ³×Æ®¿öÅ©¸¦ ±¸ÇÑ´Ù´Â °ÍÀº DAG (directed acyclic graph) ±¸Á¶¿Í DAG ÀÇ °¢ ³ëµå¿¡ ¿¬°üµÈ Á¶°ÇºÎ È®·üÇ¥ (conditional probability table, CPT) ¸¦ ÇÔ²² ±¸ÇÏ´Â °ÍÀ» ÀǹÌÇÑ´Ù.
¸¸ÀÏ ³×Æ®¿öÅ©ÀÇ ±¸Á¶¸¦ ¾È´Ù¸é CPT ¸¸À» ±¸ÇÏ¸é µÇ´Âµ¥ ÀÌ °æ¿ì¸¦ ¸ÕÀú ±â¼úÇØº¸ÀÚ. Àü¹®°¡µéÁ¶Â÷µµ ¹®Á¦ ¿µ¿ª¿¡ ¸Â´Â ±¸Á¶¸¸ ±¸Çϰí CPT ´Â ¾òÁö ¸øÇÒ ¶§°¡ Á¾Á¾ ÀÖ´Ù. ³×Æ®¿öÅ© ±¸Á¶¸¦ ÇнÀÇØ¾ß ÇÏ´Â °æ¿ì¿¡µµ CPT ÀÇ ÇнÀÀº ÇÊ¿äÇÏ´Ù. CPT ÀÇ ÇнÀÀ» À§ÇÑ ¼³Á¤¿¡´Â °£´ÜÇÑ °Í°ú Á» º¹ÀâÇÑ °ÍÀÌ ÀÖ´Ù. °£´ÜÇÑ °æ¿ì´Â °á¿©µÈ µ¥ÀÌÅÍ (missing data) °¡ ¾ø´Â °æ¿ìÀÌ´Ù. Áï, ÈÆ·Ã ÁýÇÕ ¥Î ÀÇ °¢ ¿ä¼Ò´Â ³×Æ®¿öÅ©¿¡ Ç¥ÇöµÈ ¸ðµç º¯¼ö¿¡ ´ëÇØ °ªÀ» °¡Áø´Ù. ÇÏÁö¸¸ º¸´Ù Çö½ÇÀûÀÎ ¼³Á¤¿¡¼´Â ¸î¸î ÈÆ·Ã ·¹Äڵ忡 ´ëÀÀ°ªÀÌ ¾ø´Â º¯¼ö°¡ Á¸ÀçÇÒ ¼ö ÀÖÀ¸¸ç ÀÌ·¯ÇÑ °á¿©µÈ µ¥ÀÌÅͰ¡ CPT ÀÇ ÇнÀÀ» ¾î·Æ°Ô ¸¸µç´Ù.
¸ÕÀú °á¿©µÈ µ¥ÀÌÅͰ¡ ¾ø´Ù°í °¡Á¤ÇÑ´Ù. ÈÆ·Ã ¿¹Á¦°¡
ÃæºÐÇÏ´Ù¸é °¢ ³ëµå¿Í ±× ³ëµåÀÇ ºÎ¸ð¿¡ ´ëÇÑ Ç¥º» Åë°è¸¸ °è»êÇÏ¸é µÈ´Ù. °¡·É p(Vi)
¶ó´Â ºÎ¸ð¸¦ °¡Áø ³ëµå Vi ¿¡ ´ëÇÑ CPT ¸¦ ±¸ÇÑ´Ù°í ÇÏÀÚ. ¾Õ¼ÀÇ Ç¥±â¹ý¿¡
µû¶ó Vi ÀÇ °ªÀ» vi ·Î ³ªÅ¸³»ÀÚ. ³ëµå Vi ¿¡
´ëÇØ¼´Â Vi °¡ °¡Áú ¼ö ÀÖ´Â °ªÀÇ ¼ö (»©±â 1) ¸¸Å Å×À̺íÀÌ Á¸ÀçÇÑ´Ù.
º¯¼ö°¡ ºÎ¿ï°ªÀ¸·Î Ç¥ÇöµÇ´Â °æ¿ì¿¡´Â °¢ ³ëµå¸¶´Ù ÇϳªÀÇ CPT ¸¸ Á¸ÀçÇÑ´Ù. Vi
°¡ ki °³ÀÇ ºÎ¸ð ³ëµå°¡ ÀÖ´Ù¸é °¢ ºÎ¸ð°¡ µÎ °ª Áß Çϳª¸¦ °¡Áö¹Ç·Î,
Å×À̺íÀº 2ki °³ÀÇ Ç׸ñ (Çà) À» °¡Áø´Ù. Vi
ÀÇ ºÎ¸ð¿Í ¿¬°üµÈ º¯¼ö¸¦ º¤Åͺ¯¼ö Pi ·Î ³ªÅ¸³»°í, ÀÌ º¯¼öÀÇ °ªÀº °ªÀÇ
º¤ÅÍÀÎ Pi ·Î ³ªÅ¸³½´Ù. Ç¥º» Åë°è (Vi = vi |Pi = Pi) ´Â Vi
= vi ÀÌ°í µ¿½Ã¿¡ Pi = Pi ¸¦ ¸¸Á·ÇÏ´Â ¥Î ÀÇ
¿¹Á¦ÀÇ ¼ö¸¦ Pi = Pi ¸¦ ¸¸Á·ÇÏ´Â ¿¹Á¦ÀÇ ¼ö·Î ³ª´« °ÍÀÌ´Ù.
CPT ¸¦ ÇнÀÇϱâ À§Çؼ´Â ³×Æ®¿öÅ©ÀÇ ¸ðµç ³ëµå¿¡ ´ëÇØ ½ÇÁ¦ µ¥ÀÌÅÍ¿¡ ´ëÇÑ ÀÌ Ç¥º»
Åë°è¸¦ »ç¿ëÇÏ¸é µÈ´Ù.
G |
M |
B |
L |
»ç·Ê °³¼ö |
Âü |
Âü |
Âü |
Âü |
54 |
Âü |
Âü |
Âü |
°ÅÁþ |
1 |
Âü |
°ÅÁþ |
Âü |
Âü |
7 |
Âü |
°ÅÁþ |
Âü |
°ÅÁþ |
27 |
°ÅÁþ |
Âü |
Âü |
Âü |
3 |
°ÅÁþ |
°ÅÁþ |
Âü |
°ÅÁþ |
2 |
°ÅÁþ |
°ÅÁþ |
°ÅÁþ |
Âü |
4 |
°ÅÁþ |
°ÅÁþ |
°ÅÁþ |
°ÅÁþ |
2 |
|
|
|
|
100 |
±×¸² 1 ¿¹Á¦ ³×Æ®¿öÅ©¿Í ¿¹Á¦°ª
ÇÑ ¿¹Á¦¸¦ ÅëÇØ ÀÌ °è»ê¹ýÀ» Á»´õ ¸íÈ®È÷ ¼³¸íÇϰíÀÚ
ÇÑ´Ù. ±×¸² 1 Àº ±×¸² 6 °ú °°Àº ±¸Á¶¸¦ °¡Áø º£ÀÌÁö¾È
³×Æ®¿öÅ©¿¡¼ CPT ´Â »ý·«ÇÏ°í ´Ù½Ã ³ªÅ¸³½ °ÍÀÌ´Ù. ±×¸²¿¡ ³ªÅ¸³ ´ë·Î, G, M, B,
L °ªÀ» °¡Áø 100 °³ÀÇ ÁýÇÕÀ» °üÂûÇÑ´Ù°í ÇÏÀÚ (¾î¶² Á¶ÇÕÀº ³ªÅ¸³ªÁö ¾Ê±âµµ Çϰí,
¾î¶² Á¶ÇÕÀº ´Ù¸¥ °Íº¸´Ù ´õ ÀÚÁÖ ³ªÅ¸³´Ù). ¿¹¸¦ µé¾î, Ç¥º» È®·ü (B = Âü) ¸¦ °è»êÇÏ·Á¸é ´Ü¼øÈ÷ ¸ðµç ¿¹Á¦ Áß¿¡¼ B °¡ ÂüÀÎ ¿¹Á¦ÀÇ ºñÀ²À»
°è»êÇÏ¸é µÇ¸ç, µû¶ó¼
(B = Âü) = 0.94 °¡ µÈ´Ù. À¯»çÇÑ ¹æ¹ýÀ¸·Î °è»êÇϸé
(L = Âü) = 0.68 ÀÌ µÈ´Ù. B ¿Í L ³ëµå¿¡ ´ëÇØ CPT ¿¡´Â À̵é È®·ü¸¸ ÀúÀåÇϸé
µÈ´Ù.
M ³ëµå¿¡ ´ëÇÑ CPT ÇàÀÇ °è»êÀº ´ÙÀ½°ú °°Àº ÀüÇüÀûÀÎ
°è»ê¹ýÀ¸·Î ¼³¸íÇϰíÀÚ ÇÑ´Ù. (M = Âü | B = Âü, L = °ÅÁþ) [ÁÙ¿©¼
(M | B, ¡þL) ·Î ¾¸] ¸¦ °è»êÇϱâ À§ÇØ M ÀÌ ÂüÀ̰í B °¡ ÂüÀ̰í L ÀÌ °ÅÁþÀÎ
°æ¿ìÀÇ ¼ö¸¦ ¼¼¾î, B °¡ ÂüÀ̰í L ÀÌ °ÅÁþÀÎ °æ¿ìÀÇ ¼ö·Î ³ª´«´Ù. ÀÌ °á°ú
(M | B, ¡þL) = 0.03 ÀÌ µÈ´Ù. °°Àº °è»ê¹ýÀ» ÀÌ¿ëÇØ¼ G ³ëµå¿¡ ´ëÇÑ CPT ¸¦
±¸ÇÑ´Ù. Ç¥º» Åë°èÀÇ ¸ðµç ÁýÇÕÀ» °è»êÇØ¼ ±×¸² 6 ¿¡ ÁÖ¾îÁø CPT ¿Í ºñ±³ÇØ º¼ ¼öµµ ÀÖ´Ù.
ÀÌ ¿¹Á¦¿¡¼ ÀϺΠǥº» Åë°è´Â ¸Å¿ì ÀÛÀº ¼öÀÇ ¿¹Á¦¿¡¸¸ ÀÇÁ¸ÇÏ°Ô µÇ¸ç, ÀÌ °æ¿ì ÇØ´çµÇ´Â È®·üÀº À߸ø ÃßÃøÇÒ ¼öµµ ÀÖ´Ù. ÀϹÝÀûÀ¸·Î CPT ¸Å°³º¯¼ö°¡ Áö¼öÀûÀ¸·Î (exponentially) Ä¿Áö¸é ÈÆ·Ã ÁýÇÕÀ» ÅëÇØ ¸Å°³º¯¼öµé¿¡ ´ëÇÑ ÃßÃøÀ» ÇÒ ¼ö ÀÖ´Â ´É·ÂÀÌ ¶³¾îÁú ¼ö ÀÖ´Ù. ÀÌ ¹®Á¦¸¦ ÁÙÀÌ·Á¸é ¸¹Àº ¸Å°³º¯¼öµéÀÌ °°Àº (¶Ç´Â °ÅÀÇ °°Àº) °ªÀ» °¡Áú °¡´É¼ºÀ» ÀÌ¿ëÇØ¾ß ÇÑ´Ù. ÀÌ Áߺ¹¼ºÀ» ÀÌ¿ëÇÏ¿© CPT ¿¡¼ °è»êÇØ¾ß ÇÏ´Â ¸Å°³º¯¼öÀÇ ¼ö¸¦ ÁÙÀÌ´Â ±â¹ýÀÌ [Friedman & Goldszmidt 1996a] ¿¡ ÀÇÇØ ¿¬±¸µÇ¾ú´Ù.
CPT ÀÇ Ç׸ñÀÌ ¿¹Á¦¸¦ °üÂûÇϱâ Àü¿¡ ¹Ì¸® ±¸ÇÑ ¼±ÇèÀû È®·ü (prior probability) À» °¡Áö´Â °æ¿ìµµ ÀÖ´Ù. ÁÖ¾îÁø ÈÆ·Ã ÁýÇÕ¿¡ ´ëÇØ CPT ¸¦ º£ÀÌÁö¾È ¹æ¹ýÀ¸·Î °»½ÅÇϸé ÀÌ·¯ÇÑ ¼±ÇèÀû È®·ü¿¡ ÀûÀýÇÑ °¡ÁßÄ¡¸¦ ÁÖÁö¸¸ ÀÌ °úÁ¤Àº ´Ù¼Ò º¹ÀâÇÏ´Ù ([Heckerman, Geiger, & Chickering 1995] ¸¦ ÂüÁ¶Ç϶ó). ¾ÆÁÖ Å« ÈÆ·Ã ÁýÇÕ¿¡ ´ëÇØ¼´Â ¼±ÇèÀû È®·üÀÇ È¿°ú°¡ ±Þ°ÝÈ÷ ÁÙ¾îµç´Ù.
ÇнÀ °úÁ¤¿¡ ÀÌ¿ëµÉ ÈÆ·Ã µ¥ÀÌÅ͸¦ ¼öÁýÇÒ ¶§ µ¥ÀÌÅͰ¡ ºüÁø °æ¿ì°¡ ÀÚÁÖ ¹ß»ýÇÑ´Ù. ¾î¶² ¶§´Â ÀÖ¾î¾ß ÇÒ µ¥ÀÌÅͰ¡ ºÎÁÖÀÇ·Î ºüÁö±âµµ Çϰí, ¾î¶² ¶§´Â µ¥ÀÌÅͰ¡ ºüÁ® ÀÖ´Ù´Â »ç½Ç ÀÚü°¡ Áß¿äÇÑ °æ¿ìµµ ÀÖ´Ù. ¿©±â¼´Â ÀüÀÚÀÇ °æ¿ì¸¦ ´Ù·ç°Ú´Ù. [Lauritzen 1991] Àº ¹Ýº¹Çؼ Ç¥º» Åë°è¸¦ °è»êÇÏ´Â °£´ÜÇÏ¸é¼ ¼ö·ÅÇÏ´Â (convergent) °úÁ¤À» Á¦½ÃÇϰí, ÀÌ °úÁ¤ÀÌ È¿°úÀûÀÓÀ» º¸¿´´Ù. ÀÌ ¹æ¹ýÀÇ ÁÖµÈ ¾ÆÀ̵ð¾î¸¦ ¹æ±Ý Á¦½ÃÇÑ ¿¹Á¦¸¦ °¡Áö°í ¼³¸íÇϰڴÙ. °¡·É ±×¸² 1 ¿¡ ÀÖ´Â µ¥ÀÌÅÍ ´ë½Å¿¡ ´ÙÀ½°ú °°Àº µ¥ÀÌÅͰ¡ ÀÖ´Ù°í ÇÏÀÚ.
º°Ç¥ (*) ´Â º¯¼ö°ªÀÇ ÇØ´ç ±×·ì¿¡
´ëÇØ¼ ±× À§Ä¡¿¡ ¿¬°üµÈ º¯¼öÀÇ °ªÀÌ ¾ø´Ù´Â °ÍÀ» °¡¸®Å²´Ù. ÀÌÁ¦ ÀÌ·¯ÇÑ ³×Æ®¿öÅ©¿¡
´ëÇÑ CPT ¸¦ °è»êÇÒ ¶§ °á¿©µÈ °ªÀ» ¾î¶»°Ô ´Ù·ê °ÍÀΰ¡°¡ ¹®Á¦°¡ µÈ´Ù. ¸ÕÀú G =
°ÅÁþ, M = Âü, L = ÂüÀ̰í B ´Â °ªÀÌ ¾ø´Â ¼¼ °³ÀÇ ¿¹Á¦¸¦ »ìÆìº¸ÀÚ. ÀÌ 3 °³ÀÇ ¿¹Á¦
°¢°¢Àº B = ÂüÀ̳ª B = °ÅÁþ Áß Çϳª¸¦ °¡Áú ¼ö ÀÖÁö¸¸ µÑ Áß ¾î¶² °ÍÀÎÁö´Â ¸ð¸¥´Ù.
ÇÏÁö¸¸ ÀÌ ¿¹Á¦¿¡ ´ëÇÑ G, M, L ÀÇ °ªÀº ¾Ë°í ÀÖÀ¸¹Ç·Î, B °ªÀ» ¸ð¸£´õ¶óµµ G, M,
L ÀÌ ÁÖ¾îÁ³À» ¶§ÀÇ B ÀÇ È®·üÀÎ (B | ¡þG, M, L) ¿¡ °¡ÁßÄ¡¸¦ ÁØ °ÍÀÌ°í ´Ù¸¥ Çϳª´Â B = °ÅÁþÀÏ ¶§
(¡þB | ¡þG, M, L) = 1 -
(B | ¡þG, M, L) ¿¡ °¡ÁßÄ¡¸¦ ÁØ °ÍÀÌ´Ù. (±×·±µ¥, ±×¸² 1 ¿¡¼´Â G ¿Í M ÀÌ ÁÖ¾îÁ³À»
¶§ B °¡ L ¿¡ Á¶°ÇºÎ µ¶¸³ÀûÀ̹ǷÎ
(B | ¡þG, M, L) =
(B | ¡þG, M) ÀÌ µÈ´Ù.)
G |
M |
B |
L |
»ç·Ê °³¼ö |
Âü |
Âü |
Âü |
Âü |
54 |
Âü |
Âü |
Âü |
°ÅÁþ |
1 |
* |
* |
Âü |
Âü |
7 |
Âü |
°ÅÁþ |
Âü |
°ÅÁþ |
27 |
°ÅÁþ |
Âü |
* |
Âü |
3 |
°ÅÁþ |
°ÅÁþ |
Âü |
°ÅÁþ |
2 |
°ÅÁþ |
°ÅÁþ |
°ÅÁþ |
Âü |
4 |
°ÅÁþ |
°ÅÁþ |
°ÅÁþ |
°ÅÁþ |
2 |
À§¿Í °°Àº °úÁ¤À» B = Âü, L = ÂüÀ̰í G ¿Í M ÀÇ
°ªÀÌ ¾ø´Â 7 °³ ¿¹Á¦¿¡ Àû¿ëÇϰíÀÚ ÇÑ´Ù. °¢ ¿¹Á¦´Â (G, M) ; (G, ¡þM) ; (¡þG, ¡þM)
ÀÇ Á¶ÇÕ¿¡ ÇØ´çÇÏ´Â 4 °³ÀÇ °¡ÁßÄ¡ ¿¹Á¦·Î ¹Ù²î°í °¢°¢¿¡ ´ëÇØ (G, M | B, L),
(G, ¡þM | B, L),
(¡þG, M | B, L),
(¡þG, ¡þM | B, L) ÀÇ È®·üÀ» °¡ÁßÄ¡·Î ÁØ´Ù. ÀÌ È®·üÀ» °è»êÇϱâ À§ÇØ ´Ù½Ã Çѹø
³×Æ®¿öÅ© ±¸Á¶¿Í CPT ¸¦ ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù (¿©±â¼ ¾î´À ÇÑ ¿¹Á¦¶óµµ °á¿©µÈ °ªÀÇ ¼ö°¡
Ä¿Áö¸é ¿¹Á¦°¡ Áö¼öÀûÀ¸·Î Áõ°¡ÇÒ À§ÇèÀÌ ÀÖ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù).
ÀÌÁ¦, °¡ÁßÄ¡ ¿¹Á¦ (°á¿©µÈ °ªµéÀÌ ¸ðµç °¡´ÉÇÑ ¹æ¹ýÀ¸·Î ä¿öÁø ¿¹Á¦) ¿Í ±× ¿Ü ³ª¸ÓÁö ¿¹Á¦ (°á¿©µÈ °ªÀÌ ¾ø´Â ¿¹Á¦) ¸¦ ÇÔ²² ÀÌ¿ëÇØ¼ ºóµµ ¼ö¸¦ ±¸ÇÏ¿© À̰ÍÀ¸·ÎºÎÅÍ CPT ÀÇ ±Ù»çÄ¡¸¦ ±¸ÇÒ ¼ö ÀÖ´Ù. ÀÌ °úÁ¤Àº °á¿©µÈ °ªÀÌ ¾ø´Â °æ¿ì¿Í °°À¸¸ç ´ÜÁö ºóµµ ¼ö°¡ (°¡ÁßÄ¡ ¶§¹®¿¡) Á¤¼ö°¡ ¾Æ´Ò ¼ö ÀÖ´Ù´Â °Í¸¸ ¿¹¿Ü°¡ µÈ´Ù. Àü¿¡ ¾ð±ÞÇÑ ´ë·Î È®·ü Ã߷п¡ ÀÇÇØ °¡ÁßÄ¡¸¦ °è»êÇϱâ À§Çؼ´Â CPT °¡ ÇÊ¿äÇÏÁö¸¸ ¾ÆÁ÷ CPT ¸¦ ±¸ÇÏÁö ¾ÊÀº »óÅÂÀÌ´Ù. CPT ÀÇ ÁýÇÕ¿¡ ÃÊÁ¡À» ¸ÂÃß±â À§ÇØ [Dempster, Laird, & Rubin 1977] ¿¡¼ Á¦¾ÈµÈ ¿¹»óÄ¡ ÃÖ´ëÈ (expectation maximization, EM) ¹æ¹ýÀ» »ç¿ëÇÒ ¼ö ÀÖ´Ù. ¸ÕÀú Àüü ³×Æ®¿öÅ©¿¡ ´ëÇÑ CPT ¿¡ ÀÖ´Â ¸Å°³º¯¼ö¿¡ ´ëÇØ¼ ¹«ÀÛÀ§°ªÀ» ¼±ÅÃÇÑ´Ù. ÀÌ ¹«ÀÛÀ§°ªÀ» ÀÌ¿ëÇØ¼ ÇÊ¿äÇÑ °¡ÁßÄ¡ (°üÂûµÈ µ¥ÀÌÅÍÀÇ °ªÀÌ ÁÖ¾îÁ³À» ¶§ °á¿©µÈ µ¥ÀÌÅÍ °ªÀÇ Á¶°ÇºÎ È®·ü) ¸¦ °è»êÇÑ´Ù. ´Ù½Ã ÀÌ °¡ÁßÄ¡¸¦ ÀÌ¿ëÇØ¼ »õ·Î¿î CPT ¸¦ ±¸ÇÑ´Ù. ÀÌ °úÁ¤À» CPT °¡ ¼ö·ÅÇÒ ¶§±îÁö ¹Ýº¹ÇÑ´Ù. ´ëºÎºÐÀÇ ¹®Á¦¿¡¼ ¼ö·ÅÀº ¸Å¿ì »¡¸® ÀÌ·ç¾îÁø´Ù.
EM ¹æ¹ýÀÇ Àû¿ëÀº È®·ü Ãß·ÐÀ» ¼öÇàÇÏ°í ºóµµ ¼ö¸¦ ±¸ÇÏ´Â ÄÄÇ»ÅÍ ÇÁ·Î±×·¥¿¡ ¸Ã±â´Â °ÍÀÌ °¡Àå Çö¸íÇÏ´Ù. ¾ÕÀÇ ¿¹Á¦¿Í °°ÀÌ °á¿©µÈ °ªÀ» °¡Áø ¼Ò±Ô¸ðÀÇ ¿¹Á¦¶óµµ ¾ÆÁÖ Áö·çÇÑ °è»êÀ» ÇÊ¿ä·Î ÇÒÁö ¸ð¸¥´Ù.
³×Æ®¿öÅ© ±¸Á¶°¡ ¾Ë·ÁÁ® ÀÖÁö ¾ÊÀ¸¸é ÈÆ·Ã µ¥ÀÌÅÍ¿¡ °¡Àå ÀûÇÕÇÑ ±¸Á¶¿Í ¿¬°üµÈ CPT ¸¦ ã¾Æ¾ß ÇÑ´Ù. À̸¦ À§Çؼ´Â Èĺ¸ ³×Æ®¿öÅ©¸¦ Æò°¡ÇÒ Ã´µµ°¡ ÇÊ¿äÇϰí, °¡´ÉÇÑ ±¸Á¶¸¦ Ž»öÇÏ´Â ÇÁ·Î½ÃÀú¸¦ ¸í½ÃÇØ¾ß ÇÑ´Ù. ÀÌ µÎ °¡Áö¸¦ ÀÌ Àý¿¡¼ ´Ù·ç°íÀÚ ÇÑ´Ù.
°æÀïÀûÀÎ ³×Æ®¿öÅ©¸¦ Æò°¡ÇÒ ¶§ ¿©·¯ ôµµ°¡ »ç¿ëµÉ ¼ö ÀÖ´Ù. ±× Áß Çϳª´Â ÄÚµå±æÀÌ (description length) ¿¡ ±â¹ÝÀ» µÐ °ÍÀε¥, ÀÌ ÄÚµå±æÀÌÀÇ ¾ÆÀ̵ð¾î´Â ´ÙÀ½°ú °°´Ù. °¡·É ÈÆ·Ã ÁýÇÕ ¥Î ¸¦ ´©±º°¡¿¡°Ô Àü´ÞÇÑ´Ù°í ÇÏÀÚ. À̸¦ À§Çؼ º¯¼öÀÇ °ªÀ» ºñÆ®ÀÇ ¹®ÀÚ¿·Î ÄÚµåÈÇÒ °ÍÀÌ´Ù. À̶§ ¸î ºñÆ®°¡ ÇÊ¿äÇѰ¡? Áï, ¸Þ½ÃÁöÀÇ ±æÀÌ´Â ¾ó¸¶Àΰ¡? È¿À²ÀûÀÎ ÄÚµå´Â Àü¼ÛµÉ µ¥ÀÌÅͰ¡ °¡Áø Åë°èÀû Ư¼ºÀÇ ÀÌÁ¡À» Àß È°¿ëÇϹǷÎ, ÀÌ Åë°èÀû Ư¼ºÀ» º£ÀÌÁö¾È ³×Æ®¿öÅ©·Î ¸ðµ¨¸µÇÏ·Á°í ÇÑ´Ù. ÀûÀýÇÑ º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ±¸ÇÑ ÈÄ¿¡´Â ÀÌ ³×Æ®¿öÅ©¸¦ ±âÃÊ·Î ÇÑ ÇãÇÁ¸¸ ÄÚµå (Huffman code) ¸¦ ÀÌ¿ëÇØ¼ Àü¼ÛµÉ µ¥ÀÌÅ͸¦ ÄÚµåÈÇÒ ¼ö ÀÖ´Ù. º£ÀÌÁö¾È ³×Æ®¿öÅ© B ¿¡ ÀÇÇØ ÁÖ¾îÁø °áÇÕ È®·ü (joint probability) ¿¡ µû¶ó ºÐÆ÷µÈ µ¥ÀÌÅÍ ÁýÇÕ ¥Î ¸¦ °¡Àå ÃÖÀûÀ¸·Î ÄÚµåÈÇϱâ À§Çؼ´Â ´ÙÀ½°ú °°ÀÌ L(¥Î, B) °³ÀÇ ºñÆ®°¡ ÇÊ¿äÇÏ´Ù´Â °ÍÀÌ Á¤º¸·Ð (information theory) [Cover & Thomas 1991] ¿¡¼ Á¦½ÃµÇ¾ú´Ù.
L(¥Î, B) = -log
[¥Î]
¿©±â¼, [¥Î] ´Â Àü¼ÛµÇ´Â ƯÁ¤ µ¥ÀÌÅÍÀÇ (B ¿¡¼ ±ÔÁ¤ÇÑ
°áÇÕ ºÐÆ÷¿¡ µû¸¥) È®·üÀÌ´Ù. ÁÖ¾îÁø ƯÁ¤ µ¥ÀÌÅÍ ¥Î
¿¡ ´ëÇØ L(¥Î, B) ¸¦ ÃÖ¼ÒÈÇÏ´Â ³×Æ®¿öÅ© B0
¸¦ ±¸ÇÏ¸é µÈ´Ù. ÀÌ Á¢±Ù ¹æ¹ý¿¡ ´ëÇÑ °á·ÐÀ» ¸Î±â Àü¿¡ ¸ÕÀú log
[¥Î] ¸¦ °è»êÇÏÀÚ. µ¥ÀÌÅÍ ¥Î
°¡ m °³ÀÇ ¿¹Á¦ v1, ..., vm À¸·Î ±¸¼ºµÈ´Ù°í °¡Á¤ÇÏÀÚ. À̶§
°¢ v1 ´Â n °³ º¯¼öÀÇ °ª¿¡ ´ëÇÑ n Â÷¿øÀÇ º¤ÅÍÀÌ´Ù. ±×·¯¸é
[¥Î] ´Â °áÇÕ È®·ü
[v1, ..., vm] ÀÌ µÈ´Ù. °¢ µ¥ÀÌÅͰ¡ B ¿¡ ÀÇÇØ ¸í½ÃµÈ
È®·ü ºÐÆ÷¿¡ µû¶ó µ¶¸³ÀûÀ¸·Î Á¦°øµÈ´Ù°í °¡Á¤ÇÏ¸é ´ÙÀ½ µÎ ½ÄÀ» ¾òÀ» ¼ö ÀÖ´Ù.
(¥Î) =
(v1)
-log (¥Î) =
log
(v1)
¿©±â¼ °¢ (v1) (º¯¼öµéÀÌ ¿¡¼ ¸í½ÃµÈ °ªÀ» °¡Áú °áÇÕ È®·ü) vi ´Â
º£ÀÌÁö¾È ³×Æ®¿öÅ©ÀÎ B ·ÎºÎÅÍ °è»êµÈ´Ù. ÀÌ °è»êÀº Áö·çÇϱä ÇÏÁö¸¸ ¿©·¯ º£ÀÌÁö¾È
³×Æ®¿öÅ©·Ñ Æò°¡Çϴµ¥ È®½ÇÈ÷ ÀÌ¿ëµÉ ¼ö ÀÖ´Ù. ¹°·Ð °¢ ³×Æ®¿öÅ©´Â ³×Æ®¿öÅ© ±×·¡ÇÁ
±¸Á¶¿Í CPT ¸¦ ¸ðµÎ Æ÷ÇÔÇÑ´Ù. ³×Æ®¿öÅ© ±¸Á¶¿Í ÈÆ·Ã ÁýÇÕ ¥Î
°¡ ÁÖ¾îÁ³À» ¶§ L(¥Î, B) ¸¦ ÃÖ¼ÒÈÇÏ´Â CPT ´Â ¥Î
¿¡¼ °è»êµÈ Ç¥º» Åë°è·ÎºÎÅÍ ±¸ÇÑ °ÍÀÌ´Ù [Friedman & Goldszmidt 1996a].
ÇÏÁö¸¸ L(¥Î,
B) ´Â ¾ÆÅ©°¡ ¸¹Àº ´ë±Ô¸ð ³×Æ®¿öÅ©Àϼö·Ï ´õ ÈÄÇÑ Á¡¼ö¸¦ Áֱ⠶§¹®¿¡ À̰͸¸À¸·Î´Â
¾ÆÁÖ ÁÁÀº Æò°¡ ôµµ°¡ µÇÁö ¸øÇÑ´Ù. ÀÌ·¯ÇÑ ³×Æ®¿öÅ©´Â ³Ê¹« ¥Î
¿¡¸¸ Àß ¸Âµµ·Ï Ư¼ö鵃 ¼ö ÀÖ´Ù. Áï, ÀÌ µ¥ÀÌÅÍ¿¡ °ú´Ù ÇнÀµÈ °á°ú°¡ µÈ´Ù. Æò°¡
ôµµ¸¦ ÀûÀýÈ÷ Á¶Á¤ÇÏ·Á¸é, B ¿¡ ±â¹ÝÀ» µÐ È¿À²ÀûÀÎ Äڵ带 ÀÌ¿ëÇØ¼ ¥Î
¸¦ ´©±º°¡¿¡°Ô Àü¼ÛÇϱâ À§Çؼ´Â ¼ö½ÅÀÚ°¡ ¸Þ½ÃÁö¸¦ ÇØµ¶ÇÒ ¼ö ÀÖµµ·Ï B ¿¡ ´ëÇÑ
ÄÚµå (description) ¸¦ °°ÀÌ Àü¼ÛÇØ¾ß ÇÑ´Ù´Â °ÍÀ» ±ú´Þ¾Æ¾ß ÇÑ´Ù. µû¶ó¼ L(¥Î,
B) ¿¡ Ç×À» Çϳª Ãß°¡ÇØ¾ß Çϴµ¥ ÀÌ Ç×Àº B ¸¦ Àü¼ÛÇÏ´Â µ¥ ÇÊ¿äÇÑ ¸Þ½ÃÁöÀÇ ±æÀ̰¡
µÈ´Ù. °³·«ÀûÀ¸·Î ¸»Çϸé B ¸¦ Àü¼ÛÇÏ´Â µ¥ ÇÊ¿äÇÑ ºñÆ®¼ö´Â À̸ç, ¿©±â¼ |B| ´Â B ¿¡ ÀÖ´Â ¸Å°³º¯¼öÀÇ °³¼öÀ̰í
Àº ÀϹÝÀûÀ¸·Î °¢ ¼ýÀÚ ¸Å°³º¯¼ö¸¦ ³ªÅ¸³»±â À§ÇØ ÀûÀýÇÑ ºñÆ® ¼ö·Î °£Áֵǰí
ÀÖ´Ù. Á¶Á¤µÈ Æò°¡ ôµµ L'(¥Î, B) ´Â ´ÙÀ½°ú °°´Ù.
L'(¥Î,
B) = log
(vi) +
ÀÌÁ¦ µ¥ÀÌÅÍ¿Í ³×Æ®¿öÅ© ¸ðµÎ¸¦ ÄÚµåÈÇÒ ¶§ ÃÖ¼Ò ÄÚµå±æÀÌ (minimum description length) ¸¦ Á¦°øÇÏ´Â ³×Æ®¿öÅ©¸¦ ±¸ÇϰíÀÚ ÇÑ´Ù. ÀÌ µÎ °è¼ö¸¦ »ç¿ëÇØ¼ µ¥ÀÌÅÍ¿Í ³×Æ®¿öÅ©¸¦ ¸ðµÎ Àü¼ÛÇÒ ¶§ ¾Ë¸ÂÀº ÀýÃæÀ» ÇÒ ¼ö ÀÖ´Ù.
¿¹¸¦ µé¾î ±×¸² 6 ¿¡ ÀÖ´Â ³×Æ®¿öÅ©¿¡ ´ëÇØ¼ ±×¸² 1 ¿¡ ÀÖ´Â µ¥ÀÌÅ͸¦ º¸³»±â À§ÇÑ L'(¥Î, B) ¸¦ °è»êÇØ º¸ÀÚ. ¸ÕÀú, ±×¸² 1 ÀÇ µ¥ÀÌÅ͸¦ Àü¼ÛÇÏ´Â µ¥ ÇÊ¿äÇÑ ºñÆ® ¼öÀÎ L(¥Î, B) ¸¦ °è»êÇÑ´Ù. À̶§ ÀÌ µ¥ÀÌÅÍ´Â ±×¸² 6 ¿¡ ÀÖ´Â º£ÀÌÁö¾È ³×Æ®¿öÅ©¿¡ ÀÇÇØ ÁÖ¾îÁø È®·ü ºÐÆ÷·ÎºÎÅÍ ¾ò¾îÁø´Ù°í °¡Á¤ÇÑ´Ù. ±×¸² 1 ÀÇ Å×ÀÌºí¿¡ Àִ ù° Ç׸ñÀ» (first entry) ÀÇ È®·üÀº ´ÙÀ½°ú °°´Ù.
(first entry) =
(G | B)
(M | B, L)
(B)
(L)
=
0.95 × 0.9 × 0.95 × 0.7 = 0.569
(¹ØÀÌ 2 ÀÎ) À½¼ö ·Î±×¸¦ ÃëÇÏ¸é ´ÙÀ½°ú °°ÀÌ µÈ´Ù.
-log (first entry) = 0.814
ÀÌ µ¥ÀÌÅÍ¿¡ "ù° Ç׸ñ" ÀÌ 54 °³°¡ ÀÖÀ¸¹Ç·Î À̵éÀÇ L(¥Î, B) ¿¡ ´ëÇÑ ±â¿©µµ´Â 54 × 0.814 = 43.9 °¡ µÈ´Ù. Å×À̺íÀÇ ´Ù¸¥ Ç׸ñ¿¡ ÀÖ´Â µ¥ÀÌÅÍÀÇ ±â¿©µµ´Â °¡°¢ 6.16, 27.9, 52.92, 16.33, 12.32, 24.83, 12.32 ÀÌ´Ù. ÀÌ ±â¿©µµ°ªÀ» ´õÇÏ¸é ´ÙÀ½°ú °°ÀÌ µÈ´Ù.
L(¥Î, B) = 196.68 ºñÆ®
´ÙÀ½À¸·Î ±×¸² 6 ÀÇ ³×Æ®¿öÅ©¸¦ Àü¼ÛÇϱâ À§ÇØ ÇÊ¿äÇÑ ºñÆ® ¼öÀÎ À» °è»êÇÑ´Ù. ÀÌ ³×Æ®¿öÅ©¿¡´Â 8 °³ÀÇ ¸Å°³º¯¼ö°¡ ÀÖÀ¸¹Ç·Î ´ÙÀ½°ú °°ÀÌ °è»êµÈ´Ù.
= 4 × 6.64 = 26.58 ºñÆ®
µû¶ó¼ ÀÌ ³×Æ®¿öÅ©¿¡ ´ëÇÑ Æò°¡ ôµµ´Â ´ÙÀ½°ú °°´Ù.
L'(¥Î, B) = 196.68 + 26.58 = 223.26 ºñÆ®
´Ù¸¥ ³×Æ®¿öÅ©µµ °°Àº ¹æ¹ýÀ¸·Î Æò°¡ÇÒ ¼ö ÀÖ´Ù. ¾Æ¸¶µµ ±×¸² 6 ¿¡ ÀÖ´Â °ÍÀÌ °ÅÀÇ ÃÖÀûÀÏ °ÍÀÌ´Ù.
±×¸² 2 ³×Æ®¿öÅ© ÇнÀ¿¡ ´ëÇÑ ½ÇÇè
°¡´ÉÇÑ ¸ðµç º£ÀÌÁö¾È ³×Æ®¿öÅ©ÀÇ ÁýÇÕÀº ³Ê¹«
Å©±â ¶§¹®¿¡ L'(¥Î, B) À» ÃÖ¼ÒÈÇÏ´Â ³×Æ®¿öÅ©¸¦ ±¸Çϱâ
À§ÇØ ¿ÏÀü Ž»ö (exhaustive search) À» ÇÏ´Â °ÍÀº »ý°¢ÇÒ ¼öÁ¶Â÷ ¾ø´Ù. µû¶ó¼,
¾ð´ö ³»·Á¿À±â (hill-descending) ³ª Ž¿å (greedy) Ž»ö°ú °°Àº ¹æ¹ýÀ» ÀÌ¿ëÇØ¼
óÀ½¿¡ ÁÖ¾îÁø ³×Æ®¿öÅ© (¸ðµç º¯¼ö°¡ µ¶¸³ÀûÀ̶ó°í °¡Á¤Çϸç, ¿¹¸¦ µé¾î ¾ÆÅ©°¡
Çϳªµµ ¾ø´Â ³×Æ®¿öÅ©) ¿¡ ´ëÇØ¼ L'(¥Î, B) ¸¦ °è»êÇϰí
³×Æ®¿öÅ©¸¦ Á¶±Ý¾¿ º¯°æ½ÃÄÑ L'(¥Î, B) °¡ °¨¼ÒµÇ´ÂÁö
»ìÆìº¸´Â °ÍÀÌ °¡´ÉÇÒ °ÍÀÌ´Ù. ³×Æ®¿öÅ©¸¦ Á¶±Ý¾¿ º¯°æ½ÃŲ´Ù´Â °ÍÀº ¾ÆÅ©¸¦ Çϳª
Ãß°¡ ¶Ç´Â »èÁ¦Çϰųª ÇÑ ¾ÆÅ©ÀÇ ¹æÇâÀ» ¹Ý´ë·Î ÇÏ´Â °ÍÀ» ¸»ÇÑ´Ù. º¯È°¡ ÀϾ
¶§¸¶´Ù ¥Î ·ÎºÎÅÍ À¯ÃßµÈ Ç¥º» Åë°è¸¦ ÀÌ¿ëÇØ¼ º¯°æµÈ
³×Æ®¿öÅ©ÀÇ CPT ¸¦ °è»êÇÑ´Ù. ÀÌ CPT µéÀº ´Ù½Ã L'(¥Î,
B) ÀÇ log
(vi) Ç×À» °è»êÇÏ´Â µ¥ ÀÌ¿ëµÈ´Ù. »õ·Î¿î ³×Æ®¿öÅ©ÀÇ ¸Å°³º¯¼ö °³¼ö´Â
Ç×À» °è»êÇϴµ¥ ÀÌ¿ëµÈ´Ù. ÀÌ·¯ÇÑ °è»êÀº ÄÚµå±æÀÌÀÇ °è»êÀÌ ³×Æ®¿öÅ©¿¡ ÀÖ´Â
°¢ CPT ¿¡ ´ëÇÑ °è»êÀ¸·Î ºÐÇØ °¡´É (decomposable) ÇÏ´Ù´Â »ç½ÇÀ» ÀÌ¿ëÇÏ¸é °£´ÜÇØÁú
¼ö ÀÖ´Ù. Æò°¡ ôµµ°¡ ºÐÇØ °¡´ÉÇÏ´Ù¸é ÃÑ Ã´µµ´Â Áö¿ª ôµµÀÇ ÇÕÀÌ µÉ °ÍÀÌ´Ù [Friedman
& Goldszmidt 1996a]. µû¶ó¼ ¾ÆÅ©°¡ Ãß°¡, »èÁ¦µÇ°Å³ª ¹æÇâÀÌ ¹Ý´ë·Î µÉ ¶§
Ç¥º» Åë°èÀÇ º¯È¿Í ±× º¯È¿¡ Âü¿©ÇÑ ³ëµå Vi ¿¡ ´ëÇÑ È®·ü
(vi |
(vi)) ¸¸À» °è»êÇÏ¸é µÈ´Ù. ´Ù¸¥
(vi |
(vi)) °ªµéÀº º¯ÇÏÁö ¾Ê´Â´Ù. ³×Æ®¿öÅ©°¡ µ¥ÀÌÅÍ¿¡ ¾ó¸¶³ª ÀûÇÕÇÑÁö¸¦
Æò°¡Çϴµ¥ ÄÚµå±æÀÌ ¿Ü¿¡µµ ´Ù¸¥ ºÐÇØ °¡´ÉÇÑ Ã´µµ°¡ »ç¿ëµÇ¾ú´Ù ([Heckerman, Geiger,
& Chickering 1995] ¸¦ ÂüÁ¶Ç϶ó).
º£ÀÌÁö¾È ³×Æ®¿öÅ©ÀÇ ÇнÀ ¹æ¹ýÀº ¸î¸î Áß¿äÇÑ ¹®Á¦¿¡ ´ëÇÑ ³×Æ®¿öÅ© ±¸Á¶³ª CPT ¸¦ ÇнÀÇÏ´Â µ¥ ÀÌ¿ëµÇ¾ú´Ù. ¿¹¸¦ µé¾î, ±×¸² 2 ÀÇ ³×Æ®¿öÅ©¸¦ °í·ÁÇØ º¸ÀÚ. ¿©±â¼´Â ¼¼ °³ÀÇ ³×Æ®¿öÅ©¸¦ ³ªÅ¸³»¾ú´Ù. ù ¹øÂ° °ÍÀº º´¿øÀÇ ÁßȯÀÚ½ÇÀÇ Åëdz°ü¸®¿¡ »ç¿ëµÇ´Â ¾Ë¶÷ ½Ã½ºÅÛ¿¡ °üÇÑ ¹®Á¦¿¡¼ 37 °³ÀÇ º¯¼ö°£ÀÇ °ü°è¸¦ ÄÚµåÈÇÑ ³×Æ®¿öÅ©ÀÌ´Ù. ÀÌ ¾Ë·ÁÁø ³×Æ®¿öÅ©´Â 37 °³ÀÇ ³ëµå¿¡ ´ëÇÑ 10,000 °³ Å©±âÀÇ ¹«ÀÛÀ§°ª (random value) ÀÇ ÈÆ·Ã ÁýÇÕÀ» »ý¼ºÇϱâ À§ÇØ »ç¿ëµÇ¾ú´Ù. ÀÌ ¹«ÀÛÀ§ ¿¹Á¦¸¦ ÀÌ¿ëÇÏ°í µÎ ¹øÂ° ³×Æ®¿öÅ© (ÀÇÁ¸¼ºÀÌ ¾ø´Â ³×Æ®¿öÅ©) ·ÎºÎÅÍ Ãâ¹ßÇÏ¿© ¾Õ¿¡¼ ±â¼úÇÑ ¹æ¹ýÀ» Àû¿ë½ÃÄÑ ¼¼ ¹øÂ° ³×Æ®¿öÅ©¸¦ ÇнÀÇÏ¿´´Ù (ÀÚ¼¼ÇÑ »çÇ×Àº [Spirtes & Meek 1995] ¸¦ ÂüÁ¶Ç϶ó). ÀÚ¼¼È÷ »ìÆìº¸¸é ù ¹øÂ° ³×Æ®¿öÅ©¿Í ¼¼ ¹øÂ° ³×Æ®¿öÅ©°¡ ´ÜÁö ÇÑ °³ÀÇ ¾ÆÅ©°¡ ºüÁ® ÀÖ´Ù´Â °Í¸¸ Á¦¿ÜÇÏ¸é ¾ÆÁÖ ºñ½ÁÇÑ ±¸Á¶ÀÎ °ÍÀ» ¾Ë ¼ö ÀÖ´Ù.
±×¸² 3 µÎ °³ÀÇ ³×Æ®¿öÅ© - Çϳª´Â Àº´Ðº¯¼ö Æ÷ÇÔ
¶§·Î´Â ÈÆ·Ã ÁýÇÕ ¥Î¿¡¼ °ªÀÌ ÁÖ¾îÁöÁö ¾ÊÀº º¯¼ö¸¦ Ç¥ÇöÇÏ´Â ³ëµå¸¦ ³×Æ®¿öÅ©¿¡ Ãß°¡ÇÔÀ¸·Î½á ³×Æ®¿öÅ© ±¸Á¶¸¦ »ó´çÈ÷ ´Ü¼øÈ½Ãų ¼ö ÀÖ´Ù. ÀÌ·± ³ëµå¸¦ Àº´Ð ³ëµå (hidden node) ¶ó ÇÑ´Ù. °£´ÜÇÑ ¿¹·Î ±×¸² 3 ¿¡ ÀÖ´Â µÎ °³ÀÇ º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ °í·ÁÇÏÀÚ. ¿ÞÂÊ¿¡ ÀÖ´Â ³×Æ®¿öÅ©°¡ ¿À¸¥ÂÊ¿¡ Àº´Ð³ëµå H ¸¦ Æ÷ÇÔÇÑ ³×Æ®¿öÅ©º¸´Ù ´õ ¸¹Àº ¸Å°³º¯¼ö¸¦ °¡Áö°í ÀÖ°í, µû¶ó¼ ¸¸ÀÏ ¿À¸¥ÂÊ ³×Æ®¿öÅ©ÀÇ µ¥ÀÌÅÍ ÀûÇÕµµ°¡ ¿ÞÂÊ ³×Æ®¿öÅ©º¸´Ù °°°Å³ª ´õ ÁÁ´Ù¸é (º¯¼ö »çÀÌÀÇ ³»ÀçµÈ Àΰú°ü°è¸¦ ´õ Àß Ç¥ÇöÇÑ´Ù¸é) ¿ÞÂÊ ³×Æ®¿öÅ©ÀÇ ÄÚµå±æÀÌ Á¡¼ö°¡ ´õ ³ª»Ü °ÍÀÌ´Ù. Àº´Ðº¯¼ö´Â ÃøÁ¤ÇÒ ¼ö ÀÖ´Â °ÍÀÌ ¾Æ´Ï¹Ç·Î Ž»ö °úÁ¤¿¡¼ ¸¸µé¾î³»¾ß ÇÑ´Ù. À̸¦ À§Çؼ´Â Ž¿å Ž»öÀ» ÇÒ ¶§ °¡´ÉÇÑ º¯È ¸®½ºÆ®¿¡ »õ·Î¿î ³ëµåÀÇ Ãß°¡¸¦ Ãß°¡ÇØ¾ß ÇÑ´Ù ([Heckerman 1996] À» ÂüÁ¶Ç϶ó). ´ëÀÀµÇ´Â º¯¼öÀÇ °ªÀº ¹°·Ð °á¿©µÈ µ¥ÀÌÅÍÀ̰í ÀÌ º¯¼ö¿Í ¿¬°üµÈ È®·üÀº ¾Õ¿¡¼ ±â¼úÇÑ ´ë·Î EM ¹æ¹ý¿¡ ÀÇÇØ Á¦½ÃµÇ¾î¾ß ÇÑ´Ù.
È®·ü Ãß·ÐÀ» ÀÌ¿ëÇÏ´Â ¸¹Àº ÀÀ¿ëÀÌ ÀÖ´Ù. ±× Áß¿¡¼ µÎµå·¯Áø °ÍÀº ƯÁ¤ µ¥ÀÌÅÍ¿¡ Àû¿ëµÇ´Â ÀÏ¹Ý Áö½ÄÀ» ¹ÙÅÁÀ¸·Î °¡Àå ÀûÀýÇÑ ÃßÃøÀ» ÇÏ´Â Àú¹®°¡ ½Ã½ºÅÛ¿¡¼ ã¾Æº¼ ¼ö ÀÖ´Ù. ÁÖ¾îÁø Áõ»ó¿¡ ´ëÇØ Áúº´ÀÇ »óŸ¦ Áø´ÜÇÏ´Â °ÍÀÌ ÇÑ ¿¹°¡ µÈ´Ù. ¿©±â¼´Â ¿¡ÀÌÀüÆ®°¡ ÁÖ¾îÁø °¨Áö Á¤º¸¿Í ȯ°æ »óÅÂÀÇ Æò°¡ ôµµ¸¦ ¹ÙÅÁÀ¸·Î °¡Àå ÀûÀýÇÑ ´ÙÀ½ ÇൿÀ» °áÁ¤ÇØ¾ß ÇÒ ¶§, º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇÑ È®·ü Ãß·ÐÀ» ¾î¶»°Ô Àû¿ëÇÏ´ÂÁö¸¦ ±â¼úÇϰíÀÚ ÇÑ´Ù (¿©±â¼´Â ´Ù·ç´Â ¹æ¹ýÀº [Russell & Norvig 1995 ÀÇ 17Àå] ¿¡ ±â¹ÝÀ» µÎ°í ÀÖÀ¸¸ç, [Dean & Wellman 1991 ÀÇ 7Àå] ÀÇ ¹æ¹ýµµ ±â¼úÇÑ´Ù).
¿©±â¼ ´Ù·ç°íÀÚ ÇÏ´Â ¹®Á¦´Â °èȹ, Çൿ ±×¸®°í ÇнÀ¿¡¼ ÀÌ¹Ì µµÀüÇß´ø ¹®Á¦¸¦ ÀϹÝÈÇÑ °ÍÀÌ´Ù. ±×¶§ °¨Áö/°èȹ/Çൿ ÁÖ±â (sense/plan/act cycle) ¸¦ ÀÌ¿ëÇÑ ¿¡ÀÌÀüÆ®¿¡ ´ëÇØ ±â¼úÇß´ø °ÍÀ» ±â¾ïÇÒ °ÍÀÌ´Ù. °èȹ ´Ü°è¿¡¼´Â ¸ñÀûÀ» ÇâÇØ ¸î ´Ü°è ³»´Ùº¸´Â ¹æ¹ýÀ» ÀÌ¿ëÇÏ¿© ÇöÀç ȯ°æ »óȲ¿¡¼ ÃëÇØ¾ß ÇÒ °¡Àå ÀûÀýÇÑ ´ÙÀ½ ÇൿÀ» °è»êÇÏ¿´´Ù. Çൿ ´Ü°è¿¡¼´Â °èȹÀÚ°¡ ÃßõÇÑ ¸Ç óÀ½ ÇൿÀ» ¼öÇàÇÏ¿´°í, °¨Áö ´Ü°è´Â ´ÙÀ½ Áֱ⸦ À§ÇØ °á°ú·Î ³ªÅ¸³ª´Â ȯ°æ »óȲÀ» ÀνÄÇÏ¿´´Ù. °èȹ, Çൿ ±×¸®°í ÇнÀ¿¡¼´Â ¶ÇÇÑ ¸ñÇ¥ (goal) ÀÇ °³³äÀ» ƯÁ¤ÇÑ È¯°æ »óÅ¿¡¼ ÁÖ¾îÁö´Â (¶Ç´Â »©¾Ñ´Â) º¸»ó ¸ñ·Ï (schedule of rewards) À̶õ °ÍÀ¸·Î ÀϹÝȽÃÄ×´Ù. ÀÌ º¸»óÀº ´Ù½Ã °¢ »óÅ¿¡ ´ëÇØ¼ ¾î¶² "°ª" À» À̲ø¾î³»´Âµ¥, ÀÌ °ªÀº ¿¡ÀÌÀüÆ®°¡ º¸»óÀ» ÃÖ´ëÈÇϱâ À§ÇØ ÇൿÇÏ¿© ¾òÀ» ¼ö ÀÖ´Â ÃÑ ÇÒÀÎµÈ ÃßÈÄ º¸»ó (future reward) À¸·Î ³ªÅ¸³½´Ù. ¿©±â¼´Â È¿¿ë¼º (utility) ÀÌ °¢ ȯ°æ »óÅ¿¡¼ ±âÀÎÇÑ´Ù°í º¸°í ÀÌ·¯ÇÑ ÀϹÝÈµÈ ¸ñÇ¥ÀÇ °³³äÀ» °è¼Ó À¯ÁöÇϰíÀÚ ÇÑ´Ù.
ÀÌÀü¿¡ ±â¼úÇÑ °¨Áö/°èȹ/Çൿ ¿¡ÀÌÀüÆ®ÀÇ ±¸Á¶¿¡¼´Â ȯ°æ¿¡ ´ëÇÑ °¡Á¤À̳ª °¨Áö¿Í ÇൿÀÇ ½Å·Ú¼º¿¡ ´ëÇÑ °¡Á¤ÀÌ ´Ù¼Ò ÀϰüÀûÀÌÁö ¸øÇÏ¿´´Ù. Áï, ¿¡ÀÌÀüÆ®°¡ °¨Áö ÀÛ¾÷À» ÅëÇØ¼ ÇöÀç »óŸ¦ Á¤È®È÷ °áÁ¤ÇÒ ¼ö ÀÖ°í ¸ðµç ÇൿÀÇ °á°ú¸¦ Á¤È®È÷ ¿¹ÃøÇÒ ¼ö ÀÖ´Ù°í °¡Á¤ÇÏ¿´´Ù. ÇÏÁö¸¸ ÀÌ·¯ÇÑ °¡Á¤ÀÌ ¸ÂÁö ¾Ê´Â °æ¿ì (ÀϹÝÀûÀ¸·Î ¸ÂÁö ¾ÊÀ½), ¿¡ÀÌÀüÆ®´Â ´ÜÀÏ ÇൿÀ» ÃëÇÏ°í ¹Ù·Î ¼¾¼¸¦ ÀÌ¿ëÇÏ¿© ȯ°æ »óŰ¡ ½ÇÁ¦·Î ¾î¶»°Ô ¹Ù²î¾ú´ÂÁö¸¦ ÆÄ¾ÇÇÏ¿´´Ù. ÀÌ Á¢±Ù ¹æ¹ýÀ» ÇÕ¸®ÀûÀ¸·Î ´Ù·ç±â À§ÇØ, ¼öÇàÇÑ ÇൿÀÌ Ç×»ó ¿¹ÃøµÈ °á°ú¸¦ ³»Áö ¾Ê°Å³ª ¼¾¼°¡ °¡²û Çൿ ¿À·ù¸¦ ÀÏÀ¸Å°´õ¶óµµ ¼¾¼°¡ ¿¡ÀÌÀüÆ®¿¡°Ô »óŰø°£¿¡¼ÀÇ ÁøÇà »óȲÀ» ¾Ë·ÁÁÖ°í ¹Ýº¹ÀûÀ¸·Î °èȹ¼ö¸³À» ÇÏ¿© ¿¡ÀÌÀüÆ®°¡ ¿ä±¸ÇÏ´Â ¸ñÀû (¶Ç´Â º¸»ó) À» ÇâÇØ °¥ ¼ö ÀÖµµ·Ï ¹æÇâÀ» ÀçÁ¶Á¤Çϵµ·Ï ÇÏ¿´´Ù.
ÀÌÁ¦ ºÒÈ®½Ç¼ºÀ» ÀûÀýÈ÷ ´Ù·ê ¼ö ÀÖ´Â µµ±¸°¡ ¸¶·ÃµÇ¾ú±â ¶§¹®¿¡ ¸í½ÃÀûÀ¸·Î Á» ´õ Çö½ÇÀûÀÎ °¡Á¤À» äÅÃÇÒ ¼ö ÀÖ´Ù. »õ·Î¿î ¿¡ÀÌÀüÆ®´Â ÀÚ½ÅÀÌ ¾î¶² »óÅ¿¡ ÀÖ´ÂÁö ¾Ë±âº¸´Ù´Â ÀÚ½ÅÀÌ ¿©·¯ ´Ù¾çÇÑ »óÅ¿¡ ´ëÇØ ³õÀÏ ¼ö ÀÖ´Â È®·ü¸¸À» ¾Ë°Ô µÈ´Ù. ±×¸®°í ȯ°æ »óÅ¿¡ ´ëÇÑ Á¤È®ÇÑ Áö½ÄÀ» ÁÖ´Â ¼¾¼ ´ë½Å¿¡ ¿¡ÀÌÀüÆ®ÀÇ ¼¾¼´Â ÀÌ·¯ÇÑ È®·üÀ» ´Ùµë¾îÁÖ´Â Á¤µµÀÇ ÀÏÀ» ÇÒ »ÓÀÌ´Ù. ÇൿÀÇ °á°ú´Â ¸·¿¬ÇϰԸ¸ ¾Ë ¼ö Àִµ¥, ÁÖ¾îÁø »óÅ¿¡¼ ÃëÇÑ ÇൿÀÇ °á°ú´Â »õ·Î¿î »óÅÂÀÇ ÁýÇÕ¿¡ ÀÖ´Â ¾î¶² »óŵµ µÉ ¼ö ÀÖÀ¸¸ç °¢ »óŸ¶´Ù È®·üÀÌ ¿¬°üµÇ¾î ÀÖ´Ù. °èȹ ¼ö¸³°ú °¨Áö ÀÛ¾÷À» ÅëÇØ¼ ¿¡ÀÌÀüÆ®°¡ È¿¿ë¼ºÀÇ ±â´ë°ªÀ» ÃÖ´ëÈÇÏ´Â ÇൿÀ» ¼±ÅÃÇÒ ¼ö ÀÖµµ·Ï ÇϰíÀÚ ÇÑ´Ù. ¿¡ÀÌÀüÆ®°¡ ÀÌ·¯ÇÑ ¹®Á¦¸¦ ¿ÏÀüÈ÷ ÀϹÝȽÃÄÑ ´Ù·ê ¼ö ÀÖµµ·Ï ÇÏ·Á¸é ¸Å¿ì ¸¹Àº °è»êÀÌ ÇÊ¿äÇϱ⠶§¹®¿¡ ±Ù»çÄ¡ °è»êÀ̳ª ´Ù¸¥ Á¦ÇÑÀûÀÎ °¡Á¤À» ÇØ¾ß ÇÑ´Ù. ÀÌ·¯ÇÑ ³»¿ë¿¡ ´ëÇØ ´ÙÀ½ Àý¿¡¼ ¿¹Á¦¸¦ µé¾î ³íÀÇÇϰíÀÚ ÇÑ´Ù.
¾Õ¿¡¼ ³íÀǵǾú´ø °¡Á¤À» ¹ÙÅÁÀ¸·Î ÀÛ¾÷ÇÒ °æ¿ì °è»êÀÌ ¸Å¿ì ¾î·Á¿öÁö±â ¶§¹®¿¡, ÀÌ ¿¹Á¦¿¡¼´Â ¾ÆÁÖ °£´ÜÇÑ ¿¡ÀÌÀüÆ®¿Í ȯ°æÀ» ÀÌ¿ëÇØ¼ ÁÖµÈ ¾ÆÀ̵ð¾î¸¦ Èñ¼®½ÃŰÁö ¾Ê°Ô ÇÏ·Á°í ÇÑ´Ù. °¡·É ±×¸² 4 ¿¡¼¿Í °°ÀÌ 5 °³ÀÇ ¼¿·Î ±¸¼ºµÈ 1 Â÷¿ø °ÝÀÚ (grid) ¿¡ Á¸ÀçÇÏ´Â ·Îº¿À» °í·ÁÇÏÀÚ. ÀÌ °æ¿ì ȯ°æ »óÅ´ ·Îº¿ÀÇ À§Ä¡¸¸À» Æ÷ÇÔÇϸç, À̰ÍÀº {-2, -1, 0, 1, 2} ÀÇ 5 °³ÀÇ °¡´ÉÇÑ °ªÀ» °®´Â »óꝼö E ·Î ³ªÅ¸³½´Ù. °¢ À§Ä¡´Â ·Îº¿¿¡ ´ëÇÑ È¿¿ë°ª (utility) U ¸¦ °¡Áø´Ù. °¡¿îµ¥ ¼¿Àº È¿¿ë°ªÀÌ 0 À̸ç, ÀÌ·¯ÇÑ È¿¿ë°ªµéÀ» ±×¸²¿¡ ³ªÅ¸³»¾ú´Ù. Ãʱ⿡´Â ·Îº¿ÀÌ t = 0 ÀÎ ½Ã°£¿¡ ÀÚ½ÅÀÌ 0 À¸·Î Ç¥½ÃµÈ ¼¿¿¡ ÀÖ´Ù´Â °ÍÀ» (Á¤È®È÷) ¾È´Ù°í °¡Á¤ÇÑ´Ù. Áï, E0 = 0 ÀÌ´Ù.
±×¸² 4 5 °³ÀÇ ¼¿¿¡ °¤Èù ·Îº¿
i ¹øÂ° ½ÃÁ¡¿¡¼ ·Îº¿ÀÌ ÃëÇÏ´Â ÇൿÀº Ai ÀÇ ±âÈ£·Î ³ªÅ¸³½´Ù. ·Îº¿Àº ¿ÞÂÊÀ¸·Î ÇÑ ¼¿¸¸Å À̵¿ (Ai = L) Çϰųª ¿À¸¥ÂÊÀ¸·Î ÇÑ ¼¿¸¸Å À̵¿ (Ai = R) ÇÒ ¼ö ÀÖ´Ù. ¾î´À °æ¿ìÀÌ°Ç ÇÑ ¹ø À̵¿ÇÏ¿© ÀǵµµÈ °á°ú°¡ ³ª¿Ã È®·üÀº 0.5 À̰í, °¢ ÇൿÀÇ °á°ú·Î ¾Æ¹« º¯È°¡ ¾øÀ» È®·üÀº 0.25 À̸ç, ÇÑ ÇൿÀÌ ·Îº¿À» ÀǵµµÈ ¹æÇâ°ú ¹Ý´ë ¹æÇâ¿¡ ÀÖ´Â ÀÎÁ¢¼¿·Î À̵¿ÇÏ°Ô ÇÒ È®·üÀº 0.25 ÀÌ´Ù. µû¶ó¼, óÀ½ ¸î ¹øÀ» ¿òÁ÷ÀÌ°í ³ª¸é ·Îº¿Àº ÀÚ½ÅÀÇ ½ÇÁ¦ À§Ä¡¿¡ ´ëÇÑ È®·ü Áö½Ä¸¸À» °¡Áö°Ô µÈ´Ù.
·Îº¿Àº °¨Áö½ÅÈ£ Si ¸¦ ÅëÇØ i ¹øÂ° ½ÃÁ¡¿¡¼ÀÇ ÀÚ½ÅÀÇ À§Ä¡¸¦ °¨ÁöÇÑ´Ù. ÇÏÁö¸¸ ¼¾¼°¡ ´Ù¼Ò ½Å·Ú¼ºÀÌ ¾ø´Ù°í °¡Á¤ÇÑ´Ù. Áï, Ei °¡ ¾î¶² °ªÀ» °¡Áú ¶§, Si °¡ °°Àº °ªÀ» °¡Áú È®·üÀ» 0.9 ·Î Çϰí, ´Ù¸¥ °ª 4 °¡Áö Áß ÇϳªÀÏ È®·üÀº 0.025 ÀÌ´Ù.
ÀÌ ·Îº¿¿¡¼ÀÇ ¹®Á¦´Â ¿©·¯ ºÒ¸®ÇÑ Á¶°Ç¿¡ Á÷¸éÇßÀ» ¶§ ¸î ´Ü°è ¾ÕÀ» ³»´Ùº¸°í È¿¿ë¼ºÀÇ ±â´ë°ªÀÌ ÃÖ´ë°¡ µÇµµ·Ï À̵¿ÇÏ´Â °ÍÀÌ´Ù. ·Îº¿ÀÇ ´ÙÀ½ ÇൿÀ» ¼±ÅÃÇÒ ¶§ ÀÌ¿ëµÇ´Â °áÁ¤ ±â¹ýÀº ÇÑ ´Ü°è¸¸ ³»´Ù º» È¿¿ë°ª ±â´ëÄ¡ÀÇ ÃÖ´ëȸ¦ ÅëÇØ ¾ÆÁÖ ½±°Ô ¼³¸íµÉ ¼ö ÀÖ´Ù. ·Îº¿ÀÌ t = 0, Áï A0 = R ÀÏ ¶§ ¿À¸¥ÂÊÀ¸·Î À̵¿ÇÏ·Á ÇÑ´Ù°í ÇÏÀÚ. ÀÌ ÇൿÀÇ °á°ú·Î ¾ò¾îÁö´Â ȯ°æ »óÅ´ Ei ÀÌ µÈ´Ù. ÀÌ ·Îº¿ÀÌ °¨Áö/°èȹ/ÇൿÀÇ Áֱ⸦ °è¼ÓÇϸé ÀÚ½ÅÀÇ À§Ä¡¸¦ ¿¹¸¦ µé¾î Si = 1 À̶ó°í °¨ÁöÇÏ°Ô µÈ´Ù. ´ÙÀ½Àº ¾îµð·Î À̵¿ÇØ¾ß Çϴ°¡? ÀÌ·¸°Ô À̵¿ÇÑ ÈÄ¿¡´Â °¨ÁöµÈ µ¥ÀÌÅ͸¦ ¹ÙÅÁÀ¸·Î ÇÑ À̵¿À̳ª ÇöÀç À§Ä¡¿¡ ´ëÇÑ Ãß·Ð, ±×¸®°í ÇൿÀÇ °á°ú¸¦ ¾î¶»°Ô Áö¼ÓÀûÀ¸·Î ¼±ÅÃÇÒ ¼ö Àִ°¡?
±×¸² 5 µ¿Àû°áÁ¤ ³×Æ®¿öÅ©
µ¿Àû °áÁ¤ ³×Æ®¿öÅ© (dynamic decision network) ¶ó ºÎ¸£´Â Ư¼öÇÑ ÇüÅÂÀÇ ¹ÏÀ½ ³×Æ®¿öÅ© (belief network) ¸¦ ÀÌ¿ëÇÏ´Â È®·ü Ãß·ÐÀº È¿¿ë¼ºÀ» ÃÖ´ëÈÇÏ´Â ÇൿÀ» ¼±ÅÃÇϱâ À§ÇØ »ç¿ëµÉ ¼ö ÀÖ´Ù. ÀÌ ¹®Á¦¿¡ ÀûÇÕÇÑ ³×Æ®¿öÅ©¸¦ ±×¸² 5 ¿¡ ³ªÅ¸³»¾ú´Ù. ÀÌ ³×Æ®¿öÅ©´Â ÇൿÀÌ ÃëÇØÁö°í »õ·Ó°Ô °¨ÁöµÈ Á¤º¸°¡ ÀÖÀ» ¶§¸¶´Ù ·Îº¿ÀÌ ¹Ýº¹ÀûÀ¸·Î Ãß·ÐÀ» ÇÒ ¼ö ÀÖµµ·Ï ÇØÁØ´Ù. E0 = 0, A0 = R, Si = 1 ÀÇ °ªÀÌ ÁÖ¾îÁö¸é Åë»óÀûÀÎ È®·ü Ãß·ÐÀ» ÀÌ¿ëÇØ¼, A1 = R °ú A1 = L ·ÎºÎÅÍ ¾òÀ» ¼ö ÀÖ´Â È¿¿ë°ª ±â´ëÄ¡ÀÎ U2 ¸¦ °è»êÇÑ´Ù. ±×¸®°í ³ª¼ ·Îº¿Àº ÀÌ Áß ´õ Å« °ªÀ» ÁÖ´Â ÇൿÀ» ¼±ÅÃÇÑ´Ù [¾Æ °æ¿ì ÇൿÀÇ ¼±ÅÃÀº ÇÑ ¹øÀÇ À̵¿¸¸ ³»´Ùº»´Ù. ´õ ¸¹ÀÌ ¿¹°ßÇÏ°Ô µÇ¸é ÀÏ·ÃÀÇ ´ë¾È Çൿ (alternative action sequence) ¿¡ ´ëÇÑ ¿ø°Å¸® È¿¿ë°ª (distant utility) À» ´õ ¸¹ÀÌ °è»êÇØ¾ß ÇÑ´Ù]. µ¿Àû°áÁ¤ ³×Æ®¿öÅ©¿¡¼´Â ¼·Î ´Ù¸¥ °¡Á¤À» °®´Â ³ëµå¸¦ ±¸º°Çϱâ À§ÇØ ´Ù¸¥ ¸ð¾çÀÇ ³ëµå¸¦ ÀÌ¿ëÇÑ´Ù. »óÀÚ¸ð¾çÀÇ ³ëµå (¡á) ´Â ¿©ÀüÈ÷ ¿¡ÀÌÀüÆ®¿¡ ÀÇÇØ °ªÀÌ Á¦¾îµÇ´Â º¯¼ö¸¦ °¡¸®Å²´Ù. ÀÌ·± ³ëµå¸¦ °áÁ¤ ³ëµå (decision node) ¶ó ÇÑ´Ù. µ¿Àû °áÁ¤ ³×Æ®¿öÅ©¿¡¼ ¿¡ÀÌÀüÆ®°¡ ÀÌ ³ëµå¸¦ ¼±ÅÃÇÑ ÈÄ¿¡´Â ÀÌ ³ëµå´Â Åë»óÀûÀÎ ¹ÏÀ½ ³×Æ®¿öÅ© ³ëµå (°ªÀÌ ¾Ë·ÁÁø) °¡ µÈ´Ù. ´ÙÀ̾Ƹóµå ¸ð¾çÀÇ ³ëµå (¡ß) ´Â È¿¿ë°ªÀ» ³ªÅ¸³»´Â º¯¼ö¸¦ °¡¸®Å²´Ù. È¿¿ë¼º º¯¼öÀÇ ±â´ë°ªÀº ¿©·¯ °¡Áö ºÎ¸ð°ªµéÀÇ È®·ü¿¡ ´ëÇÑ ÇÔ¼öÀÌ´Ù.
³×Æ®¿öÅ© ±¸Á¶¸¦ º¸¸é ȯ°æÀÌ ¸¶¸£ÄÚÇÁ ȯ°æÀÎ °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. Áï, ½Ã°£ t + 1 ÀÏ ¶§ÀÇ È¯°æ »óÅ´ (°¨ÁöÇÏÁö ¾Ê°íµµ) ½Ã°£ t ÀÏ ¶§ÀÇ È¯°æ »óÅÂ¿Í Çൿ¿¡ ÀÇÇØ¼ (È®·üÀûÀ¸·Î) ¿ÏÀü °áÁ¤µÈ´Ù. ÀÌ·± Ãø¸é¿¡¼ ´ëºÎºÐÀÇ ¿¡ÀÌÀüÆ® ȯ°æÀÌ ¸¶¸£ÄÚÇÁ ȯ°æÀ̶ó°í °¡Á¤ÇÒ ¼ö ÀÖ´Ù (Ãß°¡ º¯¼ö¸¦ µµÀÔÇÏ¿© ¸¶¸£ÄÚÇÁ ȯ°æÀ» ¸¸µé ¼öµµ ÀÖ´Ù). ¶ÇÇÑ ÀÌ ³×Æ®¿öÅ©ÀÇ ±¸Á¶´Â ½Ã°£ t ¿¡¼ÀÇ È¯°æ¿¡ ´ëÇØ t ¿¡¼ °¨ÁöµÈ °ÍÀº ±× Àü¿¡ °¨ÁöµÈ ¸ðµç °Í°ú Á¶°ÇºÎ µ¶¸³ÀûÀ̶ó´Â °¡Á¤À» ³»Æ÷ÇÑ´Ù.
t = 1 ÀÏ ¶§ °èȹµÈ (È¿¿ë°ª ±â´ëÄ¡ÀÎ U2 ¸¦ ÃÖ´ëÈÇÏ´Â °úÁ¤À» °ÅÃÄ °èȹÀÌ ¼ö¸³µÈ) ÇൿÀ» ÃëÇÏ¿© ½ÃÁ¡À» Çϳª ¾ÕÀ¸·Î À̵¿½ÃŰ°í ´ÙÀ½ »óÅÂÀÎ E2 ¿¡¼ S2 ¸¦ °¨ÁöÇÑ ÈÄ¿¡´Â ¶Ç ´Ù¸¥ °¨Áö/°èȹ/ÇൿÀÇ Áֱ⸦ °¡Áö°í Àüü °úÁ¤ÀÌ ¹Ýº¹µÈ´Ù. ÇÊ¿äÇÑ °è»ê Áß ÀϺθ¦ Á÷Á¢ ÇØº¸´Â °ÍÀÌ µµ¿òÀÌ µÉ °ÍÀÌ´Ù.
¸ÕÀú, A1 ¿¡ ´ëÇÑ ¼·Î ´Ù¸¥ µÎ °¡Áö È®·üÀ» °¡Á¤ÇÏ¿©, ½Ã°£ t = 0 ¿¡¼ ¾Ë·ÁÁø °Í¿¡ ´ëÇÑ µÎ °³ÀÇ È¿¿ë°ª ±â´ëÄ¡¸¦ °è»êÇØ¾ß ÇÑ´Ù.
Ex [U2 | E0 = 0, A0
= R, S1 = 1 , A1 = R]
Ex [U2 |
E0 = 0, A0 = R, S1 = 1 , A1
= L]
ÀÌ ±â´ë°ªÀ» ±¸Çϱâ À§Çؼ´Â A1 ÀÇ
µÎ °ªÀÇ °¢°¢¿¡ ´ëÇØ¼ E2 ÀÇ ¿©·¯ °ª¿¡ ´ëÇÑ (E2 | E0 = 0, A0 = R, S1 =
1 , A1) À» °è»êÇØ¾ß ÇÑ´Ù. ÀÌ·¯ÇÑ ÇüÅÂÀÇ °è»êÀº ³ªÁß ´Ü°è¿¡¼µµ ¹Ýº¹µÇÁö¸¸
±¸Ã¼ÈÇϱâ À§ÇØ Çö ´Ü°è¿¡ ´ëÇØ¼ ¼öÇàÇϰíÀÚ ÇÑ´Ù. ÀÌ ÇüÅ´ A1 ÀÇ
°¢ °ª¿¡ ´ëÇØ µ¿ÀÏÇϱ⠶§¹®¿¡ A1 = R ÀÏ °æ¿ì¸¸ ±¸ÇÏ¸é µÈ´Ù. ¾ÕÀå¿¡¼
¼³¸íÇÑ ´ÙÁ߯®¸® (polytree) ¾Ë°í¸®ÁòÀ» ÀÌ¿ëÇÏ¿©
(E2 | E0 = 0, A0 = R, S1 =
1, A1 = R) À» °è»êÇØ º¸ÀÚ.
¸ÕÀú, "°ªÀÌ ÁÖ¾îÁöÁö ¾ÊÀº ºÎ¸ð¸¦ Æ÷ÇÔ½ÃÄÑ" ´ÙÀ½À» ¾ò´Â´Ù.
(E2 | E0 = 0, A0 = R, S1 =
1, A1 = R)
=
(E2 | A1 = R, E1)
(E1 | E0 = 0, A0 = R, S1 =
1)
·Îº¿ÀÇ ÇൿÀ» ¼±ÅÃÇϱâ À§ÇØ »ç¿ëµÇ´Â °áÁ¤ ³×Æ®¿öÅ©¿¡¼´Â ÀÌ ÇÕ»ê °ø½ÄÀÇ Ã¹ ¹øÂ° Ç×À» ¸¶¸£ÄÚÇÁ ÇÁ·Î¼¼½ºÀÇ Çൿ ¸ðµ¨ (action model) À̶ó ÇÑ´Ù. ÀÌ ¸ðµ¨Àº ¹Ù·Î ÀüÀÇ »óÅÂ¿Í ÇൿÀÌ ÁÖ¾îÁ³À» ¶§ °¡´ÉÇÑ ¿©·¯ °¡Áö ´ÙÀ½ »óȲ¿¡ ´ëÇÑ È®·üÀ» ³ªÅ¸³½´Ù. ´ÙÁ߯®¸® ¾Ë°í¸®Áò¿¡ µû¸£¸é ÀÌ ÇÕ»ê °ø½ÄÀÇ µÎ ¹øÂ° Ç×Àº º£ÀÌÁö¾È ±ÔÄ¢À» ÀÌ¿ëÇÏ¿© ´ÙÀ½°ú °°ÀÌ ´Ù½Ã ¾µ ¼ö ÀÖ´Ù.
(E2 | E0 = 0, A0 = R, S1 =
1) =
(S1 = 1 | E1)
(E1 | E0 = 0, A0 = R)
ÀÌ °ö¼À¿¡¼ ù ¹øÂ° Ç×À» ¼¾¼ ¸ðµ¨ (sensor model) À̶ó ÇÑ´Ù. ÀÌ ¸ðµ¨Àº ÀÓÀÇÀÇ È¯°æ »óȲ¿¡ ´ëÇØ¼ ¼¾¼°¡ ¿©·¯ °ªÀ» °¡Áú È®·üÀ» ³ªÅ¸³½´Ù (¿ÏÀüÈ÷ ½Å·ÚÇÒ ¼ö ÀÖ°í ¸Å¿ì À¯ÀÍÇÑ ¼¾¼¶ó¸é ¸ðµç È®·üÀ» ±¸ÇÒ ¶§ °¢ ȯ°æ »óÅ¿¡ ´ëÇØ¼ ÇϳªÀÇ ¼¾¼°ª¿¡¸¸ ÁýÁßÇÒ °ÍÀÌ´Ù). µÎ ¹øÂ° Ç×Àº ¾Õ¿¡¼¿Í °°ÀÌ Çൿ ¸ðµ¨ÀÌ µÈ´Ù.
ÀÌ °á°úµéÀ» ¸ðÀ¸¸é ´ÙÀ½°ú °°´Ù.
(E2 | E0 = 0, A0 = R, S1 =
1, A1 = R)
=
(E2 | A1 = R, E1)
(S1 = 1 | E1)
(E1 | E0 = 0, A0 = R)
ÀÌ Ç¥Çö½ÄÀ» (E2 ÀÇ ¿©·¯ °ª¿¡
´ëÇØ) °è»êÇϱâ À§ÇØ ÇൿÀÇ °á°ú¿Í ¼¾¼ÀÇ ½Å·Ú¼º¿¡ ´ëÇØ ³»·È´ø È®·ü°¡Á¤À» ÀÌ¿ëÇÑ´Ù.
À̸¦ ½Ã¿¬Çϱâ À§ÇØ (E2 = 1 | E0 = 0, A0 = R, S1 =
1, A1 = R) ¸¸À» °è»êÇØ º¸ÀÚ. ÀÌ °è»êÀº ´ÙÀ½°ú °°Àº È®·üÀ» Æ÷ÇÔÇϸç
ÀÌ È®·üÀº ±×¸² 5 ¿¡ ÀÖ´Â ³×Æ®¿öÅ©¿¡ ´ëÇÑ CPT ÀÇ Ç׸ñÀ¸·Î µé¾î°¡°Ô µÈ´Ù (¸ðµç
E1 °ª¿¡ ´ëÇØ ÇÕ»êÀ» ÇØ¾ß ÇÑ´Ù).
(E2 = 1 | A1 = R, E1 = 0) = 0.5
(E2 = 1 | A1 = R, E1 = 1) = 0.25
(E2 = 1 | A1 = R, E1 = 2) = 0.25
(E2 = 1 | A1 = R, E1 = -1) ¿Í
(E2 = 1 | A1 = R, E1 = -2) ´Â ¸ðµÎ
0
(S1 = 1 | E1 = -2) = 0.025
(S1 = 1 | E1 = -1) = 0.025
(S1 = 1 | E1 = 0) = 0.025
(S1 = 1 | E1 = 1) = 0.9
(S1 = 1 | E1 = 2) = 0.025
(E1 = -1 | E0 = 0, A0 = R) = 0.25
(E1 = 0 | E0 = 0, A0 = R) = 0.25
(E1 = 1 | E0 = 0, A0 = R) = 0.5
(E1 = -2 | E0 = 0, A0 = R) ¿Í
(E1 = 2 | E0 = 0, A0 = R) ´Â ¸ðµÎ
0
ÇÕ»êÀ» ÇÏ¸é ´ÙÀ½°ú °°ÀÌ µÈ´Ù.
(E2 = 1 | E0 = 0, A0 = R, S1 =
1, A1 = R)
= × [(0.5 × 0.025 × 0.25) + (0.25 × 0.9 × 0.5)]
= × 0.14375
E2 ÀÇ ´Ù¸¥ °ª¿¡ ´ëÇÑ (E2 | E0 = 0, A0 = R, S1 =
1, A1 = R) ¸¦ ±¸Çϱâ À§Çؼµµ À¯»çÇÑ °è»êÀ» ¼öÇàÇÑ´Ù. ÀÌ ¸ðµç
È®·üÀÇ ÇÕÀº 1 À̹ǷÎ
¸¦ ±¸ÇÒ ¼ö ÀÖ´Ù. E2 ¿¡ ´ëÇÑ ÀÌ È®·üÀ» ÀÌ¿ëÇØ¼ A1
= R ÀÏ ¶§ÀÇ U2 ÀÇ ±â´ëÄ¡¸¦ °è»êÇÏ°Ô µÈ´Ù. ÀÌ °úÁ¤À» ¹Ýº¹ÇÏ¿©
A1 = L ÀÏ ¶§ U2 ÀÇ ±â´ëÄ¡¸¦ °è»êÇÏ°í ±× Áß Å« °ªÀ»
°¡Áö´Â ÇൿÀ» ¼±ÅÃÇÏ°Ô µÈ´Ù (ÀÌ ¹®Á¦ÀÇ ±¸Á¶·Î º¼ ¶§ A1 = R ÀÇ
ÇൿÀÌ ¼±ÅÃµÉ °ÍÀÌ ´ç¿¬ÇÏÁö¸¸ ¹æ¹ýÀ» ¼³¸íÇϱâ À§ÇØ ÀÌ ¿¹Á¦¸¦ ÀÌ¿ëÇÏ¿´´Ù)
(E2 | E0 = 0, A0 = R, S1 =
1, A1 = R) ¿¡ ´ëÇÑ °ø½ÄÀ» ºÐ¼®ÇØ º¸¸é ÀÌ °ø½ÄÀ» Â÷ÈÄÀÇ ½ÃÁ¡À¸·Î È®ÀåÇÒ
¼ö ÀÖ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. ÀÌ °ø½ÄÀº ½Ã°£ t = 1 ¿¡¼ S1 = 1
ÀÌ °¨ÁöµÇ°í ³ª¼ A1 = R ÀÇ ÇൿÀÌ ÃëÇØÁö±â Àü¿¡ °è»êµÈ´Ù. µû¶ó¼
À§ÀÇ °ø½Ä ´ë½Å¿¡
(E2 | <values before t = 1>, S1 =
1, A1 = R) °ú °°ÀÌ ¾µ ¼ö ÀÖ´Ù. ÀÌ¿Í ºñ½ÁÇÏ°Ô ÇÕ»ê °ø½Ä¿¡¼ÀÇ
(E1 | E0 = 0, A0 = R) ÀÇ Ç¥Çö½ÄÀº
(E1 | <values before t = 1>) °ú °°ÀÌ ¾µ ¼ö
ÀÖ´Ù. ÀÌ·¯ÇÑ º¯°æÀ» °í·ÁÇÏ¸é ´ÙÀ½°ú °°Àº ½ÄÀ» ¾ò´Â´Ù.
(E2 | <values before t = 1>, S1 =
1, A1)
= (Ei+1 | Ai, Ei)
(Si = si | Ei)
(Ei | <values before t = i>)
Çൿ¿¡ ´ëÇÑ °áÁ¤À» ³»¸®±â À§Çؼ´Â ½Ã°£ÀÌ °æ°úÇÒ ¶§¸¶´Ù ´ÙÀ½°ú °°Àº ¹æ¹ýÀ¸·Î ÀÌ °ø½ÄÀ» ÀÌ¿ëÇÑ´Ù. ½Ã°£ t = i ¿¡¼ ÃëÇÒ A1 ÀÇ ÇൿÀ» °è»êÇϱâ À§Çؼ´Â ´ÙÀ½°ú °°ÀÌ ÇÑ´Ù.
1. ¹Ù·Î
ÀüÀÎ (i - 1) ½ÃÁ¡À¸·ÎºÎÅÍ (±×¸®°í, Si-1 =
si-1 À»
°¨ÁöÇÑ ÈÄ), ÀÌ¹Ì Ei ÀÇ ¸ðµç
°ª¿¡ ´ëÇØ 2.
½Ã°£ t = i ¿¡¼ Si =
si ¸¦
°¨ÁöÇÏ°í ¼¾¼ ¸ðµ¨À» ÀÌ¿ëÇØ¼ Ei ÀÇ
¸ðµç °ª¿¡ ´ëÇØ 3.
Çൿ ¸ðµ¨·ÎºÎÅÍ Ei ¿Í
Ai ÀÇ
¸ðµç °ª¿¡ ´ëÇØ 4.
Ai
ÀÇ °¢ °ª°ú Ei+1 ÀÇ
ƯÁ¤°ª¿¡ ´ëÇØ 5.
¹Ù·Î Àü ´Ü°è¸¦ Ei+1 ÀÇ
¸ðµç °ª¿¡ ´ëÇØ ¹Ýº¹ÇÏ¿© Ei+1 °ú
A i
ÀÇ °¢ °ª¿¡ ´ëÇØ 6. ÀÌ È®·ü°ªµéÀ» ÀÌ¿ëÇØ¼ Ai ÀÇ °¢ °ª¿¡ ´ëÇÑ Ui+1 ÀÇ ±â´ëÄ¡¸¦ °è»êÇÏ°í ±â´ëÄ¡¸¦ ÃÖ´ëÈÇÏ´Â Ai ¸¦ ¼±ÅÃÇÑ´Ù. 7. ÀÌÀü ´Ü°è¿¡¼ ¼±ÅÃµÈ ÇൿÀ» ¼öÇàÇϰí, i ¸¦ Çϳª Áõ°¡½ÃŲ ÈÄ À§ °úÁ¤À» ¹Ýº¹ÇÑ´Ù. |
À̰ÍÀÌ ¹Ù·Î µ¿Àû °áÁ¤ ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇØ¼ ÇൿÀ» ¼±ÅÃÇÏ´Â ÇÙ½É °úÁ¤ÀÌ´Ù. ÀÌ ¹æ¹ýÀº À§¿Í °°Àº ½¬¿î ¿¹Á¦ ÀÌ»óÀÇ ¿¹Á¦¿¡µµ È®ÀåµÈ´Ù. ÇൿÀÌ È¯°æ¿¡ ¹ÌÄ¡´Â ¿µÇâÀ̳ª ȯ°æÀÌ ¼¾¼ Àڱؿ¡ ¹ÌÄ¡´Â ¿µÇâµéÀº ÀϹÝÀûÀ¸·Î ±×¸² 5 ¿Í À¯»çÇÑ ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇÏ¿© Àß ¸ðµ¨¸µµÉ ¼ö ÀÖ´Ù. °¢ ½ÃÁ¡¿¡¼ ´ÜÀÏ È¯°æº¯¼öÀÎ Ei ´ë½Å¿¡ °ª º¤ÅÍÀÎ Ei = (Ei1, ..., Ein) À» ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù. ÀÌ¿Í ºñ½ÁÇϰÔ, ´ÜÀÏ °¨Áöº¯¼öÀÎ Si ´ë½Å¿¡ °ª º¤ÅÍÀÎ Si = (Si1, ..., Sim)À» ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù. ¹°·Ð °¢ ½ÃÁ¡¿¡¼ÀÇ µ¿Àû °áÁ¤ ³×Æ®¿öÅ©´Â ÀÌ·± ¸ðµç º¯¼ö¿Í Á¾¼Ó¼º¿¡ ´ëÇÑ ³ëµå¸¦ Æ÷ÇÔ½Ãų ¼ö ÀÖµµ·Ï È®ÀåµÇ¾î¾ß ÇÏÁö¸¸, ÀϹÝÀûÀÎ °è»ê ÇüÅ´ ¾Õ¿¡¼ °£´ÜÇÑ ¿¹Á¦¿¡ ´ëÇØ ÇÑ °Í°ú µ¿ÀÏÇÏ´Ù. ÁÖ¾îÁø ½ÃÁ¡¿¡¼ ³»ºÎÀûÀÎ ³×Æ®¿öÅ©°¡ º¹ÀâÇÏ´õ¶óµµ ¸¶¸£ÄÚÇÁÀÇ °¡Á¤Àº ½ÃÁ¡ »çÀÌÀÇ Á¾¼Ó¼ºÀ» ´Ü¼øÈ½ÃŲ´Ù.
ÇÑ ´Ü°è ÀÌ»óÀ» ³»´Ùº¸·Á¸é È®·üÀ» È¿¿ë°ª ±â´ëÄ¡°¡ °è»êµÇ´Â ÁöÁ¡±îÁö Àü´ÞÇØ¾ß ÇÑ´Ù. ´ç¿¬È÷ ÀÌ·¯ÇÑ È®ÀåÀº ±Ý»õ ºñÇö½ÇÀûÀÎ °ÍÀ¸·Î ³ªÅ¸³´Ù. ´õ±¸³ª Ei ¿¡ ´ëÇÑ È®·ü ºÐÆ÷°¡ ¸Å¿ì ±¤¹üÀ§ÇÏ°Ô Èð¾îÁú ¼ö Àֱ⠶§¹®¿¡ À¯¿ë¼ºµµ ¶³¾îÁø´Ù. µû¶ó¼ ÀÌ·¯ÇÑ È®·üÀû È®ÀåÀ» Á¦¾ÈÇϱâ Àü¿¡ ¾ð±ÞÇß´ø ´Ù¼Ò Àϰü¼ºÀÌ ¾ø´Â °¡Á¤À» Æ÷ÇÔÇÏ´Â ÀýÃæ ¹æ¹ýÀÌ ÇÕ¸®ÀûÀÎ ´ë¾ÈÀÌ µÉ ¼ö ÀÖ´Ù.
º£ÀÌÁö¾È ³×Æ®¿öÅ©¿¡ ´ëÇÑ ÇнÀÀº ¸Å³â »õ·Î¿î Áß¿äÇÑ ³í¹®ÀÌ ¹ßÇ¥µÇ´Â Ȱ¹ßÇÑ ¿¬±¸ ºÐ¾ßÀÌ´Ù. [Neal 1991 (Neal, R., "Connectionist Learning Of Belief Networks," Artificial Intelligence, 56:71-113, 1991.)] Àº ½Å°æ¸ÁÀ» ÀÌ¿ëÇØ¼ º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ÇнÀÇÏ´Â ¹æ¹ýÀ» ±â¼úÇÏ¿´´Ù. Á¦½ÃµÈ º£ÀÌÁö¾È ³×Æ®¿öÅ© ±¸Á¶¸¦ Æò°¡Çϱâ À§ÇØ ÀÌ Ã¥¿¡¼ ±â¼úµÈ ±â¹ýÀº ÃÖ¼Ò ÄÚµå±æÀÌ [Rissanen 1984 (Rissanen, J., "Universal Coding, Information, Prediction, and Estimation," IEEE Transactions on Information Theory, IT-30(4):629-636, 1984.)] ÀÇ °³³äÀ» ÀÌ¿ëÇÏ¿´´Ù. [Friedman 1997 (Friedman, N., "Learning Belief Networks in the Presence of Missing Values and Hidden Variables," Proceedings of the Fourteenth International Conference on Machine Learning (ICML '97), San Francisco: Morgan Kaufmann, 1997.)] Àº ³×Æ®¿öÅ©ÀÇ ±¸Á¶¸¦ ¾ËÁö ¸øÇÏ°í °á¿©µÈ µ¥ÀÌÅͰ¡ Á¸ÀçÇÒ °æ¿ì¿¡ º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ÇнÀÇÏ´Â ±â¹ýÀ» ±â¼úÇÏ¿´´Ù. º£ÀÌÁö¾È ³×Æ®¿öÅ©ÀÇ ÇнÀ¿¡ ´ëÇÑ Ãʱ⠿¬±¸´Â [Cooper & Herskovitz 1992 (Cooper, G., and Herskovitz, E., "A Bayesian Method for the Induction of Probabilistic Networks 'from Data," Machine Learning, 9:309-347, 1992.)] ¿¡ ÀÇÇØ ÀÌ·ç¾îÁ³´Ù.
[Forbes, et al. 1995 (Forbes, J., Huang, T., Kanazawa, K., and Russell, S., "The BATmobile: Towards a Bayesian Automatic Taxi," in Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence (IJCAI-95), pp.1878-1885, San Francisco: Morgan Kaufmann, 1995.)] ´Â µ¿Àû °áÁ¤ ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇØ¼ ÀÚµ¿Â÷¸¦ ¿îÀüÇÏ´Â ½Ã½ºÅÛÀ» Á¦½ÃÇÏ¿´´Ù.
È®·üÀû »óȲ (stochastic situation) ¿¡¼ÀÇ È¿¿ë¼º Æò°¡´Â °áÁ¤·Ð (decision theory) ºÐ¾ßÀÇ ÁÖµÈ °ü½É»çÀÌ´Ù. AI ¿¡¼ °áÁ¤·ÐÀÇ ÀÌ¿ëÀ» ¾î¶»°Ô ´Ù·ç´ÂÁö¸¦ º¸·Á¸é [Horvitz, Breese, & Henrion 1988 (Horvitz, E., Breese, J., and Henrion, M., "Decision Theory in Expert Systems and Artificial Intelligence," International Journal of Approximate Reasoning, 2:247-302, 1988.)]À» ÂüÁ¶Ç϶ó. ¸¶¸£ÄÚÇÁ °áÁ¤ ¹®Á¦ (Markov decision problems, MDPs) [Puterman 1994 (Puterman, M., Markov Decision Processesm Discrete Stochastic Dynamic Programming, New York: John Wiley & Sons, 1994.)] ¿¡ ´ëÇÑ À̷аú ºÎºÐÀûÀ¸·Î °üÂû °¡´ÉÇÑ ¸¶¸£ÄÚÇÁ °áÁ¤ ¹®Á¦ (partially observable MDPs, POMDPs) [Cassandra, Kaelbling, & Littman 1994 (Cassandra, A., Kaelbling, L., and Littman, M., "Acting Optimally in Partially Observable Stochastic Domains," in Proceedings of the Twelfth National Conference on Artificial Intelligence (AAAI-94), pp.1023-1028, Menlo Park, CA: AAAI Press, 1994.)] ¿¡ ´ëÇÑ ÀÌ·ÐÀº È®·üÀû »óȲ¿¡¼ ÇൿÀÇ °á°ú¿¡ ´ëÇÑ ±âº»Àû ÀÌ·Ð ¸ðµ¨À» Á¦°øÇÑ´Ù.