µÚ5ÕÂ
CHAPTER 5


Éî²ãÉñ¾­ÍøÂçµÄÑµÁ··½·¨









±¾ÕÂ½«ÏêÏ¸½éÉÜÉî²ãÉñ¾­ÍøÂçÑµÁ·¹ý³ÌÖÐµÄÏà¹ØÏ¸½ÚºÍÊµ¼ùÖÐ¾­³£Ê¹ÓÃµÄ·½·¨ºÍ¼¼ÇÉ¡£Éñ¾­ÍøÂçµÄÑµÁ·ÊµÖÊÉÏÊÇÒ»¸öÓÅ»¯ÎÊÌâ£¬5.1½ÚºÍ5.2½Ú½«ÏêÏ¸½éÉÜ¸÷ÖÖÓÅ»¯Ëã·¨£¬²¢±È½Ï¸÷ÖÖÓÅ»¯Ëã·¨µÄÓÅÁÓ£¬°ïÖú¶ÁÕßÔÚÊµ¼ùÖÐÑ¡ÔñºÏÊÊµÄÓÅ»¯Ëã·¨¡£Ê×ÏÈ£¬¶ÔÌÝ¶ÈÏÂ½µËã·¨´æÔÚµÄÎÊÌâ½øÐÐ²ûÊö£¬È»ºó»ùÓÚ´ËÒý³öÆäËû¸Ä½øµÄÓÅ»¯Ëã·¨¡£ÕâÐ©¸Ä½øµÄËã·¨Ö÷Òª´ÓÁ½¸ö·½Ãæ¶ÔÔ­Ê¼Ëæ»úÌÝ¶ÈÏÂ½µËã·¨½øÐÐ¸Ä½ø£¬ÆäÖÐÒ»´óÀàÓÅ»¯Ëã·¨Ö¼ÔÚµ÷Õû²ÎÊý¸üÐÂ·½Ïò£¬ÓÅ»¯ÑµÁ·ËÙ¶È£» ¶øÁíÒ»´óÀàËã·¨Ö¼ÔÚµ÷ÕûÑ§Ï°ÂÊ£¬¼´¶Ô²½³¤×ö¸Ä½ø£¬Ê¹µÃÓÅ»¯¸ü¼ÓÎÈ¶¨¡£µ÷Õû²ÎÊý¸üÐÂ·½ÏòµÄÓÅ»¯Ëã·¨ÓÐ¶¯Á¿·¨£¨»ò³ÆÎª´ø¶¯Á¿µÄËæ»úÌÝ¶ÈÏÂ½µËã·¨£©¡¢Nesterov¼ÓËÙÌÝ¶È£» µ÷ÕûÑ§Ï°ÂÊµÄËã·¨Ö÷Òª°üÀ¨AdaGrad¡¢RMSprop¡¢AdaDelta£¬¶øAdamËã·¨¶ÔÕâÁ½·½Ãæ¶¼×öÁËÏàÓ¦µÄµ÷Õû¡£ÁíÍâ£¬¶ÔÓÚ¶þ½×ÓÅ»¯Ëã·¨Å£¶Ù·¨¡¢ÄâÅ£¶Ù·¨Ò²»á×öÏàÓ¦½éÉÜ¡£5.3½Ú½éÉÜ³£¼ûµÄ¼¸ÖÖ²ÎÊý³õÊ¼»¯·½·¨£¬ÈçXavier³õÊ¼»¯¡¢He³õÊ¼»¯µÈ¡£ÁíÍâ£¬»¹»á½éÉÜÖð²ã½øÐÐÅúÁ¿¹éÒ»»¯²Ù×÷È»ºóÊ¹ÓÃÐ¡Ëæ»úÊý½øÐÐ³õÊ¼»¯µÄ·½·¨£¬ÕâÑù¿ÉÒÔ½µµÍ¶Ô²ÎÊý³õÊ¼»¯µÄÒªÇó£¬ÔÚÊµ¼ùÖÐÈ¡µÃÁË²»´íµÄÐ§¹û¡£ºÏÀíÕýÔò»¯µÄÍøÂçÄ£ÐÍ¾ßÓÐ¸üºÃµÄ·º»¯ÄÜÁ¦£¬5.4½Ú½«½éÉÜ¼¸ÖÖ³£ÓÃµÄÕýÔò»¯²ßÂÔ¡£ÎªÁËÌáÉýÄ£ÐÍÐÔÄÜ£¬5.5Ð¡½Ú½«½éÉÜ¼¸ÖÖÑµÁ·Éî²ãÉñ¾­ÍøÂç³£ÓÃµÄÐ¡¼¼ÇÉ£¬ÀýÈçÊý¾ÝÔ¤´¦Àí¡¢³¬²ÎÊýµ÷ÓÅµÈ£¬ÓÐÐ©·½·¨ÒÑ³ÉÎªÄ£ÐÍÑµÁ·µÄ±ê×¼²Ù×÷¡£
5.1²ÎÊý¸üÐÂ·½·¨
±¾½Ú½éÉÜ²ÎÊý¸üÐÂ·½·¨¡£Ê×ÏÈ£¬·ÖÎöÌÝ¶ÈÏÂ½µËã·¨µÄÎÊÌâ£¬È»ºó½éÉÜ¸Ä½øµÄÓÅ»¯²ßÂÔ£¬Ä¿µÄÊÇµ÷Õû²ÎÊý¸üÐÂ·½Ïò£¬ÓÅ»¯ÑµÁ·ËÙ¶È£¬°üÀ¨»ùÓÚ¶¯Á¿µÄ¸üÐÂ¡£ÁíÍâ¶ÔÓÚ¶þ½×ÓÅ»¯Ëã·¨Å£¶Ù·¨¡¢ÄâÅ£¶Ù·¨Ò²»á×öÏàÓ¦½éÉÜ¡£
5.1.1ÌÝ¶ÈÏÂ½µËã·¨µÄÎÊÌâ
ÔÚµÚ2ÕÂÖÐÒÑ¾­Ìáµ½£¬Ä£ÐÍ±íÏÖµÄºÃ»µÊÇÍ¨¹ýËðÊ§º¯ÊýºâÁ¿µÄ£¬ÐèÒªÕÒµ½ÈÃËðÊ§º¯ÊýÈ¡µÃ×îÐ¡ÖµµÄ²ÎÊý¾ØÕóW£¬ÕâÒ»¹ý³ÌÊÇÒ»¸öÓÅ»¯ÎÊÌâ£¬Í¨³£Ê¹ÓÃµü´úÓÅ»¯·½·¨À´ÕÒµ½×îÓÅ½â¡£ÐèÒª×¢ÒâµÄÊÇ£¬¶ÔÓÚÉî²ãÉñ¾­ÍøÂç£¬ÓÉÓÚÆä¸ß¶È·ÇÏßÐÔÌØÐÔ£¬ÓÅ»¯µÄÄ¿±êº¯ÊýÊÇÒ»¸ö·ÇÍ¹º¯Êý£¬Òò´ËÉñ¾­ÍøÂçµÄÓÅ»¯ÊÇÒ»¸ö·ÇÍ¹ÓÅ»¯ÎÊÌâ£¬²ßÂÔÉÏÓëÍ¹ÓÅ»¯ÎÊÌâÓÐÐ©²»Í¬¡£µÚ2ÕÂÌáµ½ÁËÌÝ¶ÈÏÂ½µËã·¨£¬ÒÔ¼°Ó¦¶Ô´óÊý¾ÝÁ¿¸ß¼ÆËã³É±¾µÄ½â¾ö·½°¸¡ª¡ªÐ¡ÅúÁ¿ÌÝ¶ÈÏÂ½µËã·¨ºÍËæ»úÌÝ¶ÈÏÂ½µËã·¨£¬ËüÃÇ·Ö±ðÊ¹ÓÃÈ«²¿ÑµÁ·¼¯Ñù±¾¡¢Ð¡ÅúÁ¿ÑµÁ·¼¯Ñù±¾ºÍÒ»¸öÑù±¾Çó½âËðÊ§ºÍÌÝ¶È¡£Ð¡ÅúÁ¿ÌÝ¶ÈÏÂ½µËã·¨ºÍËæ»úÌÝ¶ÈÏÂ½µËã·¨ÊÇ¶ÔÊµ¼ÊËðÊ§ºÍÌÝ¶ÈµÄ¹À¼Æ¡£Êµ¼ÊÓ¦ÓÃÖÐ£¬¿ÉÒÔ¸ù¾ÝÊý¾ÝÁ¿ºÍ²ÎÊýÁ¿£¬ÒÔ¼°¾«¶ÈºÍ¼ÆËãÁ¿Ö®¼äµÄÈ¨ºâ£¬ÈÎÒâÑ¡È¡ÆäÖÐÒ»ÖÖ·½Ê½¡£ÌÝ¶ÈÏÂ½µËã·¨ÊÇ×î¼òµ¥µÄÒ»ÖÖ²ÎÊý¸üÐÂ²ßÂÔ£¬µ«Æä´æÔÚÐí¶àÎÊÌâ¡£
£¨1£© ¡°z¡±×ÖÐÎÏÂ½µ£º µ±ËðÊ§º¯Êý¾ßÓÐ¸ßÌõ¼þÊýÊ±»á·¢ÉúÕâÖÖÇé¿ö¡£Ò²¾ÍÊÇËµ£¬µ±ËðÊ§º¯Êý¶Ô²»Í¬·½ÏòµÄ²ÎÊý±ä»»Ãô¸Ð³Ì¶È²»Í¬Ê±£¬ÔËÐÐÌÝ¶ÈÏÂ½µËã·¨²ÎÊý»á²úÉú¡°z¡±×ÖÐÎÏÂ½µ¡£Í¼5ª²1ËùÊ¾ÎªËðÊ§º¯ÊýµÈ¸ßÏßÍ¼£¬¶ÔÓÚ¸ÃËðÊ§º¯ÊýÖ»ÓÐÁ½¸ö²ÎÊýW1ºÍW2£¬Èç¹û¸Ä±äÆäÖÐÖ®Ò»£¬ÈçÔÚË®Æ½·½Ïò¸Ä±äW1Öµ£¬ÔòËðÊ§º¯Êý±ä»¯·Ç³£Âý£¬¶øÔÚ´¹Ö±·½Ïò¶ÔW2½øÐÐÏàÍ¬³Ì¶ÈµÄ¸Ä¶¯£¬ËðÊ§Öµ±ä»¯Ôò·Ç³£¿ì¡£¶ÔÓÚÕâÑùµÄËðÊ§º¯Êý£¬ÔÚÆäÉÏÔËÐÐËæ»úÌÝ¶ÈÏÂ½µËã·¨»á²úÉú¡°z¡±×ÖÐÎÏÂ½µ£¬Ô­ÒòÊÇÕâÀàÄ¿±êº¯ÊýµÄÌÝ¶È·½ÏòÓë×îÐ¡Öµ·½Ïò²»Ò»ÖÂ£¬µ±¼ÆËãÌÝ¶È²¢ÑØ×ÅÌÝ¶ÈÇ°½øÊ±£¬ÔÚÃô¸Ð·½Ïò±ä»¯½Ï´ó£¬¶øÔÚ²»Ãô¸Ð·½Ïò±ä»¯½ÏÐ¡£¬¿ÉÄÜ»áÒ»±é±é¿ç¹ýµÈ¸ßÏß£¬¡°z¡±×ÖÐÎÇ°½ø»òÕßºóÍË£¬ÔÚÃô¸Ð¶È½ÏµÍµÄÎ¬¶ÈÇ°½øËÙ¶È·Ç³£Âý£¬ÔÚÃô¸Ð¶È½Ï¸ßµÄÎ¬¶ÈÉÏ½øÐÐ¡°z¡±×ÖÐÎÔË¶¯£¬Ê¹µÃ²ÎÊý¸üÐÂÐ§ÂÊµÍÏÂ£¬Õâ¸öÎÊÌâÔÚ¸ßÎ¬¿Õ¼ä¸ü¼ÓÆÕ±é¡£


Í¼5ª²1¶þÎ¬ËðÊ§º¯ÊýµÈ¸ßÏß



£¨2£© ¾Ö²¿¼«Ð¡Öµ£¨¿É±æÊ¶ÐÔÎÊÌâ£©¡¢°°µãºÍÆ½Ì¹ÇøÓò£º ÈçÍ¼5ª²2ËùÊ¾µÄÒ»Î¬ËðÊ§º¯Êý£¬ËðÊ§º¯ÊýÖÐ¼äÓÐÒ»¶Î°¼ÏÝ£¬ÔËÐÐÌÝ¶ÈÏÂ½µËã·¨»á³öÏÖ²ÎÊý¸üÐÂ¡°¿¨¡±ÔÚ°¼ÏÝ´¦µÄÏÖÏó£¬×îÖÕµÃµ½Ò»¸ö¾Ö²¿¼«Ð¡µã¶ø·ÇÈ«¾Ö×îÐ¡µã¡£ÒòÎª¾Ö²¿¼«Ð¡µã´¦ÌÝ¶ÈÎª0£¬


Í¼5ª²2¾Ö²¿¼«Ð¡µãºÍ°°µã

ÌÝ¶ÈÏÂ½µËã·¨ÔÚ´Ë´¦²»Ö´ÐÐ¸üÐÂ¡£¿ÉÒÔÍ¨¹ýºÏÀíÑ¡Ôñ²ÎÊýµÄ³õÊ¼ÖµÔ¶Àë¾Ö²¿×îÐ¡µãÀ´½â¾öÕâ¸öÎÊÌâ¡£Êµ¼ÊÉÏ£¬¾Ö²¿¼«Ð¡ÖµÎÊÌâÔÚµÍÎ¬¿Õ¼ä¸ü¼ÓÑÏÖØ£¬ÔÚ¸ßÎ¬¿Õ¼ä²¢²»ÊÇÒ»¸öºÜ´óµÄÎÊÌâ¡£¶ÔÓÚÒ»¸öº¬ÓÐÒ»ÒÚ¸ö²ÎÊýµÄ¸ßÎ¬¿Õ¼ä£¬ÒªÇóÒ»¸öµã¶ÔÓÚÒ»ÒÚ¸öÎ¬¶ÈµÄµã¶¼ÊÇ¾Ö²¿¼«Ð¡µÄ£¬ÏòÈÎºÎÒ»¸ö·½ÏòÇ°½ø½ÏÐ¡µÄÒ»²½ËðÊ§¶¼»á±ä´ó£¬ÕâÖÖÇé¿ö·Ç³£Ï¡ÉÙ¡£Èç¹ûÒ»¸öµãÔÚÄ³Ò»Î¬¶ÈÉÏÊÇ¾Ö²¿¼«Ð¡µãµÄ¸ÅÂÊÎªp£¬ÄÇÃ´ÔÚÕû¸ö²ÎÊý¿Õ¼ä£¨¼ÙÉèÓÐÒ»ÒÚ¸ö²ÎÊý£©£¬¸ÃµãÊÇ¾Ö²¿¼«Ð¡µãµÄ¸ÅÂÊÎªp108£¬Ëæ×ÅÍøÂç¹æÄ£µÄÔö¼Ó£¬ÏÝÈë¾Ö²¿¼«Ð¡ÖµµÄ¿ÉÄÜÐÔ´ó´ó½µµÍ¡£
¸ßÎ¬¿Õ¼äÖÐ¸üÎªÍ»³öµÄÒ»¸öÎÊÌâÊÇ°°µã£¬°°µã´¦ÌÝ¶ÈÒ²ÎªÁã¡£²»Í¬ÓÚ¾Ö²¿¼«Ð¡µã»òÕß¾Ö²¿¼«´óµãÔÚÈÎºÎÎ¬¶ÈÉÏ¶¼ÊÇ¾Ö²¿¼«´óµã»òÕß¾Ö²¿¼«Ð¡µã£¬°°µãÔÚÄ³Ð©Î¬¶ÈÉÏÊÇ¾Ö²¿¼«´óµãÔÚÄ³Ð©Î¬¶ÈÉÏÊÇ¾Ö²¿¼«Ð¡µã¡£Í¼5ª²2ÖÐÏÂÃæµÄÇúÏßÊÇ¶þÎ¬ÇéÐÎÖÐ°°µãµÄÊ¾ÒâÍ¼£¬¿ÉÒÔ¿´µ½£¬°°µãÔÚË®Æ½Î¬¶ÈÉÏÎª¾Ö²¿¼«Ð¡µã£¬¶øÔÚ´¹Ö±Î¬¶ÈÉÏÎª¾Ö²¿¼«´óµã¡£°°µãÊÇ¸ßÎ¬¿Õ¼äÖÐµÄÄÑµã£¬Èç¹ûÔÚÒ»¸öÓÐÒ»ÒÚ¸öÎ¬¶ÈµÄ²ÎÊý¿Õ¼ä£¬°°µã²¿·ÖÎ¬¶ÈÉÏÎª¾Ö²¿¼«Ð¡µãµÄ¸ÅÂÊÔ¶Ô¶´óÓÚ¾Ö²¿¼«Ð¡µã¡£Òò´Ë£¬¸ßÎ¬¿Õ¼äÖÐ´ó²¿·ÖÌÝ¶ÈÎª0µÄµã¶¼ÊÇ°°µã£¬²¢·Ç¾Ö²¿¼«Ð¡µã¡£°°µãÊ¹µÃ»ùÓÚÌÝ¶ÈÏÂ½µµÄÓÅ»¯Ëã·¨»áÔÚ´Ë´¦Í£ÖÍ£¬ÄÑÒÔ´Ó°°µã´¦¡°ÌÓÀë¡±¡£ÔÚ¸ßÎ¬¿Õ¼äÖÐ£¬ÕâÊÇÒ»¸öØ½´ý½â¾öµÄÎÊÌâ¡£
ÁíÍâ£¬»¹¿ÉÄÜ´æÔÚºãÖµµÄ¿íÀ«Æ½Ì¹ÇøÓò¡£ÒòÎªÉî²ãÉñ¾­ÍøÂçµÄ²ÎÊýÊýÁ¿¼«´ó£¬¾ßÓÐÒ»¶¨µÄÈßÓàÐÔ£¬Ã¿Ò»¸ö²ÎÊý¶ÔËðÊ§º¯ÊýµÄ¹±Ï×ºÜÐ¡£¬Õâ¾Íµ¼ÖÂËðÊ§º¯ÊýµÄÕâÖÖÌØÊâ¡°µØÐÎ¡±£¬ÔÚÆ½Ì¹ÇøÓòÄÚÌÝ¶È½Ó½üÓÚ0£¬Èô¸ÃÇøÓòÓÖÇ¡ºÃÊÇ¡°¸ßÔ­¡±µØ´ø£¨¼´ËðÊ§ÖµºÜ¸ßµÄÇøÓò£©£¬Ò²»áµ¼ÖÂ·Ç³£²îµÄÓÅ»¯½á¹û¡£
£¨3£© Ëæ»úÐÔ£º Ëæ»úÐÔÊÇËæ»úÌÝ¶ÈÏÂ½µµÄÁíÒ»¸öÎÊÌâ¡£ËðÊ§º¯ÊýÊÇÔÚÕû¸öÑµÁ·¼¯ÉÏËùÓÐÑù±¾ÉÏ¶¨ÒåµÄ£¬Èç¹ûÑµÁ·¼¯ÓÐN¸öÑù±¾£¬ÄÇÃ´ËðÊ§¼´ÕâN¸öÑù±¾ËðÊ§µÄºÍ¡£³öÓÚÌáÉýÐ§ÂÊµÄ¿¼ÂÇ£¬Êµ¼ÊÖÐÍ¨¹ýÊ¹ÓÃÐ¡ÅúÁ¿Ñù±¾À´¶ÔËðÊ§ºÍÌÝ¶È½øÐÐ½üËÆ¹À¼Æ¡£Ò²¾ÍÊÇËµ£¬ÔÚÃ¿Ò»´Î¸üÐÂÖÐÃ»ÓÐÊ¹ÓÃÕæÊµµÄÌÝ¶È£¬¶øÊÇÊ¹ÓÃ´øÔëÉùµÄÌÝ¶È¹À¼ÆÀ´Ö´ÐÐ²ÎÊý¸üÐÂ£¬Õâ»áµ¼ÖÂ²ÎÊý¸üÐÂ±È½ÏÇúÕÛ£¬´Ó¶øÐèÒªºÜ³¤µÄÊ±¼ä´ïµ½ÊÕÁ²×´Ì¬¡£
ÁíÍâÒ»¸öÔÚÑ­»·Éñ¾­ÍøÂçÖÐ±È½Ï³£¼ûµÄÎÊÌâÊÇ£¬µ±ËðÊ§º¯Êý³ÊÏÖÐüÑÂ½á¹¹£¬ÔÚÐüÑÂ½á¹¹¸½½üÌÝ¶È·Ç³£´ó£¬Ê¹ÓÃÆÕÍ¨ÌÝ¶ÈÏÂ½µËã·¨¿ÉÄÜ»áµ¼ÖÂ²ÎÊý¸üÐÂ·¢ÉúºÜ´óµÄ±ä»¯£¬´Ó¶ø³öÏÖÌÝ¶È±¬Õ¨ÏÖÏó¡£¿ÉÒÔÊ¹ÓÃÆô·¢Ê½·½·¨½â¾öÕâ¸öÎÊÌâ£¬µ±¸üÐÂµÄÌÝ¶ÈÖµ¹ý´ó£¬³¬¹ý¹æ¶¨µÄãÐÖµÊ±£¬¾Í½øÐÐ½Ø¶Ï£¬Ê¹ÓÃÓÚ¸üÐÂµÄÌÝ¶ÈÖµµÍÓÚãÐÖµ£¬ÕâÖÖ·½·¨½Ð×÷ÌÝ¶È½Ø¶Ï£¨Gradient Clipping£©¡£
5.1.2»ùÓÚ¶¯Á¿µÄ¸üÐÂ 
ÓÉÓÚÌÝ¶ÈÏÂ½µËã·¨´æÔÚ½Ï¶àÎÊÌâ£¬Òò¶øÌá³ö¸ü¶à¸ß¼¶µÄÓÅ»¯²ßÂÔ¡£¶¯Á¿·¨£¨Momentum Method£©ÔÚÌÝ¶ÈÏÂ½µËã·¨µÄ»ù´¡ÉÏÒýÈë¶¯Á¿Ïî£¬Í¨¹ýÀÛ»ýÖ®Ç°ÌÝ¶ÈµÄÖ¸ÊýË¥¼õ¼ÓÈ¨ÒÆ¶¯Æ½¾ù´úÌæµ±Ç°µÄÌÝ¶È×÷Îª²ÎÊýµÄ¸üÐÂ·½Ïò£¬ÊµÏÖµü´ú¸üÐÂ£¬¸üÐÂ¹«Ê½ÈçÊ½£¨5ª²2£©ËùÊ¾£¬ÆäÖÐvÓÉÊ½£¨5ª²1£©¸ø³ö¡£


v¡û¦Ñv£­¦Á«ý¦Èf¦È=¦Ñv£­¦Ág(5ª²1)

¦È¡û¦È+v(5ª²2)


¶ÔÓÚÉñ¾­ÍøÂçÖÐµÄËðÊ§º¯Êý£¬¼´ÐèÒªÓÅ»¯µÄÄ¿±êº¯Êý£¬±¾ÕÂÍ³Ò»Ê¹ÓÃº¯Êýf¦È±íÊ¾£¬f¦È=1m¡Æmi=1Lfx£¨i£©;¦È,y£¨i£©£¬fx£¨i£©;¦ÈÖ¸Éñ¾­ÍøÂçÑ§Ï°µÃµ½µÄº¯Êý£¬1m¡Æmi=1L£¨f£¨x£¨i£©;¦È£©,y£¨i£©£©ÎªÊý¾ÝËðÊ§¡£ÓÐÊ±ÐèÒªÓÅ»¯µÄÄ¿±êº¯Êý²»½ö½öÎªÊý¾ÝËðÊ§£¬ÓÐ¿ÉÄÜ°üº¬ÕýÔòÏî£¨´Ë²¿·ÖÄÚÈÝ¼û5.4½Ú£©£¬ÓÉÓÚ5.1½ÚºÍ5.2½ÚÉæ¼°µÄÓÅ»¯·½·¨²»ÐèÒªÄ¿±êº¯ÊýµÄ¾ßÌå±í´ïÊ½£¬Òò´Ë¿É¼òµ¥Ê¹ÓÃf¦È±íÊ¾¡£ÁíÍâ£¬ÓÅ»¯·½·¨³£ÓÃµ½Ä¿±êº¯Êý¹ØÓÚ²ÎÊýµÄÌÝ¶È£¬Îª·½±ã½«Æä±íÊ¾Îªg£¬¼´g=«ý¦Èf¦È¡£·ûºÅ¦È±íÊ¾ÐèÒªÓÅ»¯µÄ²ÎÊý£¬¼È°üÀ¨È¨ÖØW£¬Ò²°üÀ¨Æ«ÖÃb¡£
v±íÊ¾ËÙ¶È£¬ÊÇ²ÎÊýÔÚ²ÎÊý¿Õ¼äÒÆ¶¯µÄ·½ÏòºÍËÙÂÊ£¬vÒ»°ã³õÊ¼»¯Îª0¡£ÔÚµÚk´Îµü´úÊ±£¬Ê×ÏÈÊ¹ÓÃÌÝ¶ÈÐÅÏ¢¸üÐÂËÙ¶È£¬È»ºóÊ¹ÓÃ¸üÐÂºóµÄËÙ¶È½øÐÐ²ÎÊý¸üÐÂ£¬µ±Ç°ËÙ¶ÈÊµÖÊÉÏÊÇÒÔÍùÀÛ»ýÌÝ¶ÈµÄÒÆ¶¯Æ½¾ù¡£ÕâÓëÌÝ¶ÈÏÂ½µËã·¨²»Í¬£¬ÌÝ¶ÈÏÂ½µËã·¨Ö±½ÓÊ¹ÓÃÌÝ¶ÈÐÅÏ¢¶Ô²ÎÊý½øÐÐ¸üÐÂ¡£¦ÁÎªÑ§Ï°ÂÊ£¬ÓëÌÝ¶ÈÏÂ½µËã·¨ÖÐº¬ÒåÏàÍ¬¡£¦ÑÎª¶¯Á¿Òò×Ó£¬¸ù¾Ý¾­Ñé£¬¦ÑÒ»°ãÉèÖÃÎª0.5¡¢0.9¡¢0.95ºÍ0.99ÖÐµÄÒ»¸öÖµ¡£ÓëÑ§Ï°ÂÊÀàËÆ£¬Ò»°ã½«¦ÑÉèÖÃÎªËæÊ±¼ä±ä»¯µÄÖµÄÜ¹»¸ÄÉÆÓÅ»¯ÐÔÄÜ£¬³õÊ¼ÖµÒ»°ãÉèÖÃÎªÒ»¸ö½ÏÐ¡µÄÊýÖµ£¬ËæºóÂýÂý±ä´ó¡£¦Ñ¾ö¶¨ÁËÇ°Ò»Ê±¿ÌµÄËÙ¶È¶Ôµ±Ç°Ê±¿ÌËÙ¶ÈÔ¤²âµÄ¹±Ï×¡£¦ÑÔ½´ó£¬´ú±íÖ®Ç°Ê±¿ÌÀÛ»ýµÄÌÝ¶È¶ÔÏÖÔÚÌÝ¶È·½ÏòµÄÓ°ÏìÔ½´ó£¬¶ø¦Á´ú±íµ±Ç°Ê±¿ÌÌÝ¶È¶Ô²ÎÊý¸üÐÂ·½ÏòµÄÖØÒªÐÔ¡£ÍêÕûµÄ»ùÓÚ¶¯Á¿µÄÌÝ¶ÈÏÂ½µËã·¨»òÕß³ÆÎª¶¯Á¿·¨µÄËã·¨Á÷³ÌÈç±í5ª²1ËùÊ¾¡£


±í5ª²1»ùÓÚ¶¯Á¿µÄËæ»úÌÝ¶ÈÏÂ½µ£¨¶¯Á¿·¨£©



1. Input:³õÊ¼²ÎÊý¦È£¬³õÊ¼ËÙ¶Èv0

2. While Ã»ÓÐ´ïµ½Í£Ö¹×¼Ôò do

3. ´ÓÑµÁ·¼¯ÖÐ²É¼¯°üº¬m¸öÑù±¾µÄÐ¡ÅúÁ¿x£¨1£©,¡­,x£¨m£©£¬¶ÔÓ¦Ä¿±êÎªy£¨i£©¡£

4. ¼ÆËãÌÝ¶È¹À¼Æ£º g¡û1m«ý¦È¡Æmi=1Lfx£¨i£©;¦È,y£¨i£©

5. ¼ÆËãËÙ¶È¸üÐÂ£º v¡û¦Ñv£­¦Ág

6. Ó¦ÓÃ¸üÐÂ£º ¦È¡û¦È+v

7. End while

ÎïÀíÑ§ÖÐ£¬Ò»¸öÎïÌåµÄ¶¯Á¿Ö¸¸ÃÎïÌåÔÚËüµÄÔË¶¯·½ÏòÉÏ±£³ÖÔË¶¯×´Ì¬µÄÇ÷ÊÆ£¬¶¯Á¿±íÊ¾ÎªÎïÌåÖÊÁ¿ÓëËÙ¶ÈµÄ³Ë»ý¡£ÔÚ¶¯Á¿·¨ÖÐ£¬½«²ÎÊýµÄ¸üÐÂ¿´×÷Á£×ÓµÄÔË¶¯£¬²¢ÇÒ¼Ù¶¨Á£×ÓµÄÖÊÁ¿Îªµ¥Î»ÖÊÁ¿£¬ËùÒÔÁ£×ÓµÄ¶¯Á¿ÖµµÈÍ¬ÓÚÁ£×ÓµÄËÙ¶ÈÖµ¡£ÉèÏëÒ»¸ö¾ßÓÐµ¥Î»ÖÊÁ¿µÄÐ¡Çò´ÓÒ»¸öÐ¡ÆÂÉÏ»¬ÏÂ¡£Ê×ÏÈ£¬Ð¡ÇòÓÐÒ»¸ö³õÊ¼ËÙ¶Èv0£¬È»ºóÐ¡ÇòÓÉÓÚÁ¦µÄ×÷ÓÃÏò×ÅÏÂÆÂµÄ·½Ïò¹ö¶¯¡£ÔÚ¶¯Á¿·¨ÖÐ£¬Á¦Õý±ÈÓÚËðÊ§º¯ÊýµÄ¸ºÌÝ¶È£¬¸ù¾Ý¹«Ê½F=ma£¬Á¦¸øÐ¡ÇòÒ»¸ö¼ÓËÙ¶È£¬Ê¹µÃÐ¡ÇòËÙ¶È¸Ä±ä¡£´«Í³µÄÌÝ¶ÈÏÂ½µËã·¨ÖÐ£¬ÌÝ¶ÈÖ±½Ó¸Ä±äÎ»ÖÃ£» ¶¯Á¿·¨Ê¹ÓÃÌÝ¶È¸Ä±äËÙ¶È£¬ËÙ¶ÈÔÙ¸Ä±äÎ»ÖÃ¡£³¬²ÎÊý¦Ñ¿ÉÒÔ¿´×÷Ä¦²ÁÏµÊý£¬ÄÜ¹»ÓÐÐ§µØÒÖÖÆÁ£×ÓµÄËÙ¶È£¬½µµÍÁ£×Ó¶¯ÄÜ£¬Ê¹Á£×Ó×îÖÕÄÜ¹»Í£ÏÂÀ´¡£
¶¯Á¿·¨¿ÉÒÔ°ïÖú½â¾öÌÝ¶ÈÏÂ½µËã·¨´æÔÚµÄÎÊÌâ¡£¾¡¹ÜÔÚ¾Ö²¿¼«Ð¡µãºÍ°°µã¸½½üÌÝ¶ÈÎª0£¬µ«Ð¡ÇòÓÐÀÛ»ýµÄËÙ¶È£¬Õâ¸öËÙ¶È¿ÉÒÔ°ïÖúÐ¡ÇòÔ½¹ýÌÝ¶ÈÎª0µÄµã£¬¶ø²»ÖÁÓÚÏÝÈëÕâÐ©µãÎÞ·¨¼ÌÐø¸üÐÂ¡£ÁíÍâ£¬µ±ËðÊ§º¯Êý¶Ô²»Í¬·½ÏòµÄ²ÎÊý±ä»»Ãô¸Ð³Ì¶È²îÒì½Ï´óÊ±£¬ÔËÐÐÆÕÍ¨ÌÝ¶ÈÏÂ½µËã·¨»á³öÏÖ¡°z¡±×ÖÐÎÏÂ½µ£¬Ê¹ÓÃ¶¯Á¿·¨¿ÉÒÔºÜºÃµØ½øÐÐ¸ÄÉÆ£¬ÒòÎªÃ¿¸ö²ÎÊýµÄ¸üÐÂ²»½öÈ¡¾öÓÚµ±Ç°µÄÌÝ¶È£¬»¹È¡¾öÓÚÖ®Ç°ÀÛ»ýµÄÌÝ¶È¼ÓÈ¨Æ½¾ù¡£Èç¹ûÒ»¶ÎÊ±¼äÄÚµÄÌÝ¶È·½ÏòÒ»ÖÂ£¬ÄÇÃ´²ÎÊý¸üÐÂµÄ·ù¶È½«´óÓÚ½öÊ¹ÓÃµ±Ç°ÌÝ¶È½øÐÐ¸üÐÂµÄ·ù¶È£¬Õâ»áÆðµ½¼ÓËÙ×÷ÓÃ£¬Õâ¶ÔÓ¦ÓÚ²ÎÊý²»Ãô¸ÐµÄ·½Ïò£¬ÔÚÕâÐ©·½ÏòÉÏ¸üÐÂ²½·ù»áÔö´ó£¬´Ó¶øÔÚÕâÐ©·½Ïò»ñµÃ¼ÓËÙ£» Ïà·´µØ£¬Èç¹ûÒ»¶ÎÊ±¼äÄÚµÄÌÝ¶È·½Ïò²»Ò»ÖÂ£¬¿ÉÒÔºÜ¿ìµØµÖÏû¡°z¡±×ÖÐÎÌÝ¶È¸üÐÂµÄÇé¿ö£¬ÓÐÐ§¼õÉÙ²ÎÊýÃô¸Ð·½Ïò²½½øµÄÊýÁ¿¡£Òò´Ë£¬Ê¹ÓÃ¶¯Á¿·¨¿ÉÒÔÓÐÐ§ÌáÉýÐ§ÂÊ£¬


Í¼5ª²3¶¯Á¿·¨²ÎÊý¸üÐÂ¹ý³Ì

¼ÓËÙÑ§Ï°½ø³Ì¡£Í¬Ê±£¬¶¯Á¿·¨¿ÉÒÔ»ñµÃÒ»ÏµÁÐËæÊ±¼ä±ä»»µÄËÙ¶È£¬¹À¼ÆÌÝ¶ÈÊ±¿ÉµÖÏû²¿·ÖÔëÒô£¬ÓëËæ»úÌÝ¶ÈÏÂ½µÏà±È£¬ÄÜ¹»¸ü¼ÓÆ½ÎÈµØ½Ó½ü×îÐ¡Öµµã¡£Í¼5ª²3¿ÉÊÓ»¯ÁË²ÎÊýµÄ¸üÐÂ¹ý³Ì£¬ºÚµã´ú±í²»Í¬µü´ú²ÎÊýµÄ´óÐ¡£¬ÐéÏß¼ýÍ·´ú±íµ±Ç°²ÎÊýÖµ´¦ËðÊ§º¯Êý¹ØÓÚ²ÎÊýµÄÌÝ¶È£¬ÊµÏß´ú±íÊ¹ÓÃ¶¯Á¿·¨Ö´ÐÐ¸üÐÂµÄ¹ý³Ì¡£¿ÉÒÔ¿´µ½£¬¶¯Á¿·¨²ÎÊý¸üÐÂ·½ÏòÊµÖÊÉÏÓëÕæÊµÌÝ¶È·½ÏòÓÐÆ«²î£¬¼õÐ¡ÁËÔÚ²ÎÊýÃô¸Ð·½ÏòµÄÕðµ´£¬¼ÓËÙÁËÊÕÁ²¹ý³Ì¡£
Í¼5ª²4ÖÐ£¬½«¶¯Á¿·¨µÄÃ¿Ò»²½¸üÐÂÓÃÏòÁ¿»¯µÄÐÎÊ½±íÊ¾³öÀ´£¬ºÚµãÎªµ±Ç°²ÎÊýµÄÎ»ÖÃ£¬¡°ÌÝ¶È¡±ÏòÁ¿±íÊ¾¸ºÌÝ¶È»òÕß¶Ôµ±Ç°Î»ÖÃÌÝ¶È¹À¼ÆµÄ¸º·½Ïò¡£µ±Ê¹ÓÃ¶¯Á¿·¨½øÐÐ¸üÐÂÊ±£¬Êµ¼ÊÉÏÊÇ¶Ô¡°ÌÝ¶È¡±ÏòÁ¿ºÍ¡°ËÙ¶ÈÏòÁ¿¡±Á½Õß½øÐÐ¼ÓÈ¨Æ½¾ù½øÐÐ²½½ø¡£



Í¼5ª²4¶¯Á¿·¨ÓëNesterov¶¯Á¿µÄ±È½Ï


ÁíÒ»ÖÖ¸Ä½øµÄ¶¯Á¿·¨ÎªNesterov ¼ÓËÙÌÝ¶È£¨Nesterov Accelerated Gradient£¬NAG£©£¬Ò²³ÆÎªNesterov¶¯Á¿£¨Nesterov Momentum£©¡£ÔÚ¶¯Á¿·¨ÖÐ£¬ÏÈ»ñÈ¡µ±Ç°Î»ÖÃµÄÌÝ¶È£¬È»ºóÊ¹ÓÃÌÝ¶ÈºÍËÙ¶ÈµÄ¼ÓÈ¨Æ½¾ù½øÐÐ¸üÐÂ¡£¶øNesterov¶¯Á¿ÖÐ£¬ÐèÒª¸ù¾Ýµ±Ç°µÄËÙ¶È·½ÏòÔ¤ÏÈÇ°½øÒ»²½£¬ÔÚÕâ¸öÐÂµÄÎ»ÖÃÇóÈ¡ÌÝ¶È£¬È»ºóÔÙ»Øµ½ÆðÊ¼Î»ÖÃ£¬¸ù¾ÝËÙ¶ÈºÍÐÂÎ»ÖÃµÄÌÝ¶ÈµÄ¼ÓÈ¨Æ½¾ùÊµÏÖ¸üÐÂ¡£NAGµÄËÙ¶È¸üÐÂ¹«Ê½ÈçÊ½£¨5ª²3£©ËùÊ¾£¬²ÎÊý¸üÐÂ¹«Ê½ÓëÊ½£¨5ª²2£©ÏàÍ¬£¬Ëã·¨Á÷³Ì¼û±í5ª²2¡£
v¡û¦Ñv£­¦Á«ý¦Èf¦È+¦Ñv£¨5ª²3£©


±í5ª²2»ùÓÚNesterov¶¯Á¿µÄËæ»úÌÝ¶ÈÏÂ½µËã·¨



1. Input:Ñ§Ï°ÂÊ¦Á£¬¶¯Á¿Òò×Ó¦Ñ

2. Input:³õÊ¼²ÎÊý¦È£¬³õÊ¼ËÙ¶Èv0

3. While Ã»ÓÐ´ïµ½Í£Ö¹×¼Ôò do

4. ´ÓÑµÁ·¼¯ÖÐ²É¼¯°üº¬m¸öÑù±¾µÄÐ¡ÅúÁ¿x£¨1£©,¡­,x£¨m£©£¬¶ÔÓ¦Ä¿±êÎªy£¨i£©¡£Ö´ÐÐÁÙÊ±¸üÐÂ£º ¦È~¡û¦È+¦Ñv

5. ¼ÆËãÌÝ¶È¹À¼Æ£º g¡û1m«ý¦È~¡Æmi=1Lfx£¨i£©;¦È~,y£¨i£©

6. ¼ÆËãËÙ¶È¸üÐÂ£º v¡û¦Ñv£­¦Ág

7. Ó¦ÓÃ¸üÐÂ£º ¦È¡û¦È+v

8. End while

Êµ¼ÊÁ½ÕßµÄ²î±ðÔÚÓÚÌÝ¶ÈµÄ¼ÆËã£¬¶¯Á¿·¨ÔÚµ±Ç°Î»ÖÃ¼ÆËãÌÝ¶È£¬NAGÊ©¼ÓËÙ¶ÈºóÔÚÐÂµÄÎ»ÖÃ¼ÆËãÌÝ¶È¡£¿ÉÒÔÕâÑù½âÊÍ£º ¼ÈÈ»ËÙ¶ÈÏòÁ¿×îÖÕ»á½«Ð¡Çò´øµ½ÐéÏß¼ýÍ·Ö¸ÏòµÄÎ»ÖÃ£¬ÄÇÓëÆäÔÚÏÖÔÚµÄÎ»ÖÃ¼ÆËãÌÝ¶È£¬²»ÈçÏòÇ°¿´Ò»²½£¬ÓÃÎ´À´Î»ÖÃ¼ÆËãÌÝ¶È¡£ÊµÑéÖ¤Ã÷£¬NAGÊÕÁ²ËÙ¶È»á¸ü¿ì¡£



Í¼5ª²5ËðÊ§º¯ÊýµÄÒ»½×ÏßÐÔ½üËÆ

5.1.3¶þ½×ÓÅ»¯·½·¨
ÒÔÉÏ½éÉÜµÄ¼¸ÖÖ·½·¨¶¼ÊÇÒ»½×ÓÅ»¯·½·¨£¬ÒòÎª½öÊ¹ÓÃÌÝ¶ÈÐÅÏ¢¡£¶ÔÓÚÏëÒªÓÅ»¯µÄÄ¿±êº¯Êýf¦È£¬ÔÚµã¦È0´¦½øÐÐÒ»½×Ì©ÀÕ¹«Ê½Õ¹¿ª¿ÉµÃ 

f¦È¡Öf¦È0+¦È£­¦È0Tg(5ª²4)

ÆäÖÐ,gÎªf¦ÈµÄÌÝ¶ÈÔÚ¦È0´¦µÄÖµ£¬Í¨¹ý¼ÆËãµã¦È0´¦µÄÌÝ¶È¿ÉÒÔµÃµ½Ä¿±êº¯ÊýÔÚ¦È0¾Ö²¿ÇøÓòµÄÏßÐÔ½üËÆ£¬ÈçÍ¼5ª²5ËùÊ¾¡£Ê¹ÓÃ½üËÆº¯Êý´úÌæÔ­Ê¼º¯Êý¼ÆËãÌÝ¶È¸üÐÂ£¬¼´ÔÚÔ­Ê¼º¯ÊýµÄÌÝ¶È·½ÏòÉÏÇ°½ø½ÏÐ¡µÄÒ»²½¡£ÓÉÓÚ¸Ã½üËÆ½öÔÚ¾Ö²¿Ð¡ÇøÓòÄÚ³ÉÁ¢£¬ÔÚ¸ü´óµÄ·¶Î§ÄÚ²¢²»³ÉÁ¢£¬Òò´Ë²»ÄÜÔÚ¸Ã·½ÏòÇ°½øÌ«¶à£¬Õâ¾ÍÊÇÒ»½×ÓÅ»¯·½·¨Ê¹ÓÃÌÝ¶ÈµÄÔ­Òò¡£¶ÔÄ¿±êº¯Êý½øÐÐÒ»½×½üËÆºó£¬½«ÏÂ½µ·½ÏòÑ¡ÔñÎªÏÂ½µ×î¿ìµÄ¸ºÌÝ¶È·½Ïò£¬Òò´ËÌÝ¶ÈÏÂ½µ·¨Ò²±»³ÆÎª×îËÙÏÂ½µ·¨¡£
Ò»½×ÓÅ»¯·½·¨Ê¹ÓÃº¯ÊýµÄÒ»½×Æ«µ¼ÊýÐÅÏ¢£¬Ò²´æÔÚÊ¹ÓÃ¶þ½×Æ«µ¼ÊýÀ´Ö¸µ¼ËÑË÷µÄ¶þ½×ÓÅ»¯·½·¨¡£½«Ä¿±êº¯ÊýÔÚ¦È0´¦×ö¶þ½×Ì©ÀÕ¹«Ê½Õ¹¿ª£¬µÃµ½f¦ÈµÄ½üËÆÊ½Îª

f¦È¡Öf¦È0+¦È£­¦È0T¡¤g+12¦È£­¦È0TH¦È£­¦È0£¨5ª²5£©

ÆäÖÐ£¬gÈÔÎªf¦ÈµÄÌÝ¶ÈÔÚ¦È0´¦µÄÖµ£¬HÊÇ¦È0µãµÄHessian¾ØÕó£¬Hessian¾ØÕóÎªf¦È¶þ½×Æ«µ¼Êý×é³ÉµÄ¾ØÕó£¬Æä¶¨ÒåÈçÏÂ£º 

Hf¦Èi,j=ªµ2ªµ¦Èiªµ¦Èjf¦È£¨5ª²6£©

»ùÓÚ¶þ½×½üËÆ£¬Ä¿±êº¯Êý¿ÉÒÔÍ¨¹ýÒ»¸ö¶þ´Îº¯ÊýÀ´¾Ö²¿½üËÆ£¬ÈçÍ¼5ª²6ËùÊ¾¡£²»Í¬ÓÚÒ»½×½üËÆµÄÏßÐÔº¯Êý£¬¿ÉÒÔÍ¨¹ý½üËÆ¶þ´Îº¯ÊýµÄ×îÐ¡Öµµã£¬²»¶Ïµü´úÕÒµ½Ô­Ê¼Ä¿±êº¯ÊýµÄ×îÐ¡Öµµã£¬Õâ¾ÍÊÇ¶þ½×ÓÅ»¯µÄË¼Ïë¡£¶ÔÓÚ¸Ã½üËÆ¶þ´Îº¯ÊýµÄ×îÐ¡Öµµã¦Èª³£¬


Í¼5ª²6ËðÊ§º¯ÊýµÄ¶þ½×½üËÆ

¿ÉÒÔÍ¨¹ý½âÎö·½·¨Çó³ö¡£

¦Èª³=¦È0£­Hf¦È0£­1«ý¦Èf¦È0£¨5ª²7£©

´Ë·½·¨Ò²±»³ÆÎªÅ£¶Ù·¨¡£¼ÆËãHessian¾ØÕó£¬¼´¶þ½×Æ«µ¼ÊýµÄ¾ØÕó£¬È»ºóÇóÄæ£¬¿ÉÒÔÖ±½ÓµÃµ½¶ÔÔ­Ê¼Ä¿±êº¯Êý½øÐÐ¶þ´Î½üËÆºóµÄ×îÐ¡Öµ¡£Hessian¾ØÕóÒ²±»³ÆÎªÅ£¶Ù²½³¤£¬ËüµÈ¼ÛÓÚÒ»½×ÓÅ»¯·½·¨ÖÐµÄ³¬²ÎÊý¦Á£¨Ò²½Ð²½³¤»òÕßÑ§Ï°ÂÊ£©¡£Êµ¼ÊÉÏ£¬¶þ½×ÓÅ»¯·½·¨µÄºÃ´¦¾ÍÔÚÓÚÃ»ÓÐÑ§Ï°ÂÊ£¬²»ÓÃÍ¨¹ý½»²æÑéÖ¤È·¶¨Ñ§Ï°ÂÊµÄÖµ£¬Ïà½ÏÓÚÒ»½×ÓÅ»¯·½·¨£¬ÕâÊÇÒ»¸ö¾Þ´óµÄÓÅÊÆ¡£ÓÉÓÚÉñ¾­ÍøÂçÖÐÐèÒªÓÅ»¯µÄÄ¿±êº¯ÊýÍ¨³£²»ÊÇ¶þ´Îº¯Êý£¬Òò´ËÐèÒª¶à´Î¶ÔÔ­Ä¿±êº¯Êý½øÐÐ½üËÆ²¢Ê¹ÓÃ¹«Ê½£¨5ª²7£©µÃµ½½üËÆº¯ÊýµÄ×îÐ¡Öµ¡£×ÛÉÏËùÊö£¬Å£¶Ù·¨ÏÈ»ùÓÚ¶þ½×Ì©ÀÕ¹«Ê½Õ¹¿ªÊ½½üËÆ¦È0´¦¸½½üµÄf¦È£¬È»ºóÊ¹ÓÃÒÔÏÂ¸üÐÂ¹«Ê½£º 

¦Èk=¦Èk£­1£­Hf¦Èk£­1£­1«ý¦Èf¦Èk£­1£¨5ª²8£©

Ö±½ÓµÃµ½½üËÆº¯ÊýµÄ×îÐ¡Öµ£¬ÔÙÔÚÐÂµÄÎ»ÖÃ¶ÔËðÊ§º¯Êý½øÐÐ¶þ½×Ì©ÀÕ¹«Ê½Õ¹¿ª£¬ÕâÑù²»¶Ïµü´ú¸üÐÂ½üËÆº¯Êý¡£Ê½£¨5ª²8£©ÖÐ¦Èk±íÊ¾µÚkÂÖµü´ú¸üÐÂºóµÄ²ÎÊý£¬¦Èk£­1ÎªÉÏÒ»ÂÖµü´úµÄ²ÎÊý¡£¾­Ö¤Ã÷£¬¸Ã·½·¨ÄÜ¹»±ÈÌÝ¶ÈÏÂ½µ·¨¸ü¿ìµØ´ïµ½ÁÙ½çµã¡£
Hessian¾ØÕóÀûÓÃÁË¶þ½×Æ«µ¼ÊýÐÅÏ¢£¬´Ó¶øÊ¹µÃ²ÎÊý¸üÐÂ¸ü¼Ó¸ßÐ§£¬ËüÃèÊöÁËËðÊ§º¯ÊýµÄ¾Ö²¿ÇúÂÊ£¬Ê¹µÃÔÚÇúÂÊÐ¡Ê±ÄÜ´ó²½³¤¸üÐÂ£¬ÇúÂÊ´óÊ±Ð¡²½³¤¸üÐÂ£¬Õâ¿ÉÒÔ½â¾öÌÝ¶ÈÏÂ½µËã·¨ÖÐµÄ¡°z¡±×ÖÐÎÏÂ½µÎÊÌâ¡£Å£¶Ù·¨ÔÚÑ¡Ôñ·½ÏòÊ±£¬²»½ö¿¼ÂÇÌÝ¶È»¹¿¼ÂÇÌÝ¶ÈµÄ±ä»¯¡£ÌÝ¶ÈÏÂ½µ·¨Ã¿´ÎÇ°½øÊ±Ñ¡ÔñÆÂ¶È×î¶¸ÇÍµÄ·½Ïò£¨¼´ÌÝ¶È·½Ïò£©£¬¶øÅ£¶Ù·¨²»½ö¿¼ÂÇµ±Ç°ÆÂ¶ÈÊÇ·ñ×ã¹»´ó£¬»¹»á½øÒ»²½¿¼ÂÇÂõ³öÒ»²½ºóÆÂ¶ÈÊÇ·ñ±äµÃ¸ü´ó¡£Òò´Ë£¬Å£¶Ù·¨±ÈÌÝ¶ÈÏÂ½µ·¨¸ü¾ßÈ«¾ÖË¼Ïë£¬ËùÒÔÊÕÁ²ËÙ¶È¸ü¿ì¡£

¶ÔÓÚÅ£¶Ù·¨¶øÑÔ£¬°°µãÊÇÒ»¸öÍ»³öÎÊÌâ£¬Èç¹ûÃ»ÓÐÊÊµ±µØ¸Ä½ø£¬Å£¶Ù·¨¾Í»áÏÝÈë°°µã¡£ÔÚÉî¶ÈÉñ¾­ÍøÂçÖÐ£¬Æä¸ß¶È·ÇÏßÐÔµ¼ÖÂÓÅ»¯µÄÄ¿±êº¯ÊýÍ¨³£ÊÇÒ»¸ö·ÇÍ¹ÎÊÌâ£¬ÕâÖÖÇéÐÎÏÂ£¬Å£¶Ù·¨¾Í»á±»ÎüÒýµ½°°µã¡£»»¾ä»°Ëµ£¬ÓÉÓÚ·ÇÍ¹ÐÔµ¼ÖÂHessian¾ØÕó·ÇÕý¶¨£¬ÔÚ¿¿½ü°°µã´¦£¬Å£¶Ù·¨Êµ¼ÊÉÏ»á³¯´íÎóµÄ·½Ïò½øÐÐ¸üÐÂ¡£¸ßÎ¬¿Õ¼äÖÐ°°µãÊýÁ¿¼¤Ôö£¬ÕâÊÇÅ£¶Ù·¨²»ÄÜ´úÌæÌÝ¶ÈÏÂ½µ·¨ÓÃÓÚÑµÁ·´óÐÍÉñ¾­ÍøÂçµÄÒ»¸öÔ­Òò¡£ÓÐ²¿·ÖÑÐ¾¿ÕßÌá³öÁËÎÞ°°µãÅ£¶Ù·¨£¨Saddleª²free Newton Method£©£¬»òÐí¿ÉÒÔ°ïÖú¶þ½×ÓÅ»¯·½·¨À©Õ¹µ½´óÐÍÉñ¾­ÍøÂç¡£ÁíÍâ£¬¶ÔHessian¾ØÕóÇóÄæ´øÀ´´æ´¢ºÍ¼ÆËã¸ºµ££¬Hessian¾ØÕóÔªËØ¸öÊýÊÇ²ÎÊýÊýÁ¿NµÄÆ½·½£¬¶ÔÓÚÒ»¸ö°üº¬100Íò¸ö²ÎÊýµÄÉñ¾­ÍøÂçÄ£ÐÍ£¬ Hessian¾ØÕó´óÐ¡Îª
10000002£¬Õ¼ÓÃ½«½ü3725GBµÄÄÚ´æ¡£Å£¶Ù·¨ÐèÒªÇó½âÕâ¸öN¡ÁN¾ØÕóµÄÄæ¾ØÕó£¬¼ÆËã¸´ÔÓ¶ÈÎªON3¡£Ã¿´Îµü´ú¸üÐÂ¶¼ÒªÖØÐÂ¼ÆËãÐÂÎ»ÖÃµÄHessian¾ØÕóµÄÄæ¾ØÕó£¬µ¼ÖÂ¸üÐÂËÙ¶È·Ç³£Âý£¬Òò´ËÅ£¶Ù·¨Ö»ÊÊÓÃÓÚ¾ßÓÐÉÙÁ¿²ÎÊýµÄÍøÂç¡£Îª½â¾öHessian¾ØÕóÇóÄæµÄ¸´ÔÓ¶ÈÎÊÌâ£¬Ìá³öÒ»ÏµÁÐÄâÅ£¶Ù·¨£¬Ö¼ÔÚ¶ÔHessian¾ØÕóµÄÄæ¾ØÕó½øÐÐ½üËÆÀ´´úÌæHessian¾ØÕó½øÐÐ¸üÐÂ£¬¿ÉÊ¹ÓÃÕý¶¨¾ØÕóÀ´½üËÆHessian¾ØÕóµÄÄæ¾ØÕó¡£Õý¶¨¾ØÕóÄÜ±£Ö¤Ã¿Ò»²½ËÑË÷·½ÏòÊÇÏòÏÂµÄ£¬¿É½µµÍÔËËã¸´ÔÓ¶È¡£±È½Ï³£ÓÃµÄÁ½ÖÖÄâÅ£¶Ù·¨ÎªDFP£¨Davidonª²Fletcherª²Powell£©Ëã·¨ºÍBFGS£¨Broydenª²Fletcherª²Goldfarbª²Shanno£©Ëã·¨£¬ÒÔ¼°Îª½â¾öBFGS¸ß´æ´¢´ú¼ÛµÄÎÞ´æ´¢µÄLª²BFGS£¨Limitedª²memory BFGS£©Ëã·¨¡£
5.1.4¹²éîÌÝ¶È
¹²éîÌÝ¶È·¨ÊÇ½éÓÚÌÝ¶ÈÏÂ½µ·¨ºÍÅ£¶Ù·¨Ö®¼äµÄÒ»ÖÖ·½·¨£¬Ëü¼È¿Ë·þÁËÌÝ¶ÈÏÂ½µ·¨ÊÕÁ²ÂýµÄÎÊÌâ£¬ÓÖ²»ÓÃÏñÅ£¶Ù·¨ÄÇÑùÊ¹ÓÃHessian¾ØÕóµÄÄæ¾ØÕó£¬Ëü½öÀûÓÃÒ»½×µ¼ÊýÐÅÏ¢£¬´æ´¢Á¿Ð¡£¬¾ßÓÐ²½ÊÕÁ²ÐÔ£¬ÎÈ¶¨ÐÔ¸ß£¬²¢ÇÒ²»ÐèÒªÈÎºÎÍâ²¿²ÎÊý¡£
¶ÔÓÚ¹²éîÌÝ¶È·¨µÄÑÐ¾¿À´Ô´ÓÚ¶ÔÌÝ¶ÈÏÂ½µ·¨È±µãµÄÑÐ¾¿£¬ÌÝ¶ÈÏÂ½µ·¨Ã¿´Îµü´ú¶¼½«µ±Ç°Î»ÖÃµÄÌÝ¶È·½Ïò×÷Îª¸üÐÂ·½Ïò£¬Ê¹ÓÃÑ§Ï°ÂÊ²ÎÊýÈ·¶¨ÔÚ¸Ã¸üÐÂ·½ÏòÉÏÇ°½øµÄ²½³¤¡£ÓÐ¼¸ÖÖ²»Í¬µÄ²½³¤Ñ¡Ôñ·½Ê½£¬Í¨³£µÄ·½Ê½ÊÇÑ¡ÔñÒ»¸öÐ¡µÄ³£Êý£¬²¢Ëæµü´ú´ÎÊýË¥¼õ¡£»¹ÓÐÒ»ÖÖ±»³ÆÎªÏßËÑË÷µÄ²ßÂÔ£¬¸Ã²ßÂÔÔÚÃ¿Ò»¸öËÑË÷·½Ïò£¨¼´ÌÝ¶È·½Ïò£©ÉÏÑ¡È¡ÄÜÊ¹µÃÄ¿±êº¯Êýf¦È£­¦Á«ý¦Èf¦È×îÐ¡µÄ²½³¤¦Á£¬¿ÉÒÔ±£Ö¤ÔÚÃ¿¸öÏßËÑË÷·½ÏòÉÏ¶¼ÄÜÕÒµ½¸Ã·½ÏòÉÏµÄ¼«Ð¡Öµ£¬½«ÏßËÑË÷µü´úµØÓ¦ÓÃÓÚÓëÌÝ¶ÈÏà¹ØµÄ·½ÏòÖ±ÖÁÕÒµ½Ä¿±êÖµ¡£


Í¼5ª²7¶þ´ÎÄ¿±êº¯ÊýÊ¹ÓÃËæ»úÌÝ¶ÈÏÂ½µµÄ²ÎÊý¸üÐÂÂ·Ïß

Êµ¼ÊÉÏ£¬ÕâÊÇÒ»ÖÖÏàµ±µÍÐ§µÄ·½Ê½¡£ÈçÍ¼5ª²7ËùÊ¾£¬¶ÔÓÚ¶þÎ¬µÄ¶þ´ÎÄ¿±êº¯Êý£¬ÔËÓÃÌÝ¶ÈÏÂ½µËã·¨¸üÐÂÂ·Ïß£¬ÔÚÃ¿¸ö¸üÐÂ·½ÏòÖ´ÐÐÏßËÑË÷£¬Òò´ËÃ¿´Îµü´úÊ¹ÓÃµÄÊÇ×îÓÅ²½³¤¦Á£¬¿ÉÒÔ¿´µ½ÌÝ¶ÈÏÂ½µÂ·Ïß³ÊÏÖ¾â³ÝÐÎ£¬ÊÕÁ²ËÙ¶ÈºÜÂý¡£¾¡¹ÜÕâÖÖ·½·¨±ÈÊ¹ÓÃ¹Ì¶¨Ñ§Ï°ÂÊ¸üÓÅ£¬µ«ÊÇËã·¨³¯×îÓÅÄ¿±êÖµÇ°½øµÄÂ·Ïß·Ç³£ÇúÕÛ¡£ÒòÎªÃ¿Ò»¸öÓÉÌÝ¶È¸ø³öµÄÏßËÑË÷·½Ïò¶¼ÓëÉÏÒ»¸öÏßËÑË÷·½ÏòÕý½»£¬ÏÂÃæ¸ø³öÏßËÑË÷·½ÏòÕý½»ÐÔµÄÊýÑ§Ö¤Ã÷£º ÔÚµü´úµã¦Èk¡ÊRn´¦£¬ÑØÌÝ¶È·½ÏòdkÖ´ÐÐÏßËÑË÷£¬ËÑË÷Âú×ãÊ½£¨5ª²9£©µÄ²½³¤¦Ák£¬½«f¦Èk+¦Ádk¹ØÓÚ¦ÁÇóµ¼¿ÉµÃÊ½£¨5ª²10£©£¬ÓÉÓÚ«ýf¦Èk+1=dk+1£¬ËùÒÔ·½ÏòdkÓëdk+1ÊÇÕý½»µÄ£¬Òò´ËÉÏÒ»´ÎÏßËÑË÷·½Ïò²¢²»»áÓ°ÏìÏÂÒ»´ÎÏßËÑË÷µÄ·½Ïò£¬ÔÚµ±Ç°ÌÝ¶È·½ÏòÖ´ÐÐÏßËÑË÷ÏÂ½µµ½¼«Ð¡Öµ£¬ÔÙÔÚÐÂµÄÎ»ÖÃÖØÐÂÈ·¶¨ËÑË÷·½Ïò£¬ÕâÏàµ±ÓÚ·ÅÆúÁËÖ®Ç°ÏßËÑË÷·½ÏòÉÏÈ¡µÃµÄ½øÕ¹£¬¹²éîÌÝ¶È·¨ÔòÊÔÍ¼½â¾öÕâ¸öÎÊÌâ¡£

¦Ák= argminf¦Èk+¦Ádk£¨5ª²9£©

dTk¡Á«ýf¦Èk+1=0£¨ÆäÖÐ£¬¦Èk+1=¦Èk+¦Ákdk£©£¨5ª²10£©


¹²éîÌÝ¶È·¨×îÔçÓÉHastinessºÍStiefleÌá³ö£¬ÊÇÒ»ÖÖÖ¼ÔÚÇó½âÏßÐÔ·½³Ì×éAx=bµÄµü´ú·½·¨£¬ÆäÖÐAÎªÊµ¶Ô³ÆÕý¶¨¾ØÕó¡£Çó½âÏßÐÔ·½³Ì×éAx=bÊµ¼ÊÉÏ¿ÉÒÔ×ª»»ÎªÇó½âÊ½£¨5ª²11£©£¬ÆäÖÐbTbÏî¶Ô×îÐ¡ÖµµãÃ»ÓÐÓ°Ïì£¬Òò´Ë¿ÉÒÔµÈ¼Û×ª»¯ÎªÇó¶þ´Î¹æ»®ÎÊÌâÊ½£¨5ª²12£©¡£

min¡¬Ax£­b¡¬22=minxTATAx£­bTAx+bTb£¨5ª²11£©

min¡¬Ax£­b¡¬22=minxTATAx£­bTAx£¨5ª²12£©

Òò´Ë£¬¶ÔÓÚ±ê×¼Ä¿±êº¯Êý

min¦Èf¦È=12¦ÈTQ¦È+qT¦È£¨5ª²13£©

ÆäÖÐ£¬Q¡ÊRn¡ÁnÎª¶Ô³ÆÕý¶¨¾ØÕó£¬q¡ÊRn£¬ÓÉÓÚ¾ØÕóQÕý¶¨£¬Ä¿±êº¯ÊýµÄHessian¾ØÕóªµ2f¦Èªµ¦Èªµ¦ÈT=Q>0£¬¹Ê¸ÃÎÊÌâÊµ¼ÊÉÏÊÇÒ»¸öÍ¹ÓÅ»¯ÎÊÌâ¡£¶ÔÓÚnÎ¬ÓÅ»¯ÎÊÌâ¦È¡ÊRn£¬¹²éîÌÝ¶È·¨×î¶àn´Îµü´ú¾Í¿ÉÒÔ×¼È·ÕÒµ½×îÓÅ½â¡£
Ê×ÏÈ½éÉÜ¹²éîµÄ¸ÅÄî£¬¶ÔÓÚÏòÁ¿d1,¡­,dm¡ÊRn£¬¶ÔÓÚ¶Ô³ÆÕý¶¨¾ØÕóQ¡ÊRn¡Án£¬ÈôÂú×ãdTiQdj=0,i¡Ùj,Ôò³Æd1,¡­,dm¹ØÓÚQÏà»¥¹²éî£¬ÏòÁ¿×éd1,¡­,dm³ÆÎªQª²¹²éîÏòÁ¿×é£¬²¢ÇÒd1,¡­,dmÏßÐÔÎÞ¹Ø¡£¹²éîÌÝ¶È·¨Ö¼ÔÚÑ°ÕÒÒ»×é¹²éîÏòÁ¿×÷ÎªÃ¿´Îµü´úµÄËÑË÷·½Ïò£¬È»ºóÔÚÕâÐ©·½ÏòÉÏÖ´ÐÐÏßËÑË÷È¡µÃÔÚ¸Ã·½ÏòÉÏµÄ¼«Ð¡Öµ¡£ÓëÌÝ¶ÈÏÂ½µ·¨²»Í¬£¬Ã¿Ò»´ÎËÑË÷·½Ïò²»½öÓÉµ±Ç°ÌÝ¶È·½ÏòµÃµ½£¬Ò²ÓëÇ°Ò»´ÎËÑË÷·½ÏòÓÐ¹Ø£¬µ±ÑØ×Åµ±Ç°ËÑË÷·½ÏòÇó¼«Ð¡ÖµµÄÊ±ºò£¬²»»áÓ°ÏìÔÚÖ®Ç°·½ÏòÈ¡µÃµÄ¼«Ð¡Öµ£¬¼´²»»áÉáÆúÖ®Ç°·½ÏòÉÏµÄ½øÕ¹¡£¶ÔÓÚµÚk´Îµü´ú£¬ËÑË÷·½ÏòdkÂú×ã

dk=«ýf¦Èk+¦Âkdk£­1£¨5ª²14£©

ÆäÖÐ£¬ÏµÊý¦ÂkÓÃÓÚ¿ØÖÆÏÈÇ°·½Ïò¶Ôµ±Ç°·½ÏòµÄ¹±Ï×£¬¿ÉÒÔÖ¤Ã÷µ±Ç°ËÑË÷·½ÏòdkÓëÏÈÇ°ËùÓÐµÄËÑË÷·½Ïòd0,¡­,dk£­1ÊÇÂú×ãÁ½Á½¹²éîµÄ£¬Òò´ËÓÉµ±Ç°µü´úµãÌÝ¶È«ýf¦ÈkºÍÉÏÒ»´ÎËÑË÷·½Ïòdk£­1À´È·¶¨ÐÂµÄËÑË÷·½ÏòÊÇ¿ÉÐÐµÄ£¬Ò»µ©È·¶¨ÁËÃ¿Ò»´Îµü´úµÄËÑË÷·½Ïò¾Í¿ÉÒÔÔÚÕâÐ©·½ÏòÉÏÖ´ÐÐÏßËÑË÷È·¶¨Ã¿Ò»´Îµü´úµÄ²½³¤¡£ÏÂÃæÏêÏ¸ËµÃ÷ËÑË÷·½ÏòdkºÍ×îÓÅ²½³¤¦ÁkµÄÈ·¶¨·½·¨¡£
1. ÏßËÑË÷·½ÏòµÄÈ·¶¨
¸ù¾Ý¹«Ê½£¨5ª²14£©£¬Ã¿´ÎÇóÐÂµÄËÑË÷·½ÏòÐèÒªÏÈÇó½âÏµÊý¦Âk£¬ÓÉÓÚµ±Ç°ËÑË÷·½ÏòÓëÇ°Ò»ËÑË÷·½Ïò¹²éî£¬Òò´ËdTk£­1QdK=0£¬½«Ê½£¨5ª²14£©´úÈë¿ÉµÃ

¦Âk=dTk£­1Q«ýf¦ÈkdTk£­1QdK£­1£¨5ª²15£©

¿ÉÒÔ¿´µ½£¬Ö±½ÓÊ¹ÓÃ¸Ã·½·¨Çó½âÃ¿Ò»´Îµü´úµÄÏßËÑË÷·½ÏòdkÊ±ÐèÒªÇó½â²ÎÊý¦Âk£¬¶ø¸Ã²ÎÊýµÄÇó½âÐèÒª¼ÆËãHessian¾ØÕó£¬ÎªÁË±ÜÃâÓ¦ÓÃHessian¾ØÕóµÄÔËËã£¬¶ÔÔ­Ê¼µÄ¹²éîÌÝ¶È·¨½øÐÐÐÞÕý£¬Ê¹µÃ²»ÐèÒªÍÆµ¼¼ÆËãHessian¾ØÕóÒ²ÄÜÇóµÃÕâÐ©¹²éîµÄËÑË÷·½Ïò¡£³£ÓÃµÄÁ½ÖÖ·½·¨ÎªFletcherª²Reeves¹²éîÌÝ¶ÈÐÞÕý·½·¨ºÍPolakª²Ribi¨¨re¹²éîÌÝ¶ÈÐÞÕý·½·¨£¬²ÎÊý¦ÂkµÄ¼ÆËã¹«Ê½ÈçÊ½£¨5ª²16£©ºÍÊ½£¨5ª²17£©ËùÊ¾¡£
1£© Fletcherª²Reeves

¦Âk=«ý¦Èf¦ÈkT«ý¦Èf¦Èk«ý¦Èf¦Èk£­1T«ý¦Èf¦Èk£­1£¨5ª²16£©

2£© Polakª²Ribi¨¨re

¦Âk=«ý¦Èf¦Èk£­«ý¦Èf¦Èk£­1T«ý¦Èf¦Èk«ý¦Èf¦Èk£­1T«ý¦Èf¦Èk£­1£¨5ª²17£©

2. ×îÓÅ²½³¤µÄÈ·¶¨
È·¶¨ÁËÃ¿´Îµü´úµÄËÑË÷·½Ïò£¬±ã¿ÉÒÔÔÚ´Ë·½ÏòÉÏÖ´ÐÐÏßËÑË÷£¬È·¶¨Ã¿´Îµü´úµÄ×îÓÅ²½³¤¡£¸ù¾Ý¶¨Òå½«Ê½f¦Èk+¦Ádk¹ØÓÚ¦ÁÇóµ¼£¬µÃµ½¦Ák£¬ÏêÏ¸²½ÖèÈçÏÂ£º 
Áî

df¦Èk+¦Ádkd¦Á|¦Á=¦Ák=0

µÃ

dTk¡Á«ýf¦Èk+1=0

ÆäÖÐ£¬«ýf¦Èk+1=Q¦Èk+1+q=Q¦Èk+1£­¦Èk+«ýf¦Èk£¬´úÈëÉÏÊ½£¬µÃ

dTk¡ÁQ¦Èk+1£­¦Èk+«ýf¦Èk=0

dTk¡ÁQ¦Ákdk+«ýf¦Èk=0

¦Ák=£­dTkQ«ýf¦ÈkdTkQdk(5ª²18)

¹²éîÌÝ¶È·¨ÏêÏ¸Á÷³Ì¼û±í5ª²3¡£


±í5ª²3¹²éîÌÝ¶È·¨



¶ÔÓÚÍ¹¶þ´ÎÓÅ»¯ÎÊÌâÊ½£¨5ª²13£©£º 

1. ÈÎÒâÑ¡Ôñ³õÊ¼µã¦È0£¬³õÊ¼¸üÐÂ·½Ïòd0=«ýf¦È0

2. ÅÐ¶Ï«ýf¦ÈkµÄÖµ£º ÈôµÈÓÚ0£¬¦Èk¼´Îª×îÓÅÖµ£¬·µ»Ø¦Èk²¢Í£Ö¹µü´ú£» ·ñÔò½øÐÐ¸üÐÂ¦Èk+1=¦Èk+¦Ákdk£¬¦ÁkÓÉÊ½£¨5ª²18£©È·¶¨

3. ¸ù¾ÝÊ½£¨5ª²14£©¸üÐÂÏÂÒ»´ÎËÑË÷·½Ïò£¬ÆäÖÐ¦Âk¼ûÊ½£¨5ª²16£©ºÍÊ½£¨5ª²17£©

ÖØ¸´²½Öè2£¬3Ö±ÖÁÕÒµ½×îÓÅ½â

Í¨¹ý¹²éîÌÝ¶È·¨µÄËã·¨²½Öè¿ÉÒÔ¿´³ö£¬ÆäÖ»ÐèÒª¼ÆËãºÍ´æ´¢Ä¿±êº¯ÊýµÄÌÝ¶ÈÖµ£¬ÓëÅ£¶Ù·¨dk=£­Hkgk £¨ÆäÖÐHkÊÇHessian¾ØÕóÔÚ¦Èk´¦µÄÖµ£©Ïà±È£¬¹²éîÌÝ¶È·¨´æ´¢Á¿´ó´ó¼õÐ¡£¬Òò´ËÊÊºÏÇó½â´ó¹æÄ£ÎÊÌâ¡£Í¬Ê±£¬¶ÔÓÚÌÝ¶ÈÏÂ½µ·¨ÊÕÁ²ËÙ¶ÈÂýÒÔ¼°¾â³ÝÏÖÏóÒ²ÓÐºÜ´ó¸ÄÉÆ£¬µ«ÆäÊÕÁ²ËÙ¶ÈÈÔÈ»ÏÔÖøÂýÓÚÅ£¶Ù·¨»òÄâÅ£¶Ù·¨¡£
ÒÔÉÏ¶ÔÓÚ¹²éîÌÝ¶È·¨µÄÌÖÂÛ¶¼ÊÇ»ùÓÚÄ¿±êº¯ÊýÊÇÍ¹¶þ´Îº¯ÊýµÄÇé¿ö£¬ÊÇÓÃÓÚÇó½âÏßÐÔ·½³Ì×éµÄÏßÐÔ¹²éîÌÝ¶È·½·¨¡£¶ÔÓÚÉî²ãÉñ¾­ÍøÂç»òÕßÆäËûÉî¶ÈÑ§Ï°Ä£ÐÍ£¬ÆäÄ¿±êº¯ÊýÔ¶±È¶þ´Îº¯Êý¸´ÔÓµÃ¶à£¬¹²éîÌÝ¶È·¨ÈÔÈ»ÊÊÓÃ£¬µ«ÊÇÐèÒª×öÒ»Ð©ÐÞ¸Ä¡£FletcherºÍReeves×îÔç½«ÏßÐÔ¹²éîÌÝ¶È·¨µÄË¼ÏëÓÃÓÚÇó½â·ÇÏßÐÔ×îÓÅ»¯ÎÊÌâ¡£·ÇÏßÐÔ¹²éîÌÝ¶È·¨Çó½âÎÞÔ¼Êø¼«Ð¡»¯ÎÊÌâminf¦È£¬ÆäÖÐf:Rn¡úRÁ¬Ðø¿ÉÎ¢¡£²»Í¬µÄ·ÇÏßÐÔ¹²éîÌÝ¶È·¨Çó½â¦ÂkµÄËã·¨²»Í¬£¬ÀýÈçÉÏÎÄÌáµ½µÄFletcherª²Reeves·½·¨ºÍPolakª²Ribi¨¨re·½·¨£¬Êµ¼ÊÉÏ»¹ÓÐºÜ¶àÆäËû·½·¨£¬ÔÚ´Ë²»Õ¹¿ª½éÉÜ¡£ÐèÒª×¢ÒâµÄÊÇ£¬µ±Ä¿±êº¯ÊýÊÇÍ¹¶þ´Îº¯Êý£¬²¢ÇÒ²½³¤¦ÁkÓÉ¾«È·ËÑË÷µÃµ½£¨¾«È·ËÑË÷ÒªÇó²½³¤¦Ák¸ù¾ÝÊ½£¨5ª²9£©ÇóµÃ£¬Êµ¼ÊÉÏ»¹ÓÐÆäËûËÑË÷²ßÂÔ£¬ÀýÈçArmijoËÑË÷ºÍWolfeËÑË÷ÒÔ¼°Âú×ãGoldsteinÌõ¼þµÄ·Ç¾«È·ËÑË÷£©£¬²¢ÇÒµÚÒ»¸öËÑË÷·½ÏòÊÇÌÝ¶È·½ÏòÊ±£¬·ÇÏßÐÔ¹²éîÌÝ¶È·¨µÈ¼ÛÓÚ±ê×¼µÄÏßÐÔ¹²éîÌÝ¶È·¨¡£µ±²ÉÓÃ¾«È·ÏßËÑË÷Ê±£¬ËùÓÐµÄ¹²éîÌÝ¶È·¨¶¼ÊÇÏÂ½µËã·¨£¬¼´±£Ö¤Ã¿Ò»¸öËÑË÷·½Ïò¶¼ÊÇÏÂ½µ·½Ïò¡£¶ø²ÉÓÃ·Ç¾«È·ÏßÐÔËÑË÷Ê±Ôò²»Âú×ãÕâÑùµÄÐÔÖÊ£¬Ä³Ð©·ÇÏßÐÔ¹²éîÌÝ¶È·¨²»ÄÜ±£Ö¤Ã¿Ò»²½¶¼ÊÇÏÂ½µ·½Ïò¡£Òò´Ë£¬·ÇÏßÐÔ¹²éîÌÝ¶ÈËã·¨Ö´ÐÐ¹ý³ÌÖÐ¿ÉÄÜÐèÒªÖØÉè²ÎÊý£¬ÔÚÖ´ÐÐÈô¸É²½ºóÑØ¸ºÌÝ¶È·½ÏòÖØÐÂ¿ªÊ¼²¢²ÉÈ¡¾«È·ÏßËÑË÷¡£Êµ¼ù±íÃ÷£¬¿ÉÒÔÊ¹ÓÃ·ÇÏßÐÔ¹²éîÌÝ¶ÈËã·¨ÑµÁ·Éñ¾­ÍøÂç£¬Ê¹ÓÃËæ»úÌÝ¶ÈÏÂ½µµü´úÈô¸É²½À´³õÊ¼»¯²ÎÊýÐ§¹û»á¸üºÃ¡£ÓÐÐí¶à¶ÔÓÚ·ÇÏßÐÔ¹²éîÌÝ¶È·¨È«¾ÖÊÕÁ²ÐÔ·ÖÎöµÄÑÐ¾¿£¬¸ÐÐËÈ¤µÄ¶ÁÕß¿É×ÔÐÐ²éÔÄ¡£
5.1.5ÄâÅ£¶Ù·¨
ÓÉÓÚHessian¾ØÕóÎ¬¶È¹ý´ó´øÀ´µÄ¾Þ´ó¼ÆËãÁ¿£¬Ê¹µÃÅ£¶Ù·¨ÎÞ·¨ÓÐÐ§Ö´ÐÐ¡£ÎªÁË¿Ë·þÕâ¸öÎÊÌâ£¬ÔÚÅ£¶Ù·¨µÄ»ù´¡ÉÏÌá³öÁËÏµÁÐ¸Ä½ø·½·¨¡ª¡ªÄâÅ£¶Ù·¨£¨Quasiª²Newton Methods£©¡£¸Ã·½·¨µÄ»ù±¾Ë¼ÏëÊÇÊ¹ÓÃÕý¶¨¶Ô³Æ¾ØÕó½üËÆHessian¾ØÕó£¬Ê¹ÓÃ½üËÆ¾ØÕóÖ´ÐÐ²ÎÊýµÄ¸üÐÂ£¬Òò´ËÄâÅ£¶Ù·¨¿ÉÒÔ¿´×÷¶ÔÅ£¶Ù·¨µÄ½üËÆ¡£²»Í¬µÄÄâÅ£¶Ù·¨¹¹Ôì½üËÆ¾ØÕóµÄ·½·¨²»Í¬£¬³£ÓÃµÄÄâÅ£¶Ù·¨°üÀ¨DFP¡¢BFGS¡¢Lª²BFGSµÈ¡£ÄâÅ£¶Ù·¨Ö»ÐèÒªÊ¹ÓÃÒ»½×µ¼Êý£¬²»ÐèÒª¼ÆËãHessian¾ØÕó¼°ÆäÄæ¾ØÕó£¬¼õÉÙÁËÔËËã¸´ÔÓ¶È£¬Òò´ËÄÜ¹»¸ü¿ìµØÊÕÁ²¡£
¹¹ÔìHessian¾ØÕóµÄ½üËÆ¾ØÕóÐèÒªÂú×ãÒ»¶¨µÄÌõ¼þ¡ª¡ªÄâÅ£¶ÙÌõ¼þ£¨Ò²³ÆÎªÄâÅ£¶Ù·½³Ì»òÕß¸îÏßÌõ¼þ£©£¬¸ÃÌõ¼þ¸ø³öÁË¹¹Ôì½üËÆ¾ØÕóµÄÀíÂÛÖ¸µ¼£¬¹¹ÔìµÄ¾ØÕó±ØÐëÂú×ãÕâ¸öÌõ¼þ¡£»Ø¹ËÅ£¶Ù·¨£¬Ê×ÏÈ¶ÔÄ¿±êº¯ÊýÔÚÈÎÒ»µã¦Èk+1´¦½øÐÐ¶þ½×Ì©ÀÕ¹«Ê½Õ¹¿ªµÃµ½½üËÆº¯Êý£¬ÈçÊ½£¨5ª²19£©£» È»ºó¶Ô½üËÆº¯ÊýÇóµ¼µÃµ½Ê½£¨5ª²20£©¡£Áî¦È=¦Èk´úÈëÊ½£¨5ª²20£©²¢ÒÆÏîÕûÀí¿ÉµÃÊ½£¨5ª²21£©£¬Í¨¹ýÒýÈë±äÁ¿skºÍyk½«Ê½£¨5ª²21£©½øÐÐÕûºÏ¿ÉµÃÊ½£¨5ª²24£©£¬Ê¹ÓÃHessian¾ØÕóµÄÄæ¾ØÕóµÄÐÎÊ½½øÐÐ±í´ïÔòÎªÊ½£¨5ª²25£©¡£Ê½£¨5ª²26£©ºÍÊ½£¨5ª²27£©¼´ËùÎ½µÄÄâÅ£¶ÙÌõ¼þ£¬¶þÕßÊÇµÈ¼ÛµÄ£¬¹¹ÔìµÄ½üËÆ¾ØÕóÐèÒªÂú×ãÏàÓ¦Ô¼Êø£¬¼´HµÄ½üËÆ¾ØÕóB»òÕßH-1µÄ½üËÆ¾ØÕóD¶¼ÐèÒªÂú×ãÕâ¸öÌõ¼þ¡£

f¦È¡Öf¦Èk+1+¦È£­¦Èk+1T¡¤«ýf¦Èk+1+12¦È£­¦Èk+1T¡¤«ý2f¦Èk+1¡¤¦È£­¦Èk+1£¨5ª²19£©

«ýf¦È¡Ö«ýf¦Èk+1+Hk+1¡¤¦È£­¦Èk+1£¨5ª²20£©

gk+1£­gk¡ÖHk+1¡¤¦Èk+1£­¦Èk(5ª²21)

sk=¦Èk+1£­¦Èk(5ª²22)

yk=gk+1£­gk(5ª²23)

yk¡ÖHk+1¡¤sk(5ª²24)

sk¡ÖH£­1k+1¡¤yk(5ª²25)

yk=Bk+1¡¤sk(5ª²26)

sk=Dk+1¡¤yk(5ª²27)


ÓÐÁËÄâÅ£¶ÙÌõ¼þ£¬ÈçºÎÔÚÂú×ã´ËÌõ¼þµÄ»ù´¡ÉÏ¹¹Ôì½üËÆ¾ØÕóÄØ£¿ÏÂÃæ½«½éÉÜ¼¸ÖÖ³£¼ûµÄÄâÅ£¶Ù·¨¡£¶ÔÓÚDFPËã·¨£¬ÆäÊµ¼ÊÉÏ¶ÔHessian¾ØÕóµÄÄæ¾ØÕó½øÐÐ½üËÆÔËËã£¬¼´Çó¾ØÕóD£» ¶øBFGSËã·¨Ö±½Ó¶ÔHessian¾ØÕó½øÐÐÔËËã£¬ÇóÆä½üËÆ¾ØÕóB£¬BFGSËã·¨ÇóµÃHessian¾ØÕóµÄ½üËÆ¾ØÕóBºó»¹ÐèÒª¶ÔBÇóÄæ¾ØÕóÓÃÒÔÖ´ÐÐ²ÎÊýµÄ¸üÐÂ£¬½ÓÏÂÀ´½«¼òÊöÕâÁ½ÖÖ·½·¨µÄµü´ú²½Öè¡£
1. DFPËã·¨
DFPËã·¨×îÔçÓÉDavidon W.D.ÓÚ1959ÄêÌá³ö£¬ËæºóÓÉFletcher R.ºÍPowell M.J.D.¼ÓÒÔÍêÉÆºÍ·¢Õ¹£¬ÊÇ×îÔçµÄÒ»ÖÖÄâÅ£¶Ù·¨£¬DFPËã·¨Òò´ËÒÔÈýÈËµÄÃû×ÖÃüÃû¡£¸ÃËã·¨µÄºËÐÄÊÇµü´ú¸üÐÂH-1µÄ½üËÆ¾ØÕóD£¬Æä¹«Ê½Îª

Dk+1=Dk+sksTksTkyk£­DkykyTkDkyTkDkyk£¨5ª²28£©

ÍêÕûµÄDFPËã·¨²½ÖèÈç±í5ª²4ËùÊ¾¡£


±í5ª²4DFPËã·¨



1. ÈÎÒâÑ¡Ôñ³õÊ¼µã¦È0£¬Áî½üËÆ¾ØÕóD0=I£¬k=0£¬ÉèÖÃ¾«¶ÈãÐÖµ¦Å

2. È·¶¨ËÑË÷·½Ïòdk=£­Dk¡¤gk

3. ÀûÓÃÏßËÑË÷µÃµ½µ±Ç°ËÑË÷²½³¤¦Ák£¬Ö´ÐÐ¸üÐÂ¦Èk+1=¦Èk+dk¦Ák

4. ¼ÆËãgk+1£¬Èô¡¬gk+1¡¬<¦Å£¬Ëã·¨½áÊø

5. ¼ÆËãyk=gk+1£­gk£¬²¢¸üÐÂ½üËÆ¾ØÕóDk+1=Dk+sksTksTkyk£­DkykyTkDkyTkDkyk

6. Áîk¡ûk+1£¬ÖØ¸´²½Öè2~5

2. BFGSËã·¨
BFGSËã·¨Í¬ÑùÊÇÒÔ4¸ö·¢Ã÷ÕßµÄÃû×ÖÃüÃûµÄ¡£ÓëDFPËã·¨²»Í¬£¬BFGSËã·¨µÄºËÐÄÊÇÇóµÃHessian¾ØÕóµÄ½üËÆ¾ØÕó¡£ÆäÐÔÄÜÓÅÓÚDFPËã·¨£¬ÒÑÈ¡´úDFPËã·¨³ÉÎªÇó½âÎÞÔ¼Êø·ÇÏßÐÔÓÅ»¯ÎÊÌâµÄÁ÷ÐÐ·½·¨¡£BFGSËã·¨µÄºËÐÄµü´ú¸üÐÂ¹«Ê½ÈçÊ½£¨5ª²29£©ËùÊ¾¡£
ÓÉÓÚÊ½£¨5ª²29£©¼ÆËãµÃµ½µÄÊÇHessian¾ØÕóµÄ½üËÆ¾ØÕó£¬¶øÖ´ÐÐ²ÎÊý¸üÐÂÐèÒªÓÃµ½Hessian¾ØÕóµÄÄæ¾ØÕó£¬Òò´Ë»¹ÐèÒª¶ÔµÃµ½µÄ½üËÆ¾ØÕóÇóÄæ¾ØÕó£¬Ê¹ÓÃShermanª²Morrison¹«Ê½£¬¿ÉÒÔ½«Ê½£¨5ª²29£©×ª»»³Éº¬ÓÐ½üËÆ¾ØÕóµÄÄæ¾ØÕóµÄ¸üÐÂ¹«Ê½£¬ÈçÊ½£¨5ª²30£©ËùÊ¾¡£PowellÖ¤Ã÷ÁË¾ßÓÐWolfeËÑË÷µÄBFGSËã·¨µÄÈ«¾ÖÊÕÁ²ÐÔºÍ³¬ÏßÐÔÊÕÁ²ÐÔ¡£

Bk+1=Bk+ykyTkyTksk£­BksksTkBksTkBksk(5ª²29)

B£­1k+1=I£­skyTkyTkskB£­1kI£­yksTkyTksk+sksTkyTksk(5ª²30)

ÍêÕûµÄBFGSËã·¨Èç±í5ª²5ËùÊ¾¡£


±í5ª²5BFGSËã·¨



1. ÈÎÒâÑ¡Ôñ³õÊ¼µã¦È0£¬Áî½üËÆ¾ØÕóD0=I£¬k=0£¬ÉèÖÃ¾«¶ÈãÐÖµ¦Å

2. È·¶¨ËÑË÷·½Ïòdk=£­Dk¡¤gk

3. ÀûÓÃÏßËÑË÷µÃµ½µ±Ç°ËÑË÷²½³¤¦Ák£¬Ö´ÐÐ¸üÐÂ¦Èk+1=¦Èk+dk¦Ák

4. ¼ÆËãgk+1£¬Èô¡¬gk+1¡¬<¦Å£¬Ëã·¨½áÊø

5. ¼ÆËãyk=gk+1£­gk£¬²¢¸üÐÂ½üËÆ¾ØÕó

B£­1k+1=I£­skyTkyTkskB£­1kI£­yksTkyTksk+sksTkyTksk

6. Áîk¡ûk+1£¬ÖØ¸´²½Öè2~5

3. Lª²BFGSËã·¨
ÓÉÓÚBFGSËã·¨ÔÚÃ¿´Îµü´úÖÐ±ØÐë´æ´¢½üËÆ¾ØÕóDk£¬¶ÔÓÚº¬ÓÐN¸ö²ÎÊýµÄÄ£ÐÍ£¬Dk¾ØÕóµÄ´óÐ¡ÎªN¡ÁN¡£¶ÔÓÚ°ÙÍò¼¶±ð²ÎÊýµÄÉî¶ÈÑ§Ï°Ä£ÐÍ£¬ÐèÒª¼«´óµÄ´æ´¢´ú¼Û£¬Ò»°ãµÄ·þÎñÆ÷ÊÇºÜÄÑ³ÐÊÜµÄ¡£Òò´Ë£¬ÎªÁË¼õÉÙBFGSËã·¨µü´ú¹ý³ÌÖÐËùÐèµÄÄÚ´æ¿ªÏú£¬Lª²BFGSËã·¨Í¨¹ý¸Ä½øBFGSËã·¨À´±ÜÃâ´æ´¢ÍêÕûµÄ½üËÆ¾ØÕó£¬´ó´ó½µµÍÁË´æ´¢´ú¼Û¡£ÓëBFGSËã·¨²»Í¬£¬Lª²BFGSËã·¨²»ÔÙ´æ´¢ÍêÕûµÄ½üËÆ¾ØÕóDk£¬¶øÊÇ´æ´¢ÓÃÓÚ¼ÆËãDkµÄÏòÁ¿ÐòÁÐsi,yi£¬µ±ÐèÒªÊ¹ÓÃ¾ØÕóDkÊ±£¬¾ÍÀûÓÃ´æ´¢µÄÏòÁ¿ÐòÁÐsi,yi¼ÆËãµÃµ½¡£ÁíÍâ£¬ÓÃ»§Ò²¿ÉÒÔÖ»Ñ¡Ôñ´æ´¢×î½üµÄm¸öÏòÁ¿siºÍyi£¬¶ø·Ç´æ´¢¼ÆËã¹ý³ÌÖÐËùÓÐµÄsiºÍyi¡£¾ØÕóDk+1µÄ¼ÆËãÐèÒªÊ¹ÓÃÐòÁÐsi,yiki=0£¬Èç¹ûÖ»´æ´¢m×é£¬Ö»ÐèÒª´æ´¢×î½üµÄm×éÐòÁÐsi,yiki=k£­m+1£¬Òò´Ë¼ÆËãµÃµ½µÄDk+1ÊÇ½üËÆÖµ¡£ÕâÑù´æ´¢µÄ´ú¼ÛÓÉÔ­À´µÄON2½µÎªOmN¡£
5.2×ÔÊÊÓ¦Ñ§Ï°ÂÊËã·¨

±¾½Ú½éÉÜµ÷ÕûÑ§Ï°ÂÊµÄÓÅ»¯Ëã·¨£¬Ö÷Òª°üÀ¨AdaGrad¡¢RMSprop¡¢AdaDeltaºÍAdamËã·¨£¬²¢¶ÔÕâ¼¸ÖÖÓÅ»¯·½·¨½øÐÐ±È½Ï¡£
5.2.1Ñ§Ï°ÂÊË¥¼õ
Ñ§Ï°ÂÊ±íÊ¾Ã¿´Î¸üÐÂµÄ·ù¶È£¬ÊÇÉî¶ÈÑ§Ï°ÖÐ×îÖØÒªµÄ³¬²ÎÊý£¬±ØÐë½÷É÷ÉèÖÃ¡£Ñ§Ï°ÂÊÌ«´ó»áµ¼ÖÂËðÊ§º¯Êý±¬Õ¨£¬ÈÝÒ×ÔÚÄ¿±êÖµÖÜÎ§¾çÁÒÕðµ´£¬²»ÄÜÊÕÁ²µ½Ä¿±êÖµ£» ¶øÑ§Ï°ÂÊÌ«Ð¡Ôòµ¼ÖÂÊÕÁ²ËÙ¶È¹ýÂý£¬Ð§ÂÊ²»¸ß¡£Ñ¡ÔñºÏÊÊµÄÑ§Ï°ÂÊÐèÒªÒ»¶¨µÄ¼¼ÇÉ¡£Êµ¼ùÖÐ£¬½«Ñ§Ï°ÂÊËæÊ±¼ä½øÐÐË¥¼õ£¨Ñ§Ï°ÂÊË¥¼õÒ²³ÆÑ§Ï°ÂÊÍË»ð£©£¬ÑµÁ·¿ªÊ¼Ê±Ê¹ÓÃ½Ï´óµÄÑ§Ï°ÂÊÒÔ±£Ö¤ÊÕÁ²ËÙ¶È£¬µü´ú¹ý³ÌÖÐÖð½¥Ë¥¼õ£¬ÔÚ½Ó½ü×îÓÅµã¸½½üÊ±Ê¹ÓÃ½ÏÐ¡µÄÑ§Ï°ÂÊ¡£ÒòÎªÔÚÄ¿±êÖµ¸½½ü£¬ÌÝ¶ÈÒÑ¾­ºÜÐ¡ÁË£¬Î¬³ÖÔ­ÓÐµÄÑ§Ï°ÂÊ½«Ê¹µÃ²ÎÊýÔÚ×îÓÅµã¸½½üÀ´»ØÕðµ´£¬´ËÊ±½µµÍÑ§Ï°ÂÊËðÊ§º¯Êý»á»ñµÃ½øÒ»²½µÄÏÂ½µ¡£
Ñ§Ï°ÂÊËæ²½ÊýË¥¼õµÄÉèÖÃ·½Ê½£º ¸ù¾Ý¾­ÑéÈËÎªÉè¶¨£¬ÀýÈçÑµÁ·Èô¸ÉÂÖ»òµü´úÈô¸É´Îºó£¬½«Ñ§Ï°ÂÊ½øÐÐË¥¼õ¡£¾ßÌåºÎÊ±½øÐÐË¥¼õÒÔ¼°Ë¥¼õ¶àÉÙÒÀÀµÓÚ¾ßÌåÎÊÌâºÍÑ¡ÔñµÄÄ£ÐÍ¡£Êµ¼ùÖÐµÄÒ»ÖÖ¾­Ñé×ö·¨ÊÇ£¬Ê¹ÓÃ³õÊ¼Ñ§Ï°ÂÊÑµÁ·£¬Í¬Ê±¹Û²ìÑéÖ¤¼¯ÉÏµÄ´íÎóÂÊ£¬µ±ÑéÖ¤¼¯ÉÏµÄ´íÎóÂÊ²»ÔÙÏÂ½µÊ±£¬¾Í³ËÒÔÒ»¸ö³£Êý£¨ÀýÈç0.5£©½µµÍÑ§Ï°ÂÊ¡£
£¨1£© ÄæÊ±Ë¥¼õ

¦Át=¦Á011+¦Ât£¨5ª²31£©

£¨2£© Ö¸ÊýË¥¼õ

¦Át=¦Á0¦Ât£¨5ª²32£©

£¨3£© ×ÔÈ»Ö¸ÊýË¥¼õ

¦Át=¦Á0e£­¦Ât£¨5ª²33£©

ÆäÖÐ£¬¦Á0Îª³õÊ¼Ñ§Ï°ÂÊ£¬µÚt´Îµü´úµÄÑ§Ï°ÂÊÎª¦Át£¬¦ÂÎªË¥¼õÂÊ£¬Ò»°ãÈ¡ÖµÎª0.96¡£ÐèÒª×¢ÒâµÄÊÇ£¬ÉÏÊöÑ§Ï°ÂÊµÄµ÷Õû·½·¨¶ÔËùÓÐ²ÎÊýÊÊÓÃ£¬¼´ËùÓÐ²ÎÊýÔÚÃ¿´Îµü´úÊ±Ê¹ÓÃµÄÑ§Ï°ÂÊÊÇÏàÍ¬µÄ£¬½øÐÐÏàÍ¬µÄË¥¼õ¡£µ«ÊÇ£¬ÓÉÓÚËðÊ§º¯ÊýÔÚÃ¿¸ö²ÎÊýÎ¬¶ÈÉÏµÄÊÕÁ²ËÙ¶È²»Í¬£¨ÈçÍ¼5ª²1ÖÐµÄÊ¾Àý£©£¬Òò´ËÓÐ±ØÒª¸ù¾Ý²»Í¬²ÎÊýµÄÊÕÁ²Çé¿ö·Ö±ðÉèÖÃÏÂÑ§Ï°ÂÊ£¬¸ù¾Ý²»Í¬µÄ²ÎÊý×ÔÊÊÓ¦µØµ÷ÕûÃ¿¸ö²ÎÊýÑ§Ï°ÂÊµÄ·½·¨°üÀ¨AdaGrad¡¢RMSprop¡¢AdaDeltaµÈ£¬ÕâÐ©·½·¨ÎªÃ¿¸ö²ÎÊýÉèÖÃ²»Í¬µÄÑ§Ï°ÂÊ¡£ÏÂÃæ½«ÏêÏ¸½éÉÜÕâ¼¸ÖÖ·½·¨¡£
5.2.2AdaGradËã·¨

AdaGrad£¨Adaptive Gradient£©ÊÇ×ÔÊÊÓ¦Ñ§Ï°ÂÊËã·¨µÄÒ»ÖÖ£¬ÓÉË¹Ì¹¸£´óÑ§µÄJohn Duchi½ÌÊÚÔÚÆä¹¥¶Á²©Ê¿ÆÚ¼äÌá³ö£¬»ù±¾Ë¼ÏëÊÇÊ¹ÓÃL2ÕýÔò»¯¶ÔÌÝ¶È½øÐÐµ÷½Ú£¬ºËÐÄË¼ÏëÊÇÑµÁ·¹ý³ÌÖÐÀÛ¼ÓÌÝ¶ÈÆ½·½ºÍ£¬ÈçÊ½£¨5ª²34£©ËùÊ¾£¬gk±íÊ¾µÚk´Îµü´úµÄÌÝ¶ÈÖµ¡£ÔÚµÚk´Îµü´úÊ±£¬ÏÈÀÛ¼ÓÖ®Ç°ËùÓÐµü´ú²½ÖèµÄÌÝ¶ÈµÄÆ½·½ºÍ£¨·ûºÅ¡°¡Ñ¡±±íÊ¾ÖðÔªËØ½øÐÐ³Ë»ý£©£¬È»ºó¸üÐÂ²ÎÊýÏòÁ¿Ê±Ê¹ÓÃ³õÊ¼Ñ§Ï°ÂÊ³ýÒÔ¸ÃÏî£¬ÈçÊ½£¨5ª²35£©ËùÊ¾£¬ÆäÖÐ¦ÁÎª³õÊ¼Ñ§Ï°ÂÊ£¬¦ÅÊÇÎªÁË·ÀÖ¹·ÖÊ½·ÖÄ¸Îª0¶øÉèÖÃµÄÐ¡³£Êý£¬Ò»°ãÈ¡ÖµÎªe£­10~e£­7£¬ÁíÍâ£¬·ÖÊ½ÖÐµÄ¼Ó¡¢³ý¡¢¿ªÆ½·½ÔËËã¶¼ÊÇÖðÔªËØ½øÐÐµÄ¡£

Gk=¡Æki=1gi¡Ñgi£¨5ª²34£©

¦¤¦Èk=£­¦ÁGk+¦Å¡Ñgk(5ª²35)

AdaGradËã·¨¶ÔÓÚHessian¾ØÕó¸ßÌõ¼þÊýµÄÇé¿öºÜÓÐ°ïÖú£¬ÕâÖÖÇé¿öÏÂÄ¿±êº¯Êý¶Ô²»Í¬Î¬¶ÈµÄ²ÎÊýÃô¸Ð¶È²»Í¬£¬Ïà¶ÔÃô¸ÐµÄÎ¬¶ÈÆÂ¶È±È½Ï¶¸ÇÍ£¬Òò´ËÌÝ¶È½Ï´ó£¬¶ø²»Ì«Ãô¸ÐµÄÎ¬¶ÈÆÂ¶È±È½ÏÆ½»º£¬Òò´ËÌÝ¶È½ÏÐ¡£¬´ËÖÖÇéÐÎÔËÐÐÌÝ¶ÈÏÂ½µËã·¨»áµ¼ÖÂ¡°z¡±×ÖÐÎÏÂ½µ£¬AdaGradËã·¨¿ÉÒÔºÜºÃµØ½â¾öÕâ¸öÎÊÌâ£¬¶ÔÓÚÐ¡ÌÝ¶È·½Ïò£¬ÀÛ¼ÓµÄÌÝ¶ÈºÍÊÇÒ»¸ö½ÏÐ¡µÄÊýÖµ£¬¶Ô´Ë·½ÏòµÄÑ§Ï°ÂÊ½øÐÐ×ÔÊÊÓ¦µ÷Õû£¬Ê¹ÓÃÔ­Ê¼Ñ§Ï°ÂÊ³ýÒÔ¸ÃÏî£¬¿ÉÒÔÌáÉýÔÚ¸Ã·½ÏòÉÏµÄÑµÁ·ËÙ¶È£» ¶øÔÚ´óÌÝ¶È·½Ïò»áÀÛ¼ÓÒ»¸öÏà¶Ô½Ï´óµÄÌÝ¶ÈºÍ£¬µÃµ½½Ï´óµÄ³ýÏî£¬µ¼ÖÂ¸Ã·½ÏòµÄÑ§Ï°ÂÊÏÂ½µ£¬Òò´Ë»áÏàÓ¦µØ½µµÍ¸Ã·½ÏòÉÏµÄÑµÁ·ËÙ¶È¡£¾¡¹Üµ÷ÕûºóÐ¡ÌÝ¶È·½ÏòµÄÑ§Ï°ÂÊÏà¶Ô½Ï´ó£¬´óÌÝ¶È·½ÏòµÄÑ§Ï°ÂÊÏà¶Ô½ÏÐ¡£¬µ«ÕûÌåÉÏËæ×Åµü´ú´ÎÊýµÄÔö¼Ó£¬ÀÛ¼ÓµÄÌÝ¶ÈºÍÊÇµ¥µ÷µÝÔöµÄ¡£Òò´Ë£¬¶ÔÓÚËùÓÐµÄÎ¬¶È£¬Ñ§Ï°ÂÊ¶¼ÊÇÖð½¥¼õÐ¡µÄ£¬ÕâÒ²µ¼ÖÂÁËAdaGradËã·¨µÄÒ»¸öÎÊÌâ£º Ëæ×Åµü´ú²½ÖèkµÄÔö¼Ó£¬¸üÐÂµÄ²½³¤Ô½À´Ô½Ð¡¡£¶ÔÓÚÍ¹º¯Êý£¬AdaGradËã·¨±íÏÖÁ¼ºÃ£¬»áÔÚ¾Ö²¿¼«Ð¡µã¸½½üÂýÏÂÀ´²¢×îÖÕÊÕÁ²£» µ«¶ÔÓÚ·ÇÍ¹µÄÄ¿±êº¯Êý£¬AdaGradËã·¨¿ÉÄÜ»áµ¼ÖÂÑ§Ï°ÂÊ¹ýÔçºÍ¹ýÁ¿µØ¼õÐ¡£¬ÒÔÖÁÓÚËã·¨»¹Ã»ÓÐÕÒµ½×îÓÅµã¾ÍÍ£ÖÍ²»Ç°ÁË£¬ºÜÄÑÔÙ¼ÌÐøËÑË÷×îÓÅµã¡£
5.2.3RMSPropËã·¨
Õë¶ÔAdaGradËã·¨´æÔÚµÄÎÊÌâ£¬Geoffrey HintonÌá³öÁíÒ»ÖÖ¸Ä½øµÄ×ÔÊÊÓ¦Ñ§Ï°ÂÊµÄRMSPropËã·¨£¬¸Ã·½·¨ÒÔÒ»ÖÖÏà¶ÔÎÂºÍµÄ·½Ê½µ÷ÕûÑ§Ï°ÂÊ£¬´Ó¶ø¸ÄÉÆÁËAdaGradËã·¨ÖÐÒòÑ§Ï°ÂÊµ¥µ÷ÏÂ½µµ¼ÖÂµÄ¹ýÔçË¥¼õÎÊÌâ¡£RMSPropËã·¨µÄ´óÌåË¼ÏëÓëAdaGradËã·¨ÏàÍ¬£¬Ö»ÊÇ½«ÀÛ¼ÓÌÝ¶ÈÆ½·½ºÍ±äÎªÌÝ¶ÈÆ½·½Ö¸Êý¼ÓÈ¨µÄÒÆ¶¯Æ½¾ù£¬ÈçÊ½£¨5ª²36£©ËùÊ¾¡£ÆäÖÐ£¬¦ÂÎªË¥¼õÂÊ£¬Ò»°ãÉèÖÃÎª0.9¡£È»ºó£¬Ê¹ÓÃÔ­Ê¼Ñ§Ï°ÂÊ³ýÒÔ¸ÃÏî½øÐÐ¸üÐÂ£¬ÈçÊ½£¨5ª²37£©ËùÊ¾£¬¦ÁÎªÔ­Ê¼Ñ§Ï°ÂÊ¡£Òò´Ë£¬Ïà¶ÔÓÚAdaGradËã·¨£¬RMSPropËã·¨¸øÒ£Ô¶µÄÀúÊ·ÌÝ¶ÈµÄÆ½·½Ò»¸öºÜÐ¡µÄÈ¨ÖØ£¬Ïàµ±ÓÚÉáÆúÒ£Ô¶µÄÀúÊ·Öµ£¬²ÎÊýµÄÑ§Ï°ÂÊ²»»á³ÊË¥¼õÇ÷ÊÆ£¬ÓÐ¿ÉÄÜ±äÐ¡Ò²ÓÐ¿ÉÄÜ±ä´ó¡£RMSPropËã·¨ÒÑ¾­×÷ÎªÒ»ÖÖÓÐÐ§µÄÓÅ»¯Ëã·¨ÓÃÓÚÑµÁ·Éî²ãÉñ¾­ÍøÂç£¬²¢³ÉÎª¹ã·ºÊ¹ÓÃµÄÓÅ»¯Ëã·¨Ö®Ò»¡£

Gk=¦ÂGk£­1+1£­¦Âgk¡Ñgk=1£­¦Â¡Æki=1¦Âk£­igi¡Ñgi£¨5ª²36£©

¦¤¦Èk=£­¦ÁGk+¦Å¡Ñgk(5ª²37)

5.2.4AdaDeltaËã·¨

AdaDeltaËã·¨ÊÇ¶ÔAdaGradËã·¨µÄÁíÒ»ÖÖ¸Ä½øËã·¨£¬ÓÉMatthew D.ZeilerÌá³ö¡£¾¡¹ÜRMSPropËã·¨½â¾öÁËAdaGradËã·¨´æÔÚµÄÑ§Ï°ÂÊË¥¼õµÄÎÊÌâ£¬µ«ÊÇÔ­Ê¼Ñ§Ï°ÂÊÈÔÈ»ÐèÒªÈËÎªÉèÖÃ¡£ AdaDeltaËã·¨Ê¹ÓÃÇ°ºóÁ½´Î²ÎÊý¸üÐÂ²îÖµ¦¤¦ÈµÄÆ½·½Ö¸ÊýË¥¼õÒÆ¶¯Æ½¾ùÀ´´úÌæÔ­Ê¼Ñ§Ï°ÂÊ£¬ÈÔÈ»Ê¹ÓÃÌÝ¶ÈÆ½·½µÄÖ¸ÊýË¥¼õÒÆ¶¯Æ½¾ùÀ´µ÷ÕûÑ§Ï°ÂÊ¡£¶ÔÓÚµÚk´Îµü´ú£¬RMSPropËã·¨¸ù¾ÝÀúÊ·µü´ú²ÎÊý¸üÐÂ²î¦¤¦ÈµÄÆ½·½ÇóÒÆ¶¯Æ½¾ù£¬ÈçÊ½£¨5ª²38£©ËùÊ¾¡£ÆäÖÐ£¬¦¤¦È¦Ó£¨1¡Ü¦Ó¡Ük£­1£©ÊÇÇ°k£­1´Îµü´úµÄ¸üÐÂ²î£¬¦¤X2k£­1ÎªÇ°k£­1´Îµü´úµÄ²ÎÊý²îÆ½·½µÄÒÆ¶¯Æ½¾ù£¬¦Â1ÎªË¥¼õÂÊ¡£Ê¹ÓÃÇ°k£­1´Îµü´úÇóµÃµÄÁ¿¦¤X2k£­1¿ªÆ½·½×÷ÎªµÚk´Îµü´úµÄÎ´µ÷ÕûÑ§Ï°ÂÊ¡£È»ºó£¬ÓëRMSPropËã·¨µÄ´¦Àí·½Ê½ÏàÍ¬£¬¶Ô³ýÒÔÌÝ¶ÈÆ½·½µÄÖ¸ÊýË¥¼õ½øÐÐµ÷Õû£¬µÃµ½ÍêÕûµÄµÚk´Îµü´úµÄÑ§Ï°ÂÊ£¬¸üÐÂ¹«Ê½ÎªÊ½£¨5ª²39£©£¬´ËÊ±¿ÉÒÔ¼ÆËã³öµÚk´Îµü´úµÄ¸üÐÂ²îÖµ£¬±ã¿ÉÒÔÔÙ´ÎÊ¹ÓÃ¸üÐÂ¹«Ê½£¨5ª²38£©¼ÆËãÏÂÒ»´Îµü´úµÄÑ§Ï°ÂÊÁË¡£¿ÉÒÔ¿´µ½£¬AdaDeltaËã·¨½«RMSPropËã·¨ÖÐ³õÊ¼Ñ§Ï°ÂÊ¦Á¸ÄÎªËæµü´ú²½Öè¶¯Ì¬¼ÆËãµÄ¦¤X2k£­1£¬ÕâÔÚÒ»¶¨³Ì¶ÈÉÏÒÖÖÆÁËÑ§Ï°ÂÊµÄ²¨¶¯¡£

¦¤X2k£­1=¦Â1¦¤X2k£­2+1£­¦Â1¦¤¦Èk£­1¡Ñ¦¤¦Èk£­1£¨5ª²38£©

¦¤¦Èk=£­¦¤X2k£­1+¦ÅGk+¦Ågk(5ª²39)

AdaDeltaËã·¨ÔÚÑµÁ·µÄ³õÆÚºÍÖÐÆÚ¾ßÓÐ²»´íµÄ¼ÓËÙÐ§¹û£¬µ«µ½ÑµÁ·ºóÆÚ£¬¿ÉÄÜ»áÏÝÈë¾Ö²¿¼«Ð¡Öµ£¬ÔÚ¾Ö²¿½ÏÐ¡Öµ¸½½ü¶¶¶¯¡£´ËÊ±£¬Èô»»×÷´ø¶¯Á¿µÄËæ»úÌÝ¶ÈÏÂ½µËã·¨²¢½«Ñ§Ï°ÂÊ½µµÍÒ»¸öÁ¿¼¶£¬»áÔÚÑéÖ¤¼¯ÉÏ»ñµÃ2%~5%ÕýÈ·ÂÊµÄÌáÉý¡£
5.2.5AdamËã·¨
×ÔÊÊÓ¦¶¯Á¿¹À¼Æ£¨Adaptive Moment Estimation£¬Adam£©ÊÇÓÉKingma D.P.ºÍBa J.Ìá³öµÄÁíÍâÒ»ÖÖ×ÔÊÊÓ¦Ñ§Ï°ÂÊËã·¨£¬ËüÈÚºÏÁË¶¯Á¿·¨ºÍRMSPropËã·¨µÄÓÅÊÆ£¬¼ÈÊ¹ÓÃ¶¯Á¿·¨ÖÐÌÝ¶ÈµÄÒÆ¶¯Æ½¾ù´úÌæ¸ºÌÝ¶È·½Ïò×÷Îª²ÎÊý¸üÐÂ·½Ïò£¬Í¬Ê±¶Ô²»Í¬µÄ²ÎÊý½øÐÐ×ÔÊÊÓ¦µ÷ÕûÑ§Ï°ÂÊ¡£Ê×ÏÈ£¬Óë¶¯Á¿·¨ÏàÍ¬£¬AdamËã·¨¼ÆËãÌÝ¶ÈµÄÖ¸ÊýË¥¼õÒÆ¶¯Æ½¾ù×÷ÎªÐÂµÄ¸üÐÂ·½Ïò£¬ÈçÊ½£¨5ª²40£©ËùÊ¾¡£È»ºó£¬ÓëRMSPropËã·¨ÏàÍ¬£¬¼ÆËãÌÝ¶ÈÆ½·½µÄÖ¸ÊýË¥¼õÒÆ¶¯Æ½¾ùÀ´µ÷ÕûÑ§Ï°ÂÊ£¬ÈçÊ½£¨5ª²41£©ËùÊ¾£¬ÆäÖÐ¦Â1ºÍ¦Â2ÊÇÁ½¸öÒÆ¶¯Æ½¾ùµÄË¥¼õÏµÊý£¬Ò»°ã¦Â1ÉèÎª0.9£¬¦Â2ÉèÎª0.99¡£Ê½£¨5ª²40£©ºÍÊ½£¨5ª²41£©¿ÉÒÔ¿´×÷ÊÇ¶ÔÌÝ¶ÈÒ»½×¾ØºÍ¶þ½×¾ØµÄ¹À¼Æ¡£AdamËã·¨²»ÊÇ¶¯Á¿·¨ºÍRMSPropËã·¨µÄ¼òµ¥×éºÏ£¬»¹°üÀ¨Æ«ÖÃÐÞÕý£¬ÓÃÀ´ÐÞÕý´ÓÔ­µã³õÊ¼»¯µÄÒ»½×¾Ø£¨¾ùÖµ£©ºÍ·ÇÖÐÐÄ¶þ½×¾Ø£¨·½²î£©µÄ¹À¼Æ¡£ÒòÎªÈç¹û½«M0ºÍG0¶¼ÉèÖÃÎª0£¬ÄÇÃ´ÔÚµü´ú³õÆÚ£¬MkºÍGkµÄÖµ»á±ÈÕæÊµµÄ¾ùÖµºÍ·½²îÒªÐ¡£¬ÌØ±ðÊÇµ±¦Â1ºÍ¦Â2¶¼½Ó½üÓÚ1Ê±£¬Æ«²î»áºÜ´ó£¬Òò´ËÐèÒª¶ÔÆ«²î½øÐÐÐÞÕý£¬ÐÞÕý¹«Ê½ÈçÊ½£¨5ª²42£©ºÍÊ½£¨5ª²43£©ËùÊ¾¡£¸üÐÂÒ»½×¾Ø¹À¼ÆºÍ¶þ½×¾Ø¹À¼ÆÖ®ºó£¬¹¹ÔìÎÞÆ«¹À¼Æ£¬ÐÞÕýÖ®ºóµÄAdamËã·¨²ÎÊý¸üÐÂ¹«Ê½ÈçÊ½£¨5ª²44£©ËùÊ¾¡£Í¬ÑùµØ£¬³õÊ¼Ñ§Ï°ÂÊ¿ÉÒÔÉèÖÃÎª0.001£¬ÔÚµü´ú¹ý³ÌÖÐÒ²¿ÉÒÔ¸ù¾ÝÇé¿ö½øÐÐÑ§Ï°ÂÊË¥¼õ¡£AdamËã·¨ÊÇÒ»ÖÖ·Ç³£ºÃµÄÓÅ»¯·½·¨£¬²»Í¬µÄÎÊÌâÊ¹ÓÃAdamËã·¨¶¼ÄÜµÃµ½±È½Ï²»´íµÄ½á¹û¡£

Mk=¦Â1Mk£­1+1£­¦Â1gk£¨5ª²40£©

Gk=¦Â2Gk£­1+1£­¦Â2gk¡Ñgk£¨5ª²41£©

M^k=Mk1£­¦Âk1£¨5ª²42£©

G^k=Gk1£­¦Âk2£¨5ª²43£©

¦¤¦Èk=£­¦ÁG^k+¦ÅM^k(5ª²44)

5.2.6¼¸ÖÖ³£¼ûÓÅ»¯Ëã·¨µÄ±È½Ï

±¾ÕÂ½éÉÜÁË¶àÖÖÊÊÓÃÓÚÉî²ãÉñ¾­ÍøÂçµÄÓÅ»¯Ëã·¨£¬±¾½Ú¶Ô²»Í¬µÄÓÅ»¯Ëã·¨½øÐÐ±È½Ï£¬°ïÖú¶ÁÕßÔÚÊµ¼ùÖÐ¸ù¾ÝÐèÒªÑ¡ÔñºÏÊÊµÄÓÅ»¯Ëã·¨¡£ÓÅ»¯Ëã·¨ÊÇÍ¨¹ýµü´úµÄ·½·¨Ñ°ÕÒÄ¿±êº¯ÊýµÄ×îÓÅ½â£¬Ã¿´Îµü´úÄ¿±êº¯ÊýÖµ²»¶Ï±äÐ¡£¬²»¶Ï±Æ½ü×îÓÅ½â£¬Òò´ËÓÅ»¯ÎÊÌâµÄÖØµãÔÚÓÚÈçºÎ½øÐÐµü´ú£¬¼´µü´ú¹«Ê½ÈçºÎÑ¡Ôñ¡£
½«Ä¿±êº¯Êý½øÐÐÒ»½×Ì©ÀÕ¹«Ê½µÄ½üËÆ£¬Í¨¹ýÊýÑ§·ÖÎö¿ÉÖª²ÎÊý¸üÐÂ·½ÏòÎª¸ºÌÝ¶È·½ÏòÊ±ÏÂ½µËÙ¶È×î¿ì£¬Òò´ËÌÝ¶ÈÏÂ½µ·¨Ò²±»³ÆÎª×îËÙÏÂ½µ·¨¡£È·¶¨¸üÐÂ·½Ïòºó£¬²½³¤µÄÑ¡ÔñÓÐ¶àÖÖ·½Ê½£¬¿ÉÒÔÈËÎªÑ¡¶¨Ò²¿ÉÒÔÔÚÑ¡ÔñµÄ·½ÏòÖ´ÐÐÏßËÑË÷Ñ°ÕÒ×îÓÅ²½³¤¡£¶ÔÓÚÌÝ¶ÈÏÂ½µ·¨£¬Ã¿´Îµü´úÇóÌÝ¶ÈÐèÒª±éÀúÕû¸öÑµÁ·¼¯£¬´Ó¶øµ¼ÖÂ¾Þ´óµÄ¼ÆËãÁ¿ºÍ´æ´¢´ú¼Û£¬Ìá³öÁËÌÝ¶ÈÏÂ½µ·¨µÄ¸Ä½ø·½·¨ÅúÁ¿ÌÝ¶ÈÏÂ½µ·¨ºÍËæ»úÌÝ¶ÈÏÂ½µ·¨£¬·Ö±ð²ÉÓÃÐ¡ÅúÁ¿ºÍµ¥¶ÀµÄÑù±¾½øÐÐÌÝ¶È¹À¼Æ£¬´Ó¶ø½µµÍÁË¼ÆËãÁ¿¡£Õë¶ÔÌÝ¶ÈÏÂ½µ·¨¼°Æä¸Ä½ø·½·¨´æÔÚµÄÈ±ÏÝ£¬Ìá³ö¸ü¶àµÄ¸Ä½øÓÅ»¯Ëã·¨¡£ÕâÐ©Ëã·¨Ö÷Òª´ÓÁ½¸ö·½Ãæ¶ÔÔ­Ê¼Ëæ»úÌÝ¶ÈÏÂ½µËã·¨½øÐÐ¸Ä½ø£¬ÆäÖÐÒ»´óÀàÓÅ»¯Ëã·¨Ö¼ÔÚµ÷Õû²ÎÊý¸üÐÂ·½Ïò£¬ÓÅ»¯ÑµÁ·ËÙ¶È£» ¶øÁíÒ»´óÀàËã·¨Ö¼ÔÚµ÷ÕûÑ§Ï°ÂÊ£¬¼´¶Ô²½³¤½øÐÐ¸Ä½ø£¬Ê¹µÃÓÅ»¯¸ü¼ÓÎÈ¶¨¡£
Í¬ÑùÒ²¿ÉÒÔÊ¹ÓÃ¶þ½×ÓÅ»¯·½·¨£¬ÓëÒ»½×ÓÅ»¯·½·¨Ïà±È£¬¶þ½×ÓÅ»¯·½·¨Ê¹ÓÃ¶þ½×µ¼Êý¡£×î¹ã·ºÊ¹ÓÃµÄ¶þ½×ÓÅ»¯·½·¨ÊÇÅ£¶Ù·¨¡£Å£¶Ù·¨Ã»ÓÐÑ§Ï°ÂÊÕâ¸ö³¬²ÎÊý£¬ÊÕÁ²ËÙ¶ÈÒ²¸ü¿ì£¬µ«ÔÚÉî²ãÉñ¾­ÍøÂçÖÐ£¬°ÙÍò¼¶µÄ²ÎÊýÁ¿Ê¹µÃHessian¾ØÕóµÄÄæ¾ØÕóÇó½âÀ§ÄÑ£¬Hessian¾ØÕóµÄÄæ¾ØÕóµÄ´æ´¢Ò²ÊÇÒ»¸öÎÊÌâ¡£Òò´Ë£¬Í¨¹ý¹¹Ôì½üËÆ¾ØÕó´úÌæHessianÄæ¾ØÕóµÄÄâÅ£¶Ù·¨±»Ìá³ö£¬±¾ÕÂ½éÉÜÁËÆäÖÐÁ½ÖÖËã·¨£º DFPËã·¨ºÍBFGSËã·¨£¬ÒÔ¼°ÄÜ¹»½µµÍBFGS´æ´¢´ú¼ÛµÄLª²BFGSËã·¨¡£ËäÈ»Lª²BFGSËã·¨ÄÜ¹»
½â¾ö´æ´¢¿Õ¼äµÄÎÊÌâ£¬ËüµÄÒ»¸ö¾Þ´óÁÓÊÆÊÇÐèÒª¶ÔÕû¸öÑµÁ·¼¯½øÐÐ¼ÆËã£¬¶øÕû¸öÑµÁ·¼¯Ò»°ã°üº¬¼¸°ÙÍò¸öÑù±¾¡£ºÍÐ¡ÅúÁ¿ÌÝ¶ÈÏÂ½µ·¨²»Í¬£¬ÔÚÐ¡ÅúÁ¿ÉÏÓ¦ÓÃLª²BFGSËã·¨ÐèÒªÒ»¶¨µÄ¼¼ÇÉ£¬ÕâÒ²ÊÇÑÐ¾¿ÈÈµã¡£Êµ¼ùÖÐ£¬Éî²ãÉñ¾­ÍøÂç²¢²»³£ÓÃÀýÈçLª²BFGSËã·¨ÕâÖÖ¶þ½×·½·¨£¬·´¶øÊÇ»ùÓÚ¶¯Á¿¸üÐÂµÄÌÝ¶ÈÏÂ½µËã·¨¸ü¼Ó³£ÓÃ£¬ÒòÎªËüÃÇ¸ü¼Ó¼òµ¥²¢ÇÒÈÝÒ×À©Õ¹¡£
ÁíÍâ£¬»¹ÓÐÒ»ÖÖÌØÊâµÄÓÅ»¯·½·¨¡ª¡ª¹²éîÌÝ¶È·¨£¬Ëü½éÓÚÌÝ¶ÈÏÂ½µ·¨ºÍÅ£¶Ù·¨Ö®¼ä£¬½öÀûÓÃÒ»½×µ¼ÊýÐÅÏ¢£¬ÊÕÁ²ËÙ¶È±ÈÌÝ¶ÈÏÂ½µ·¨¿ì£¬Í¬Ê±²»ÐèÒª´æ´¢ºÍ¼ÆËãHessian¾ØÕóµÄÄæ¾ØÕó£¬Ò²²»ÐèÒªÈÎºÎÍâ²¿²ÎÊý¡£ÆäÌØµãÊÇ£¬Ò»ÏµÁÐËÑË÷·½ÏòÊÇ¹²éîµÄ¡£
Êµ¼ÊÓ¦ÓÃÖÐ£¬AdamËã·¨ÔÚºÜ¶àÇé¿öÏÂ¶¼ÊÇÒ»¸ö±È½ÏºÃµÄÑ¡Ôñ£¬Èç¹ûÄÜ¹»½øÐÐÕû¸öÑµÁ·¼¯µÄ¸üÐÂ£¬²¢ÇÒÒª½â¾öµÄÎÊÌâÃ»ÓÐÌ«´óµÄËæ»úÐÔ£¬ÄÇÃ´Lª²BFGSËã·¨Ò²ÊÇÒ»¸öºÜºÃµÄÑ¡Ôñ¡£´ø¶¯Á¿µÄËæ»úÌÝ¶ÈÏÂ½µËã·¨¡¢RMSPropËã·¨ºÍAdamËã·¨¶¼ÊÇÊ¹ÓÃ¶È±È½Ï¸ßµÄÓÅ»¯Ëã·¨£¬¶ÁÕß¿ÉÒÔ¸ù¾Ý×Ô¼º¶ÔËã·¨µÄÊìÏ¤³Ì¶È½øÐÐÑ¡Ôñ¡£
5.3²ÎÊý³õÊ¼»¯
±¾½Ú½éÉÜ³£¼ûµÄ¼¸ÖÖ²ÎÊý³õÊ¼»¯·½·¨£¬°üÀ¨Ëæ»ú³õÊ¼»¯¡¢Xavier³õÊ¼»¯¡¢He³õÊ¼»¯µÈ¡£ÁíÍâ£¬»¹»á½éÉÜÖð²ã½øÐÐÅúÁ¿¹éÒ»»¯²Ù×÷²¢Ê¹ÓÃÐ¡Ëæ»úÊý½øÐÐ³õÊ¼»¯µÄ·½·¨¡£×îºó£¬½éÉÜÉñ¾­ÍøÂçµÄÒ»ÖÖÓÐÐ§ÑµÁ··½Ê½¡ª¡ªÔ¤ÑµÁ·¡£
5.3.1ºÏÀí³õÊ¼»¯µÄÖØÒªÐÔ
ÓÉÓÚÉî²ãÉñ¾­ÍøÂçµÄ¸´ÔÓÐÔ£¬ÆäÓÅ»¯ÎÊÌâ²»¾ßÓÐ½âÎö½â£¬Ö»ÄÜÍ¨¹ýµü´úÓÅ»¯µÄ·½Ê½ÔÚÓÐÏÞÊ±¼äÄÚÊÕÁ²µ½Ò»¸ö¿ÉÒÔ½ÓÊÜµÄ½â¡£µü´úÓÅ»¯Ëã·¨ÐèÒªÓÐÒ»¸ö³õÊ¼µã£¬¶øÑµÁ·½á¹ûµÄºÃ»µºÜ´ó³Ì¶ÈÉÏÊÜÑ¡ÔñµÄ³õÊ¼µãµÄÓ°Ïì£¬Òò´Ë£¬¶ÔÓÚ³õÊ¼µãµÄÑ¡Ôñ±ØÐë½÷É÷¡£³õÊ¼µã²»½ö¾ö¶¨Ëã·¨ÊÇ·ñÊÕÁ²£¬Ò²ÄÜ¾ö¶¨ÊÕÁ²ËÙ¶ÈµÄ¿ìÂýÒÔ¼°ÊÕÁ²µãµÄËðÊ§´óÐ¡¡£¼´Ê¹ÊÕÁ²µãµÄËðÊ§Ïà²î²»´ó£¬¶ÔÓÚÑµÁ·¼¯ÒÔÍâµÄÊý¾Ýµã£¬·º»¯Îó²îÒ²¿ÉÄÜ²»Í¬£¬Òò´Ë³õÊ¼µãÒ²ÄÜÓ°Ïì·º»¯ÐÔÄÜ¡£ÓÉÓÚµü´úÓÅ»¯ÊÇÒ»ÖÖ¾Ö²¿ÓÅ»¯·½Ê½£¬Ö»ÄÜÀûÓÃ¾Ö²¿ÐÅÏ¢¶ø²»¾ßÓÐÈ«¾Ö¸ÅÄî£¬Òò´ËÆäÐÔÄÜ×ÜÊÇÊÜ³õÊ¼µãµÄÓ°Ïì¡£ÈçÍ¼5ª²8ËùÊ¾µÄ¶þÎ¬º¯Êý£¬Èç¹ûÑ¡Ôñ³õÊ¼µãÎªw0²¢ÔÚ´Ë´¦ÔËÐÐÌÝ¶ÈÏÂ½µËã·¨£¬Ëã·¨×îÖÕ»áÊÕÁ²µ½w1Õâ¸ö¾Ö²¿¼«Ð¡Öµ´¦£¬


Í¼5ª²8²»ºÏÊÊµÄ³õÊ¼ÖµÊ¹µÃËðÊ§º¯Êý

ÏÝÈë¾Ö²¿¼«Ð¡Öµ

¶ø²»ÊÇÕæÕýµÄ×îÓÅ½âwª³£¬ÕâÖÖÇé¿öÏÂËã·¨ÓÀÔ¶ÕÒ²»µ½×îÓÅ½â¡£ºÃµÄ³õÊ¼»¯²ßÂÔÓ¦¸ÃÊÇÔõÑùµÄÄØ£¿±¾½Ú½«½éÉÜ¼¸ÖÖÊµ¼ùÖÐ±íÏÖ½ÏºÃµÄ³õÊ¼»¯²ßÂÔ£¬ÀýÈçËæ»ú³õÊ¼»¯Xavier³õÊ¼»¯¡¢He³õÊ¼»¯ÒÔ¼°ÅúÁ¿¹éÒ»»¯ºÍÐ¡Ëæ»úÊý³õÊ¼»¯¡£±¾½Ú½éÉÜµÄ·½·¨Ö÷ÒªÊÇÕë¶ÔÈ¨ÖØ¾ØÕóWµÄ³õÊ¼»¯£¬¶ÔÓÚÆ«ÖÃ£¬Ò»°ãÇé¿öÖ±½Ó½«Æä³õÊ¼»¯Îª0¡£Ò²ÓÐ²¿·ÖÑÐ¾¿ÈËÔ±ÔÚÊ¹ÓÃReLUº¯Êý×÷Îª¼¤»îº¯ÊýÊ±£¬½«Æ«ÖÃ³õÊ¼»¯ÎªÀàËÆ0.01ÕâÑùµÄÐ¡ÊýÖµ£¬Ä¿µÄÊÇÊ¹ËùÓÐµÄReLUµ¥ÔªÔÚÒ»¿ªÊ¼Ê±¾ÍÄÜ±»¼¤»î²¢½øÐÐÌÝ¶È´«µÝ£¬µ«½«Æ«ÖÃ³õÊ¼»¯Îª0µÄÇé¿ö¸üÎª³£¼û¡£
5.3.2Ëæ»ú³õÊ¼»¯
Ä¿Ç°£¬¶ÔÓÚ²ÎÊý³õÊ¼»¯µÄÃ÷È·Ö¸µ¼ÊÇÐèÒª´òÆÆ²»Í¬µ¥ÔªÖ®¼äµÄ¶Ô³ÆÐÔ¡£ÔÚÉñ¾­ÍøÂçµÄÑµÁ·ÖÐ£¬Ò»°ãÏ£ÍûÊý¾ÝºÍ²ÎÊýµÄ¾ùÖµ¶¼Îª0¡£Êý¾Ý¾­¹ýºÏÊÊµÄ¹éÒ»»¯´¦Àí£¬ÄÜ¹»±£Ö¤²ÎÊý³õÊ¼»¯µÄ¾ùÖµÒ²Îª0£¬Õý¸º²ÎÊýµÄÊýÁ¿´óÖÂÏàµÈ¡£Ò»¸öËÆºõºÏÀíµÄÏë·¨ÊÇ°ÑËùÓÐµÄ²ÎÊý¶¼³õÊ¼»¯Îª0¡£¶ÔÓÚÈçÍ¼5ª²9ËùÊ¾µÄ±ê×¼µÄË«²ãÉñ¾­ÍøÂç£¬Ã¿Ò»ÌõÊµÏß´ú±í²»Í¬µ¥ÔªÖ®¼äµÄÁ¬½ÓÈ¨ÖØ£¬½«ÕâÐ©²»Í¬µÄÁ¬½ÓÈ¨ÖØÈ«¶¼ÉèÖÃÎª0£¬È»ºóÔËÐÐÌÝ¶ÈÏÂ½µËã·¨£¬»á·¢ÉúÊ²Ã´ÄØ£¿ËùÓÐÉñ¾­Ôª½«»áÖ´ÐÐÏàÍ¬µÄ²Ù×÷£¬ÓÉÓÚ³õÊ¼È¨ÖØ¶¼Îª0£¬¸ø¶¨ÈÎÒâÊäÈë£¬Ã¿¸öÒþ²Ø²ãÉñ¾­Ôª¶¼»á¶ÔÊäÈëÊý¾Ý×öÏàÍ¬µÄÔËËã£¬µÃµ½ÏàÍ¬µÄ¼¤»îÖµ£¬²¢ÇÒÊä³ö²ãµ¥ÔªÒ²»áÊä³öÏàÍ¬µÄ½á¹û¡£ÕâÀï¼ÙÉèÒþ²Ø²ãÄÚµÄÉñ¾­ÔªÀàÐÍÏàÍ¬£¬Êä³ö²ãÉñ¾­ÔªÀàÐÍÏàÍ¬¡£Í¬ÑùµØ£¬ÔÚÔËÐÐ·´Ïò´«²¥Ê±£¬Ò²»áµÃµ½ÏàÍ¬µÄÌÝ¶È£¬È»ºóÊ¹ÓÃÏàÍ¬µÄ·½Ê½½øÐÐ¸üÐÂ£¬×îÖÕ»áµÃµ½ÍêÈ«ÏàÍ¬µÄÉñ¾­Ôª£¬Õâ½«µ¼ÖÂÉñ¾­ÔªÖ®¼äÃ»ÓÐ¿ÉÇø·ÖÐÔ£¬¶øÊµ¼ÊÉÏÎÒÃÇÆÚÍû²»Í¬µÄÉñ¾­ÔªÑ§Ï°²»Í¬µÄÖªÊ¶¡£


Í¼5ª²9Ë«²ãÉñ¾­ÍøÂçÊ¾ÒâÍ¼


ÎªÁË´òÆÆ²ÎÊýÖ®¼äµÄ¶Ô³ÆÐÔ£¬²»ÄÜÊ¹ÓÃÈ«0»òÕßÆäËûÏàÍ¬µÄÊýÖµÈ¥³õÊ¼»¯ËùÓÐ²ÎÊý¡£Ò»ÖÖ±È½ÏºÃµÄ·½Ê½ÊÇ¶ÔÃ¿¸ö²ÎÊý½øÐÐËæ»ú³õÊ¼»¯£¬Ê¹µÃ²»Í¬Éñ¾­ÔªÖ®¼äµÄÇø·ÖÐÔ¸üºÃ¡£Òò´Ë£¬¸üÎªºÏÀíµÄÒ»ÖÖ·½Ê½ÊÇ²ÉÓÃÐ¡Ëæ»úÊý½øÐÐ³õÊ¼»¯£¬½«²ÎÊý³õÊ¼»¯ÎªËæ»úÇÒ²»ÏàµÈµÄÐ¡ÊýÖµ£¬Éñ¾­ÍøÂçÖÐµÄ²»Í¬Éñ¾­Ôª¾Í¿ÉÒÔµÃµ½²»Í¬µÄ¸üÐÂ£¬¿ÉÒÔÑ§µ½Êý¾ÝÖÐ²»Ò»ÑùµÄÖªÊ¶¡£ÆäÊµÏÖ·½Ê½ÊÇ´ÓÒ»¸ö¸ÅÂÊ·Ö²¼ÖÐ³éÑù¡£ÀýÈç£¬»ùÓÚÒ»¸öÁã¾ùÖµµÄ¸ßË¹·Ö²¼Éú³ÉËæ»úÊý£¬Ê¹ÓÃ¸Ã·Ö²¼ÖÐËæ»ú³éÑùÖµ¶ÔÈ¨ÖØ½øÐÐ³õÊ¼»¯£¬Ò²¿ÉÒÔÊ¹ÓÃ¾ùÔÈ·Ö²¼Éú³ÉËæ»úÊý¡£Êµ¼ùÖ¤Ã÷£¬²ÉÓÃÄÄÖÖ·½·¨Éú³ÉËæ»úÊý¶ÔËã·¨µÄ½á¹ûÓ°Ïì²»´ó¡£µ«ÊÇ£¬²¢²»ÊÇ²ÉÓÃÐ¡Ëæ»úÊý½øÐÐ³õÊ¼»¯¾ÍÔ²ÂúË³Àû£¬²¢²»Ò»¶¨»áµÃµ½ºÃµÄ½á¹û¡£½«Éú³ÉËæ»úÊýµÄ¸ßË¹·Ö²¼µÄ·½²îÉèÖÃÎª0.01£¬Ê¹ÓÃtanh¼¤»îº¯Êý´´½¨Ò»¸ö10²ãÉñ¾­ÍøÂç£¬²¢½øÐÐ³õÊ¼»¯£¬Ê¹µÃÃ¿²ã²ÎÊý¶¼·þ´Ó¸ßË¹·Ö²¼¡£Í¼5ª²10¸ø³öÁËÃ¿Ò»²ãÊýÊä³öÖµµÄ·Ö²¼Ö±·½Í¼£¬¸ÃÍ¼Í³¼ÆÁËÃ¿Ò»²ãÊä³öÖµµÄ·Ö²¼Çé¿ö¡£¿ÉÒÔ¿´µ½£¬µÚÒ»²ãÊä³öÖµµÄ·Ö²¼½üËÆ¸ßË¹·Ö²¼£¬µÚ¶þ²ãÊä³ö·Ö²¼ÀàËÆ¸ßË¹·Ö²¼µ«Æä·½²î¿ìËÙ±äÐ¡£¬µÚ3²ã¼°ÒÔºó¼¸²ã£¬¼¸ºõËùÓÐµÄÊä³öÖµ¶¼ÔÚÁãÖµ¸½½ü¡£·ÖÎöÉñ¾­ÍøÂçµÄÇ°Ïò´«²¥¹ý³Ì¿ÉÒÔ½âÊÍÕâÖÖÏÖÏó¡£¶ÔÓÚÃ¿Ò»²ã£¬ÆäÊäÈëxÓëW½øÐÐµã»ý£¬È»ºóÍ¨¹ý·ÇÏßÐÔ¼¤»îº¯ÊýµÃµ½¼¤»îÖµ£¬¼´±¾²ãµÄÊä³öÖµ¡£ÒòÎªÕâÀïÊ¹ÓÃµÄ¼¤»îº¯ÊýtanhÊÇÒÔ0ÎªÖÐÐÄµÄ£¬ËùÒÔ¿ÉÒÔ½âÊÍÎªÊ²Ã´Ã¿²ãÊä³öÖµÊÇÁãÖÐÐÄ·Ö²¼µÄ¡£ÓÉÓÚÃ¿²ãÈ¨ÖØ¶¼ÊÇÊ¹ÓÃÐ¡Ëæ»úÊý½øÐÐ³õÊ¼»¯µÄ£¬³ËÒÔÒ»¸öÐ¡Ëæ»úÊýWºó£¬Êä³öÖµ»áËæ×Å¶à´Î³Ë·¨ÔËËãºóÑ¸ËÙ¼õÐ¡£¬×îÖÕ¾­¹ý¶à²ãÇ°Ïò´«²¥ºó£¬Êä³öÖµ½«»á±ä³ÉÒ»×é½Ó½üÓÚ0µÄÊý£¬ÐÅºÅÔÚÇ°Ïò´«µÝµÄ¹ý³ÌÖÐÖð½¥ÏûÊ§¡£ÏÖÔÚ¿¼ÂÇ·´Ïò´«²¥£¬Ê¹ÓÃ·´Ïò´«²¥¼ÆËãÌÝ¶ÈÊ±£¬¸ù¾ÝÁ´Ê½·¨Ôò£¬ÎªÁËµÃµ½¹ØÓÚÈ¨ÖØµÄÌÝ¶È£¬ÐèÒªÉÏÓÎ»Ø´«µÄÌÝ¶È³ËÒÔ¾Ö²¿ÌÝ¶È¡£Ã¿Ò»²ãÈ¨ÖØ¶¼ÊÇÓë±¾²ãÊäÈë½øÐÐµã»ý£¬ÔÙËÍÈë¼¤»îº¯ÊýµÄ¡£Òò´Ë£¬¹ØÓÚ±¾²ãÈ¨ÖØµÄ¾Ö²¿ÌÝ¶ÈÒ²ÊÇ±¾²ãµÄÊäÈë£¨¼´ÉÏÒ»²ãµÄÊä³ö£©£¬ÓÉÓÚÕâÐ©ÊäÈëÖµºÜÐ¡£¬Æä¹ØÓÚÈ¨ÖØµÄÌÝ¶ÈÒ²·Ç³£Ð¡£¬Ê¹µÃÕâÐ©È¨ÖØ»ù±¾µÃ²»µ½¸üÐÂ»òÕß¸üÐÂ»ºÂý¡£ÀàËÆÓÚÕýÏò´«²¥ÖÐÊä³öÖµÇ÷ÏòÓÚ0£¬·´Ïò´«²¥ÖÐ´ÓÉÏÓÎ»Ø´«µÄÌÝ¶ÈÒ²»áÔ½À´Ô½½Ó½üÓÚ0¡£Òò´Ë£¬Ð¡Ëæ»úÊý³õÊ¼»¯ÔÚ½á¹¹½ÏÉîµÄÍøÂçÖÐ¿ÉÄÜ»á³öÏÖÎÊÌâ¡£


Í¼5ª²10Ê¹ÓÃÐ¡Ëæ»úÊý³õÊ¼»¯µÄÉñ¾­ÍøÂçÊä³öÖµÖð²ã·Ö²¼Ö±·½Í¼Í¼Æ¬À´×Ô£º ÏÄ·É.ÁÄÒ»ÁÄÉî¶ÈÑ§Ï°µÄweight initialization.£ÛZ/OL£Ý.https://zhuanlan.zhihu.com/p/25110150https://zhuanlan.zhihu.com/p/25110150.



Èç¹û½«³õÊ¼Öµµ÷´ó£¬Ê¹µÃÉú³ÉËæ»úÊýµÄ¸ßË¹·Ö²¼·½²î±äÎª1£¨¾ùÖµÈÔ±£³ÖÎª0£©£¬ÔÙ´ÎÍ³¼ÆÃ¿²ãÊä³öÖµµÄ·Ö²¼£¬ÈçÍ¼5ª²11ËùÊ¾¡£¿ÉÒÔ¿´µ½£¬¼¸ºõËùÓÐ²ãµÄÊä³öÖµ¶¼¼¯ÖÐÔÚ+1ºÍ-1¸½½ü¡£²»ÄÑ½âÊÍ£¬ÕâÖÖÇé¿öÊÇÒòÎª¼¤»îº¯ÊýµÄÊäÈë¹ý´ó£¬ÂäÔÚtanh¼¤»îº¯ÊýµÄ·ÇÏßÐÔÇøÓò£¬µ¼ÖÂÉñ¾­ÔªµÄ±¥ºÍ¡£·ÖÎöÇ°Ïò´«²¥¹ý³Ì£¬ÓÉÓÚÃ¿Ò»²ã¶¼³ËÒÔÒ»¸ö±È½Ï´óµÄÈ¨ÖØW£¬»áµ¼ÖÂ¼¤»îº¯ÊýµÄÊäÈëÔ½À´Ô½´ó£¬µ¼ÖÂËùÓÐµÄÉñ¾­Ôª¶¼·¢Éú±¥ºÍ£¬¶øÉñ¾­Ôª±¥ºÍÔò»áµ¼ÖÂ·´Ïò´«²¥ÌÝ¶ÈÎª0£¬ÒòÎªËùÓÐ²ÎÊý¶¼µÃ²»µ½¸üÐÂ¡£ÓÉ´Ë¿ÉÒÔ¿´µ½£¬Ê¹ÓÃ´óÖµËæ»úÊý½øÐÐ³õÊ¼»¯ÈÔÈ»´æÔÚºÜ¶àÎÊÌâ£¬³õÊ¼»¯²ÎÊý¹ý´ó»òÕß¹ýÐ¡¶¼»á²úÉúÏàÓ¦ÎÊÌâ¡£


Í¼5ª²11Ê¹ÓÃ´óÖµËæ»úÊý³õÊ¼»¯µÄÉñ¾­ÍøÂçÊä³öÖµÖð²ã·Ö²¼Ö±·½Í¼¢Ù


5.3.3Xavier³õÊ¼»¯
Ò»Ð©ÑÐ¾¿±íÃ÷£¬²ÎÊý³õÊ¼»¯µÄÒ»¸ö½ÏºÃµÄ·½Ê½ÊÇXavier³õÊ¼»¯£¬ÕâÊÇXavier GortonµÈ×÷ÕßÔÚ2010Äê·¢±íµÄÂÛÎÄÖÐÌá³öµÄ¡£ÆäºËÐÄË¼ÏëÊÇÒªÇóÊäÈëµÄ·½²îµÈÓÚÊä³öµÄ·½²î£¬ÔÚÂú×ãÕâÒ»Ìõ¼þµÄÇ°ÌáÏÂ£¬ÍÆµ¼³ö²ÎÊýµÄÖµ²¢½øÐÐ³õÊ¼»¯¡£
¿ÉÒÔÍ¨¹ýÊýÑ§ÍÆµ¼Ö¤Ã÷ÆäºÏÀíÐÔ£¬Ê¹ÓÃÐ¡Ëæ»úÊý½øÐÐ²ÎÊý³õÊ¼»¯Ê±£¬ÍøÂçÊä³öÊý¾Ý·Ö²¼µÄ·½²î»áËæ×ÅÊäÈëÉñ¾­Ôª¸öÊý¶ø¸Ä±ä£¬¹ØÓÚ×´Ì¬ÌÝ¶ÈµÄ·½²î»áËæ×ÅÊä³öÉñ¾­ÔªµÄ¸öÊý¶ø¸Ä±ä¡£ÈçÍ¼5ª²12ËùÊ¾£¬¶ÔÓÚÉñ¾­ÍøÂçÖÐµÄÈÎÒâÒ»²ã£¬×´Ì¬ÖµzÊÇÊäÈëÓë±¾²ãÈ¨ÖØµÄµã»ý£¬×´Ì¬ÖµÊÇ¼¤»îº¯ÊýµÄÊäÈë£¬¼¤»îÖµhÊÇ¼¤»îº¯ÊýµÄÊä³ö£¬¼´±¾²ãµÄÊä³öÖµ¡£¸ù¾ÝÊý¾ÝÔÚÍøÂçÖÐµÄÇ°Ïò´«²¥¹ý³Ì£¬¿ÉÒÔµÃµ½Ê½£¨5ª²45£©ºÍÊ½£¨5ª²46£©¡£ÆäÖÐ£¬ÉÏ±êlÖ¸´ú²»Í¬²ã£¬nlÎªµÚl²ãÉñ¾­Ôª¸öÊý£¬nl£­1ÎªµÚl-1²ãÉñ¾­Ôª¸öÊý£¬ÏÂ±êiÓÃÓÚÇø·ÖÍ¬Ò»²ãµÄ²»Í¬Éñ¾­Ôª¡£



Í¼5ª²12ÍøÂçÖÐµÚl²ãÄ³Ò»Éñ¾­Ôª


zl=¡Ænl£­1i=1Wlihl£­1i£¨5ª²45£©

hl=fzl£¨5ª²46£©

Ê½£¨5ª²45£©±íÊ¾£¬¶ÔÓÚµÚl²ãµÄÈÎÒâÒ»¸öÉñ¾­Ôª£¬½ÓÊÜÇ°Ò»²ãnl£­1¸öÉñ¾­ÔªµÄÊä³öhl£­1i£¬½øÐÐ¼ÓÈ¨ÇóºÍµÃµ½×´Ì¬Öµzl£¬ÆäÖÐi¡Ê1,nl£­1£» Í¬ÑùµØ£¬·´Ïò´«²¥¿ÉÒÔµÃµ½ÌÝ¶ÈÐÅÏ¢£¬ÎªËðÊ§º¯Êý¹ØÓÚ×´Ì¬zµÄÌÝ¶Èªµyªµz£¬ÁíÒ»×éÎªËðÊ§º¯Êý¹ØÓÚ²ÎÊýWµÄÌÝ¶ÈªµyªµW¡£
¶ÔÓÚµÚl²ãÈÎÒ»Éñ¾­ÔªµÄ¼¤»îÖµÇó·½²î¿ÉµÃ

Varhl=nl£­1VarWlVarhl£­1=Varx¡ÇlL=1nL£­1VarWL£¨5ª²47£©







ÏêÏ¸ÍÆµ¼¹ý³ÌÈçÏÂ£º 

½«Ê½£¨5ª²46£©´úÈëÌæ»»hl£¬¼ÙÉè×´Ì¬ÖµzlÎ»ÓÚ¼¤»îº¯ÊýµÄÏßÐÔÇøÓò£¬´ËÊ±fzl=zl£¬¿ÉµÃ

Varhl=Varfzl=Varzl

=Var¡Ænl£­1i=1Wlihl£­1i

=¡Ænl£­1i=1VarWlihl£­1i

=¡Ænl£­1i=1EWli2Varhl£­1i+Ehl£­1i2VarWli+VarWliVarhl£­1i


¼ÙÉèWºÍhÏà»¥¶ÀÁ¢£¬Ê¹ÓÃ·½²î¹«Ê½½øÐÐÕ¹¿ª£¬ÓÐ

Varhl=¡Ænl£­1i=1VarWliVarhl£­1i

¶ÔÉÏÊ½½øÐÐ¼ò»¯£¬¼ÙÉèÍøÂç²ÎÊýºÍÊý¾Ý¾ùÖµÎª0£¬¼ÙÉèÍ¬²ã²ÎÊýºÍ¼¤»îÖµ¾ù·þ´ÓÍ¬Ò»·Ö²¼£¬¿ÉµÃ

Varhl=nl£­1VarWlVarhl£­1

=Varx¡ÇlL=1nl£­1VarWl


Í¬Àí¿ÉµÃVarhl£­1=nl£­2VarWl£­1Varhl£­2£¬½«ÆäµÝ¹é´úÈëÉÏÊ½£¬Ö±ÖÁÊ½×Ó²»ÄÜ¼ÌÐøÕ¹¿ª¡£ÆäÖÐ£¬VarxÎªÍøÂçÊäÈëµÄ·½²î£¬ÕâÀï¼ÙÉèËùÓÐÊäÈë·þ´ÓÍ¬Ò»·Ö²¼£¬ÇÒzl=¡Ænxi=1Wlixi£¬nxÎªÊäÈë²ÎÊýµÄÊýÁ¿¡£

ÊäÈëÐÅºÅ¾­¹ý±¾²ãÉñ¾­Ôªºó£¬·½²î¶àÁËÒ»¸ö³Ë»ýÒò×Ónl£­1VarWl¡£ÔÚÉî²ãÉñ¾­ÍøÂçÖÐ£¬¾­¹ý¶à²ã´«²¥¾Í»áÀÛ³ËÕâ¸öÒò×Ó¡£¾­¹ýl²ã´«²¥ºó£¬Êä³öµÄ·½²îÓëÊäÈëµÄ±¶ÊýÊÇ¡ÇlL=1nL£­1VarWL£¬Õâ¾ÍÊÇµ¼ÖÂÐ¡Ëæ»úÊý³õÊ¼»¯Ó¦ÓÃÓÚÉî²ãÉñ¾­ÍøÂç³öÏÖÎÊÌâµÄÔ­Òò£¬²ÎÊý·½²î¹ýÐ¡£¬Ê¹µÃÊä³ö·½²îÀÛ»ýÏà³ËÒ»¸öÐ¡ÊýÖµ£¬µ¼ÖÂÊä³öÒ²Ô½À´Ô½Ð¡£¬¶ø²ÎÊý·½²î¹ý´ó¿ÉÄÜÓÖ»áµ¼ÖÂÉñ¾­Ôª±¥ºÍ¡£ÎªÁË±£Ö¤ÊäÈëÐÅºÅ²»±»¹ý·ÖµØ·Å´óºÍËõÐ¡£¬Ò»¸öºÏÀíµÄÏë·¨ÊÇ±£³ÖÃ¿²ãÉñ¾­ÔªµÄÊäÈëºÍÊä³öµÄ·½²î²»±ä£¬ÕâÒ²ÊÇGlorotÌõ¼þÖ®Ò»£¬¼´Áînl£­1VarWlÎª1£¬ÄÇÃ´Ö»ÐèÒª½«²ÎÊý³õÊ¼»¯Îª·½²îÂú×ãÊ½£¨5ª²48£©¼´¿É¡£

VarWl=1nl£­1£¨5ª²48£©

Èç¹û¿¼ÂÇ·´Ïò´«²¥£¬ËðÊ§º¯Êý¹ØÓÚµÚl²ãÈÎÒâÉñ¾­Ôª×´Ì¬ÖµµÄ·½²îÒ²¿ÉÒÔ²ÉÓÃÀàËÆ·½·¨ÍÆµ¼³ö¡£

VarªµLªµzl=nl+1VarWl+1VarªµLªµzl+1£¨5ª²49£©

¿ÉÒÔ¿´µ½£¬Éñ¾­ÍøÂçµÄÈÎÒ»²ãÊý¾ÝÊä³öµÄ·½²îÓëÉÏÒ»²ãÉñ¾­ÔªÊýÁ¿ÓÐ¹Ø£¬¶ø·´Ïò´«²¥µÄ×´Ì¬ÌÝ¶È·½²îÓëºóÒ»²ãÉñ¾­ÔªÊýÁ¿ÓÐ¹Ø¡£Òò´Ë£¬ÎªÁË±£Ö¤ÔÚ·´Ïò´«²¥ÖÐÎó²îÐÅºÅ²»±»¹ý·Ö·Å´óºÍËõÐ¡£¬¸÷²ã¶Ô×´Ì¬ÖµzµÄÌÝ¶È·½²îÒ²Ó¦±£³ÖÒ»ÖÂ£¬¼´nl+1VarWl+1Ó¦Îª1£¬Ò²¼´nlVarWl=1¡£Òò´Ë£¬²ÎÊý·½²îÓ¦Âú×ã

VarWl=1nl£¨5ª²50£©

ÈôÒª±£Ö¤ÐÅºÅÔÚÇ°Ïò´«²¥ºÍ·´Ïò´«²¥ÖÐ¶¼²»±»¹ý·Ö·Å´óºÍËõÐ¡£¬¿ÉÒÔÉèÖÃ²ÎÊý·½²îÎª

VarWl=2nl£­1+nl£¨5ª²51£©

GrolotÌõ¼þÖ»Ç¿µ÷²ÎÊý·½²îÓ¦µ±Âú×ãµÄÌõ¼þ£¬Ö»ÐèÒªÉú³É²ÎÊý·Ö²¼µÄ·½²îÂú×ãÉÏÊ½¼´¿É¡£Òò´Ë£¬Xavier³õÊ¼»¯Êµ¼ÊÉÏÓÐÁ½ÖÖ¾ßÌåµÄÐÎÊ½£¬·Ö±ð¶ÔÓ¦ÓÚ¸ßË¹·Ö²¼µÄ Xavier³õÊ¼»¯ºÍ¾ùÔÈ·Ö²¼µÄXavier³õÊ¼»¯¡£¸ßË¹·Ö²¼µÄ Xavier³õÊ¼»¯¸ü¼òµ¥£¬Ö±½Ó¸ù¾ÝÃ¿²ãÊäÈë²ÎÊýÊýÁ¿¶Ô¸ßË¹·Ö²¼µÄ·½²î½øÐÐËõ·Å¼´¿É¡£Èç¹û¸Ã²ãÊäÈë²ÎÊýÊýÁ¿½ÏÉÙ£¬ÄÇÃ´¾ÍÒª³ýÒ»¸ö½ÏÐ¡µÄÊýÒÔµÃµ½½Ï´óµÄ·½²î£¬Ëæ»ú²ÉÑùµÃµ½µÄ²ÎÊýÖµ¾Í»á½Ï´ó¡£ÕâÊÇ·ûºÏÖ±¹ÛµÄÏë·¨µÄ£¬ÒòÎªÊäÈë²ÎÊýÊýÁ¿ÉÙ£¬Ôò±ØÐëÈÃ²ÎÊý×ã¹»´ó£¬²ÅÄÜ±£Ö¤Êä³öµÄ·½²îÓëÊäÈëÏàÍ¬¡£·´Ö®ÒàÈ»£¬Èç¹ûÊäÈë²ÎÊýÊýÁ¿½Ï´ó£¬¾Í»áµÃµ½½ÏÐ¡µÄ²ÎÊýÊ¹Êä³öÒ²µÃµ½ÏàÍ¬µÄÀ©Õ¹¡£¿¼ÂÇ·´Ïò´«²¥£¬Í¬Ê±Ê¹ÓÃÊäÈë²ÎÊýÊýÁ¿ºÍÊä³öÖµµÄÊýÁ¿¶Ô·½²î½øÐÐµ÷Õû¡£¶ÔÃ¿²ã²ÎÊý¶¼¼ÆËã³öÏàÓ¦µÄ¸ßË¹·Ö²¼µÄ·½²î£¬²¢´Ó·Ö²¼ÖÐËæ»ú²ÉÑù¶Ô²ÎÊý½øÐÐ³õÊ¼»¯¡£Êµ¼ùÖ¤Ã÷£¬Xavier³õÊ¼»¯ÔÚÊ¹ÓÃtanhº¯ÊýºÍsigmoidº¯Êý×ö¼¤»îº¯ÊýµÄÉñ¾­ÍøÂçÖÐ±íÏÖ²»´í¡£ÈçÍ¼5ª²13ËùÊ¾£¬¶ÔÓÚÉÏÎÄÖÐ10²ãÉñ¾­ÍøÂçµÄÀý×Ó£¬½«Ð¡Ëæ»úÊý³õÊ¼»¯Ìæ»»Îª¸ßË¹·Ö²¼µÄ Xavier³õÊ¼»¯£¬µÃµ½µÄ¸÷²ãÊä³öÖµ·Ö²¼Í¼¡£¿ÉÒÔ¿´µ½£¬Xavier³õÊ¼»¯ÓÐÐ§µØ½â¾öÁËËæ»ú³õÊ¼»¯´æÔÚµÄÎÊÌâ£¬Êä³öÖµÔÚ¾­¹ýºÜ¶à²ãÖ®ºóÈÔÈ»±£³ÖÁ¼ºÃµÄ·Ö²¼£¬ÕâÓÐÀûÓÚÉñ¾­ÍøÂçµÄÓÅ»¯¡£
¶ÔÓÚÔÚÇø¼ä£­a,a·þ´Ó¾ùÔÈ·Ö²¼µÄ±äÁ¿£¬Æä·½²îÎªa23£¬Òò´Ë¿ÉÇóµÃÂú×ãGlorotÌõ¼þµÄ¾ùÔÈ·Ö²¼£¬¼´Wl: U£­3nl£­1,3nl£­1£¬¿¼ÂÇ·´Ïò´«²¥ÔòWl: U£­6nl£­1+nl,6nl£­1+nl¡£Êµ¼ùÖÐÊ¹ÓÃÄÄÖÖÐÎÊ½µÄXavier³õÊ¼»¯¶¼ÊÇ¿ÉÒÔµÄ¡£


Í¼5ª²13Ê¹ÓÃXavier³õÊ¼»¯µÄÉñ¾­ÍøÂçÊä³öÖµÖð²ã·Ö²¼Ö±·½Í¼Í¼Æ¬À´×Ô£º ÏÄ·É.ÁÄÒ»ÁÄÉî¶ÈÑ§Ï°µÄweight initialization.£ÛZ/OL£Ý.https://zhuanlan.zhihu.com/p/25110150https://zhuanlan.zhihu.com/p/25110150.


¾¡¹ÜÒÑ¾­Ö¤Ã÷Xavier³õÊ¼»¯ÔÚÊµ¼ùÖÐ±íÏÖÁ¼ºÃ£¬µ«ÓÉÓÚÆäÍÆµ¼¹ý³ÌÊÇ»ùÓÚÏßÐÔ¼¤»îÕâÒ»¼ÙÉè£¬¼´Éñ¾­ÔªÊÇ´¦ÓÚ¼¤»î×´Ì¬µÄ£¬Òò´Ë¶ÔÓÚtanhº¯ÊýºÍsigmoidº¯ÊýÕâÖÖº¬ÓÐÏßÐÔ¼¤»îÇøÓòµÄº¯ÊýÈÔÈ»±íÏÖÁ¼ºÃ£¬Ö»Òª±£Ö¤×´Ì¬ÖµÂäÔÚ¼¤»îº¯ÊýµÄÏßÐÔÇøÓò¼´¿É¡£µ«ÊÇ£¬¶ÔÓÚÊ¹ÓÃReLUº¯Êý¼°ÆäÏµÁÐ±äÌå×÷Îª¼¤»îº¯ÊýµÄÍøÂç£¬Ð§¹û²¢²»ºÃ¡£ÈÔÒÔ10²ãÉñ¾­ÍøÂç¾ÙÀý¡£ÈçÍ¼5ª²14ËùÊ¾£¬½«tanh¼¤»îº¯ÊýÌæ»»ÎªReLU¼¤»îº¯Êý£¬ÒÀ¾ÉÊ¹ÓÃXavier³õÊ¼»¯¡£¿ÉÒÔ¿´µ½£¬¾¡¹ÜÇ°¼¸²ã¿´ÆðÀ´±íÏÖ²»´í£¬µ«ÊÇºóÃæ¼¸²ãµÄÊä³öÔ½À´Ô½½Ó½ü0¡£Òò´Ë£¬¶ÔÓÚReLU¼¤»îº¯Êý£¬¿ÉÊ¹ÓÃÁíÍâÒ»ÖÖ³õÊ¼»¯·½·¨¡ª¡ªHe·½·¨£¬Ëü¿ÉÒÔºÜºÃµØ½â¾öÕâ¸öÎÊÌâ¡£


Í¼5ª²14Ê¹ÓÃXavier³õÊ¼»¯µÄReLUÉñ¾­ÍøÂçÊä³öÖµÖð²ã·Ö²¼Ö±·½Í¼Í¼Æ¬À´×Ô£º ÏÄ·É.ÁÄÒ»ÁÄÉî¶ÈÑ§Ï°µÄweight initialization.£ÛZ/OL£Ý.https://zhuanlan.zhihu.com/p/25110150https://zhuanlan.zhihu.com/p/25110150.


5.3.4He³õÊ¼»¯

He³õÊ¼»¯Ò²³ÆÎªKaiming³õÊ¼»¯ºÍMSRA³õÊ¼»¯£¬ÓÉKaiming HeÌá³ö¡£ÓÉÓÚXavier³õÊ¼»¯²¢²»ÊÊÓÃÓÚÊ¹ÓÃReLU×ö¼¤»îº¯ÊýµÄÍøÂç£¬Xavier³õÊ¼»¯µÄGlorotÌõ¼þÎª£¬ÕýÏò´«²¥Ê±£¬±£³ÖÊä³öÖµµÄ·½²î²»±ä£» ·´Ïò´«²¥Ê±£¬±£³Ö×´Ì¬ÖµÌÝ¶ÈµÄ·½²î±£³Ö²»±ä¡£
¶ÔGlorotÌõ¼þÉÔ×÷±ä»»£¬¸ÄÎªÕýÏò´«²¥Ê±£¬±£³Ö×´Ì¬ÖµµÄ·½²î±£³Ö²»±ä£» ·´Ïò´«²¥Ê±£¬ËðÊ§º¯Êý¹ØÓÚÊä³öÖµµÄÌÝ¶ÈµÄ·½²î±£³Ö²»±ä£¬Õâ¾ÍÊÇHe³õÊ¼»¯ÐèÒªÂú×ãµÄÌõ¼þ¡£»ùÓÚÕâÁ½¸öÌõ¼þ½øÐÐÊýÑ§ÍÆµ¼£¬ÄÜ¹»µÃµ½²ÎÊý³õÊ¼»¯µÄ·½·¨¡£¶ÔÕýÏò´«²¥µÄ×´Ì¬ÖµÇó·½²î£¬Ê¹ÆäµÈÓÚÇ°Ò»²ãÉñ¾­Ôª×´Ì¬ÖµµÄ·½²î£¬ÍÆµ¼¿ÉµÃ

Varzl=12nl£­1VarWlVarzl£­1£¨5ª²52£©

ÏêÏ¸Ö¤Ã÷¹ý³ÌÈçÏÂ£º 








Varzl=Var¡Ænl£­1i=1Wlihl£­1i

=¡Ænl£­1i=1VarWlihl£­1i

=¡Ænl£­1i=1E(Wli)2Var(hl£­1i)+E(hl£­1i)2Var(Wli)+Var(Wli)Var(hl£­1i)

¼ÙÉè²ÎÊýºÍÊä³öÖµ¶ÀÁ¢£¬²¢ÇÒ²ÎÊýµÄ¾ùÖµE(Wli)=0£¬ÒòÎª¼¤»îº¯ÊýÎªReLUº¯Êý£¬ËùÒÔ¼¤»îÖµµÄÆÚÍûE(hli)¡Ù0¡£ÓÚÊÇ£¬ÉÏÊ½¿ÉÒÔ¸ÄÐ´³É

Var(zl)=¡Ænl£­1i=1E(hl£­1i)2Var(Wli)+Var(Wli)Var(hl£­1i)

=¡Ænl£­1i=1Var(Wli)E(hl£­1i)2+Var(hl£­1i)

=¡Ænl£­1i=1Var(Wli)E(hl£­1i)2

=nl£­1Var(Wl)E(hl£­1)2


ÒòÎª

E(hl£­1)2=E(f(zl£­1))2

=¡Ò¡Þ£­¡Þp(zl£­1)(f(zl£­1))2dzl£­1

=¡Ò0£­¡Þp(zl£­1)(f(zl£­1))2dzl£­1+¡Ò¡Þ0p(zl£­1)(f(zl£­1))2dzl£­1

=0+¡Ò¡Þ0p(zl£­1)(zl£­1)2dzl£­1

=12¡Ò¡Þ£­¡Þp(zl£­1)(zl£­1)2dzl£­1

=12E(zl£­1)2

=12Var(zl£­1)


½«ÉÏÊö½á¹û´úÈë£¬¿ÉµÃ

Var(zl)=12nl£­1Var(Wl)Var(zl£­1)


Òò´Ë£¬ÎªÁË±£Ö¤ÕýÏò´«²¥Ê±£¬×´Ì¬ÖµµÄ·½²î±£³Ö²»±ä£¬±ØÐëÂú×ã12nl£­1VarWl=1£¬¼´Ê½£¨5ª²53£©¡£²ÎÊýµÄ·½²îÐèÒª¸ù¾ÝÊäÈë²ÎÊýµÄÊýÁ¿½øÐÐµ÷Õû¡£

VarWl=2nl£­1£¨5ª²53£©

Í¬Ñù£¬·´Ïò´«²¥²ÉÓÃÏàÍ¬µÄ·ÖÎö·½Ê½£¬¿ÉÒÔ¼ÆËã³öËðÊ§º¯Êý¹ØÓÚµÚl²ãÈÎÒ»Éñ¾­Ôª¼¤»îÖµµÄ·½²îÂú×ã

VarªµLªµhl=12nl+1VarWl+1VarªµLªµhl+1£¨5ª²54£©

Áî12nl+1VarWl+1=1£¬¿ÉµÃVarWl+1=2nl+1£¬¼´·½²îÂú×ã

VarWl=2nl£¨5ª²55£©

Òò´Ë£¬Èç¹ûÍ¬Ê±¿¼ÂÇÕýÏòºÍ·´Ïò´«²¥£¬½«·½²îÉèÖÃÎª4nl£­1+nl¼´¿É¡£He³õÊ¼»¯¿¼ÂÇÁË·ÇÏßÐÔ¼¤»îº¯ÊýReLU¶ÔÊäÈëµÄÓ°Ïì£¬ReLUº¯Êý»áÏû³ýÒ»°ëµÄÉñ¾­Ôª£¬¼´½«ÕâÒ»°ëÉñ¾­ÔªµÄ²ÎÊýÉèÖÃÎª0£¬»áÊ¹µÃµÃµ½µÄ·½²î¼õ°ë£¬Òò´ËÊ¹ÓÃReLUº¯ÊýÊ±£¬¿ªÊ¼Ê±±íÏÖÁ¼ºÃ£¬²ãÊý¼ÓÉî·½²î»á±äÐ¡£¬´Ó¶øµ¼ÖÂÔ½À´Ô½¶àµÄÊä³öÖµ¼¯ÖÐÔÚ0¸½½ü¡£¿ÉÒÔÕâÑùÀí½âHe³õÊ¼»¯£º ¶ÔÓÚÊ¹ÓÃReLUº¯ÊýµÄÍøÂç£¬Èç¹ûÓëÊ¹ÓÃÆäËû¼¤»îº¯ÊýÀýÈçtanhº¯ÊýµÄÍøÂçµÄÊäÈëÏàÍ¬£¬ÒòÎªÓÐÒ»°ëÉñ¾­ÔªµÄ²ÎÊý±»ÉèÖÃÎª0£¬Ïàµ±ÓÚÖ»ÓÐÒ»°ëÊäÈë£¬ËùÒÔÐèÒª½«Xavier·½·¨ÖÐ·½²îµÄ¹æ·¶»¯·ÖÄ¸n±äÎªn2¡£ÕâÑù£¬ÄÜ¹»±£Ö¤×´Ì¬ÖµµÄ·Ö²¼ÔÚÉî¶ÈÍøÂçµÄÃ¿Ò»²ã¶¼±íÏÖÁ¼ºÃ¡£
Òò´Ë£¬Êµ¼ÊÖÐÈç¹ûÊ¹ÓÃReLUº¯Êý×÷Îª¼¤»îº¯Êý£¬×îºÃÊ¹ÓÃHe³õÊ¼»¯·½·¨£¬½«²ÎÊý³õÊ¼»¯Îª¸ßË¹·Ö²¼»òÕß¾ùÔÈ·Ö²¼µÄ½ÏÐ¡Ëæ»úÊý¡£Ñ¡Ôñ¸ßË¹·Ö²¼¶Ô³õÊ¼»¯²ÎÊý½øÐÐ²ÉÑùÊ±£¬Ã¿²ãÉñ¾­ÔªÓ¦Âú×ã¸ßË¹·Ö²¼N0,2nl£­1£¬¿¼ÂÇ·´Ïò´«²¥Ê±£¬Ó¦Âú×ã¸ßË¹·Ö²¼N0,4nl£­1+nl£» Èç¹ûÊ¹ÓÃ¾ùÔÈ·Ö²¼½øÐÐ²ÉÑù£¬Ó¦ÎªU£­6nl£­1,6nl£­1¡£
5.3.5ÅúÁ¿¹éÒ»»¯
ÅúÁ¿¹éÒ»»¯£¨Batch Normalization£¬BN£©ÊÇSergey IoffeµÈÈËÓÚ2015ÄêÌá³öµÄÒ»ÖÖÓÃÓÚÑµÁ·Éî²ãÉñ¾­ÍøÂçµÄ·½·¨¡£BN²¢²»ÊÇÒ»ÖÖ²ÎÊý³õÊ¼»¯·½·¨£¬¶øÊÇÒ»ÖÖÑµÁ·Éî²ãÉñ¾­ÍøÂçµÄ¼¼ÇÉ£¬Ò»ÖÖ¶ÔÃ¿²ãÉñ¾­Ôª½øÐÐÊý¾Ý´¦ÀíµÄ·½·¨¡£Ê¹ÓÃBN¿ÉÒÔ¼õÉÙÍøÂç¶Ô²ÎÊý³õÊ¼³ß¶ÈµÄÒÀÀµ£¬½µµÍºÏÀí³õÊ¼»¯²ÎÊýµÄÄÑ¶È£¬Ê¹ÓÃBNµÄÍøÂç½öÊ¹ÓÃÐ¡Ëæ»úÊý½øÐÐ³õÊ¼»¯¾ÍÄÜµÃµ½²»´íµÄÐ§¹û¡£Í¼5ª²15Îª½öÊ¹ÓÃÐ¡Ëæ»úÊý³õÊ¼»¯µÄReLUÉñ¾­ÍøÂçÊä³öÖµÖð²ã·Ö²¼Ö±·½Í¼£» Í¼5ª²16ÎªÊ¹ÓÃBNºÍÐ¡Ëæ»úÊý³õÊ¼»¯µÄReLUÉñ¾­ÍøÂçÊä³ö²ãÖð²ã·Ö²¼Ö±·½Í¼¡£²ÎÊý²ÉÑù¾ùÀ´×Ô¸ßË¹·Ö²¼N£¨0£¬0.01£©¡£¿ÉÒÔ¿´µ½£¬Ê¹ÓÃBNµÄÐ§¹û·Ç³£ºÃ£¬Ã¿²ãÊä³ö·Ö²¼½üËÆ£¬Éî²ãÍøÂçÒ²Ã»ÓÐ³öÏÖÐÅºÅÏûÊ§µÈÎÊÌâ¡£


Í¼5ª²15½öÊ¹ÓÃÐ¡Ëæ»úÊý³õÊ¼»¯µÄReLUÉñ¾­ÍøÂçÊä³öÖµÖð²ã·Ö²¼Ö±·½Í¼Í¼Æ¬À´×Ô£º ÏÄ·É.ÁÄÒ»ÁÄÉî¶ÈÑ§Ï°µÄweight initialization.£ÛZ/OL£Ý.https://zhuanlan.zhihu.com/p/25110150https://zhuanlan.zhihu.com/p/25110150.




Í¼5ª²16Ê¹ÓÃBNºÍÐ¡Ëæ»úÊý³õÊ¼»¯µÄReLUÉñ¾­ÍøÂçÊä³öÖµÖð²ã·Ö²¼Ö±·½Í¼¢Ù


Êµ¼ùÖ¤Ã÷£¬Ê¹ÓÃBNÄÜ´øÀ´ºÜ¶àÑµÁ·ÓÅÊÆ£¬ÀýÈç¼«´óµÄÑµÁ·ËÙ¶È£¬ÒÔ¼°½â¾öÁËÉî²ãÉñ¾­ÍøÂçÖÐÌÝ¶ÈÏûÊ§µÄÎÊÌâ£¬»¹¿ÉÒÔÌáÉýÄ£ÐÍÑµÁ·¾«¶È£¬¶Ô²ÎÊý³õÊ¼»¯ÒªÇóµÍ£¬Ê¹µÃÑµÁ·Éî²ãÍøÂçÄ£ÐÍ¸ü¼ÓÈÝÒ×ºÍÎÈ¶¨¡£Òò´Ë£¬BNÒÑ¾­³ÉÎªÑµÁ·Éî²ãÉñ¾­ÍøÂçµÄÒ»ÖÖ±ê×¼´¦Àí·½·¨¡£
BNµÄºËÐÄË¼ÏëÊÇ£¬½«Ã¿Ò»²ãÉñ¾­ÔªÊäÈëÊý¾Ý½øÐÐ¹éÒ»»¯´¦Àí£¬Ê¹ÆäÎª¸ßË¹·Ö²¼£¬´Ó¶ø±£Ö¤Ã¿Ò»²ãÉñ¾­ÍøÂçµÄÊäÈë²ÎÊý¾ßÓÐÏàÍ¬·Ö²¼¡£´Ë´¦ËùËµ¡°Ã¿Ò»²ãÉñ¾­ÔªµÄÊäÈë¡±Îª¸Ã²ãÉñ¾­Ôª¼¤»îº¯ÊýÖ®Ç°µÄÊäÈë£¬¼´¸Ã²ãµÄ×´Ì¬Öµ£¬ÊÇÓÉÉÏÒ»²ãÉñ¾­ÔªµÄÊä³öºÍ±¾²ãÈ¨ÖØ¼ÆËãµÃµ½µÄ¡£¶ÔÓÚÉî²ãÉñ¾­ÍøÂç£¬ÓÉÓÚÖÐ¼äÈÎÒâÒ»²ãÉñ¾­ÔªµÄÊäÈë¶¼ÓÉÉÏÒ»²ãÉñ¾­ÔªµÄÊä³öµÃµ½£¬Òò´ËÊ¹ÓÃ·´Ïò´«²¥½øÐÐ²ÎÊý¸üÐÂÊ±£¬Ç°²ã²ÎÊýµÄ±ä»¯»áµ¼ÖÂºó²ãÊäÈëµÄ·Ö²¼·¢Éú½Ï´óµÄ±ä»¯£¬ÒýÆðºóÃæÃ¿Ò»²ãÉñ¾­Ôª²ÎÊýµÄ·Ö²¼·¢Éú¸Ä±ä£¬ÓÉÓÚÀÛ»ýÐ§Ó¦£¬ÍøÂç²ã´ÎÔ½Éî£¬ÕâÖÖ±ä»¯Ô½ÑÏÖØ¡£ÕâÖÖÔÚÑµÁ·¹ý³ÌÖÐÍøÂçÖÐ¼ä²ãÊäÈë·Ö²¼·¢Éú¸Ä±äµÄÏÖÏó½Ð×÷ÄÚ²¿Ð­±äÁ¿Æ«ÒÆ£¨Internal Covariate Shift£©¡£ÕâÖÖÏÖÏóÊ¹µÃÉî²ãÊäÈë·Ö²¼·¢Éú¸Ä±ä£¬Í¨³£ÊÇÕûÌå·Ö²¼Öð½¥Ïò·ÇÏßÐÔ¼¤»îº¯ÊýµÄÏßÐÔÇø¼äµÄÉÏÏÂÏÞ¿¿½ü£¬µ¼ÖÂ·´Ïò´«²¥Ê±µ×²ãÉñ¾­ÍøÂç²úÉúÌÝ¶ÈÏûÊ§ÎÊÌâ£¬Ê¹µÃÄ£ÐÍÊÕÁ²¹ýÂý¡£ÎªÁËÌáÉýÑµÁ·ËÙ¶È£¬ÐèÒª¼õÐ¡ÄÚ²¿Ð­±äÁ¿µÄÆ«ÒÆ£¬Òò´Ë¿¼ÂÇ¶ÔÉñ¾­ÍøÂçµÄÃ¿Ò»²ã¶¼½øÐÐ¹éÒ»»¯´¦Àí£¬¶ø²»½ö½ö¶ÔÄ£ÐÍµÄÊäÈë½øÐÐ¹éÒ»»¯´¦Àí¡£ÕâÑùÊ¹µÃÖÐ¼ä²ãµÄÊäÈë·Ö²¼±£³ÖÎÈ¶¨£¬¼´±£³ÖÍ¬Ò»·Ö²¼¡£Í¨¹ýBN´¦Àí£¬Ê¹µÃÊäÈëÖµÂäÈë·ÇÏßÐÔ¼¤»îº¯Êý¶ÔÊäÈë²ÎÊý±È½ÏÃô¸ÐµÄÇøÓò£¬ÔÚÆÚÍûµÄ¸ßË¹·Ö²¼ÇøÓòÄÚ±£³Ö¼¤»î×´Ì¬£¬ÕâÑù¿ÉÒÔÊ¹ÌÝ¶È±£³ÖÔÚ½Ï´óµÄË®Æ½£¬¼Ó¿ìÑ§Ï°ºÍÊÕÁ²µÄËÙ¶È¡£
ÄÇÃ´BNµÄ¾ßÌåÊµÏÖ·½Ê½ÊÇÔõÑùµÄÄØ£¿BNÏàµ±ÓÚÔÚÃ¿Ò»²ã¶¼½øÐÐÒ»´ÎÊý¾ÝÔ¤´¦Àí£¬Òò´Ë¿ÉÒÔ¿´×÷ÔÚÍøÂçÃ¿Ò»²ãÊäÈëÇ°²åÈëÒ»¸öBN²ã£¬¶ÔÊäÈë²ÎÊý·Ö²¼½øÐÐµ÷ÕûºóÔÙÊäÈëÍøÂçµÄÏÂÒ»²ã¡£´Ë´¦µÄ¡°ÊäÈë¡±ÒÀ¾ÉÖ¸¼¤»îº¯ÊýÖ®Ç°µÄÊý¾Ý£¬Òò´ËBN²ãÊµ¼ÊÉÏÊÇ·ÅÔÚÃ¿²ã¼¤»îº¯ÊýÖ®Ç°¡£ÁíÍâ£¬BNÊÇ»ùÓÚÐ¡ÅúÁ¿ÌÝ¶ÈÏÂ½µÊµÏÖ²ÎÊý¸üÐÂµÄ¡£
ÏÂÃæÏêÏ¸½éÉÜÆäÊµÏÖ¹ý³Ì¡£¶ÔÓÚÒ»¸öÉî²ãÉñ¾­ÍøÂç£¬ÁîÆäµÚl²ãµÄ¾»ÊäÈëÎªzl£¬Êä³öÎªhl¡£¶ÔÓÚ¼¤»îº¯Êýf(¡¤)£¬¿ÉµÃ¸Ã²ãÊä³öÎªhl=fzl=fWhl£­1+b£¬ÆäÖÐW¡¢b·Ö±ðÎª²ÎÊýºÍÆ«ÖÃ¡£ÎªÁËÌáÉý¹éÒ»»¯Ð§ÂÊ£¬Ê¹ÓÃ±ê×¼¹éÒ»»¯£¬½«ÊäÈëzlµÄÃ¿Ò»Î¬°´ÕÕÊ½£¨5ª²56£©¹éÒ»»¯Îª±ê×¼ÕýÌ¬·Ö²¼¡£

z^l=zl£­EzlVarzl+¦Å£¨5ª²56£©

ÆäÖÐ£¬EzlºÍVarzlÊÇµ±Ç°²ÎÊýÏÂ£¬zlµÄÃ¿Ò»Î¬ÔÚÒ»¸öÅúÁ¿Ñù±¾¼¯ºÏÉÏµÄ¾ùÖµºÍ·½²î¡£¼ÙÉè¸ÃÅúÁ¿º¬ÓÐK¸öÑù±¾£¬ÕâK¸öÑù±¾ÔÚµÚl²ãµÄÊäÈë·Ö±ðÊÇz£¨1,l£©,¡­,z£¨k,l£©£¬ÄÇÃ´¾ùÖµºÍ·½²î¹«Ê½ÈçÊ½£¨5ª²57£©ºÍÊ½£¨5ª²58£©ËùÊ¾¡£


Ezl=1K¡ÆKk=1z£¨k,l£©£¨5ª²57£©

Varzl=1K¡ÆKk=1z£¨k,l£©£­Ezl¡Ñz£¨k,l£©£­Ezl£¨5ª²58£©


¾¡¹ÜÍ¨¹ý¹éÒ»»¯´¦Àí£¬¿ÉÒÔÊ¹Æ«ÒÆµÄÊäÈë·Ö²¼·ûºÏ¾ùÖµÎª0¡¢·½²îÎª1µÄ±ê×¼ÕýÌ¬·Ö²¼£¬Ô¶Àëµ¼ÊýÎª0µÄ±¥ºÍÇø£¬µ«ÊÇ¶ÔÓÚÔÚÇø¼ä£¨-1£¬1£©ÌÝ¶È±ä»¯²»´óµÄ¼¤»îº¯Êý£¬Ð§¹û·´¶ø¸ü²î¡£ÀýÈç£¬sigmoidº¯ÊýÔÚÇø¼ä£¨-1£¬1£©½üËÆÏßÐÔ¼¤»î£¬Öð²ã¹éÒ»»¯´¦ÀíºóÊ¹ÆäÉ¥Ê§ÁË·ÇÏßÐÔ±ä»»µÄÄÜÁ¦£» ¶ÔÓÚReLUº¯Êý£¬Ð§¹û¸ü²î£¬ÒòÎªÓÐÒ»°ëÉñ¾­Ôª±»ÖÃ0¡£¶ÔÓÚÕâÐ©¼¤»îº¯Êý£¬Öð²ã¹éÒ»»¯²Ù×÷Êµ¼ÊÏ÷ÈõÁËÍøÂçµÄÐÔÄÜ£¬ÎªÁËÊ¹¹éÒ»»¯²Ù×÷²»¶ÔÍøÂçµÄ±íÊ¾ÄÜÁ¦Ôì³É¸ºÃæÓ°Ïì£¬¿ÉÒÔÍ¨¹ýÌí¼Ó¶îÍâµÄËõ·ÅºÍÆ½ÒÆ²Ù×÷£¬¸Ä±äÊäÈëµÄ·Ö²¼Çø¼ä£¬ÈçÊ½£¨5ª²59£©¡£

z^l=zl£­EzlVarzl+¦Å¡Ñ¦Ã+¦Â=BN¦Ã,¦Âzl£¨5ª²59£©

ÆäÖÐ£¬¦ÃºÍ¦Â·Ö±ðÎªËõ·ÅºÍÆ½ÒÆÒò×Ó£¬¿ÉÒÔ×÷Îª¿ÉÑ§Ï°µÄ²ÎÊýÓÉ·´Ïò´«²¥È·¶¨£¬Ëõ·ÅºÍÆ½ÒÆÒò×ÓÍ¨¹ý¿ØÖÆ¼¤»îº¯ÊýµÄÊäÈë²ÎÊýµÄÈ¡Öµ·¶Î§£¬Ê¹µÃÍøÂçÍ¨¹ýÑ§Ï°ÓµÓÐ¿ØÖÆ²»Í¬±¥ºÍ¶ÈµÄÄÜÁ¦¡£ÒýÈëËõ·ÅºÍÆ½ÒÆÒò×ÓµÄÖð²ã¹éÒ»»¯´¦Àí×îÖÕ¹¹³ÉÍêÕûµÄÅúÁ¿¹éÒ»»¯µÄ¶¨Òå¡£Ëõ·ÅºÍÆ½ÒÆÊÇ¹Ø¼ü²½Öè£¬Ìá¹©ÁË¸ü¶àµÄÁé»îÐÔ¡£ÁíÍâ£¬Ò²¿ÉÒÔÍ¨¹ýÉèÖÃ¦Ã=¦ÁºÍ¦Â=Ezl»Ö¸´ºãµÈÓ³Éä£¬´Ó¶ø½«²ÎÊý»¹Ô­ÎªÎ´×öÅúÁ¿¹éÒ»»¯Ê±µÄÊäÈë£¬¼´z^l=zl¡£ Òò´Ë£¬Ê¹ÓÃÅúÁ¿¹éÒ»»¯µÄÉñ¾­ÍøÂçµÄÃ¿Ò»²ãÊä³öÎªhl=fBN¦Ã,¦Âzl=fBN¦Ã,¦ÂWhl£­1¡£ÕâÀïÒýÈëÆ½ÒÆ±ä»»£¬Ïàµ±ÓÚÎªÉñ¾­²ãÔö¼ÓÆ«ÖÃ£¬Òò´Ë±ê×¼¹éÒ»»¯Ö®Ç°µÄÊäÈëÖµWhl£­1²»ÓÃÔö¼ÓÆ«ÖÃ¡£ÍêÕûµÄBNËã·¨Á÷³ÌÈç±í5ª²6ËùÊ¾¡£


±í5ª²6BNËã·¨Á÷³Ì



1. Input:°üº¬K¸öÑù±¾µÄÐ¡ÅúÁ¿£¬ÆäÈÎÒâÖÐ¼ä²ãµÚl²ãµÄ¾»ÊäÈëÎªzl 

2. Output:z^l=BN¦Ã,¦Âzl

3. Calculate:

4. Ð¡ÅúÁ¿¾ùÖµ£º Ezl=1K¡ÆKk=1z£¨k,l£©

5. Ð¡ÅúÁ¿·½²î£º Varzl=1K¡ÆKk=1z£¨k,l£©£­Ezl¡Ñz£¨k,l£©£­Ezl

6. ±ê×¼¹éÒ»»¯£º z^l=zl£­EzlVarzl+¦Å

7. Ëõ·ÅºÍÆ½ÒÆ£º z^l=zl£­EzlVarzl+¦Å¡Ñ¦Ã+¦Â=BN¦Ã,¦Âzl

8. End

ÐèÒª×¢ÒâµÄÊÇ£¬ÔÚÇ°Ïò´«²¥ÖÐÊ¹ÓÃÅúÁ¿Ñù±¾¼ÆËãµÄ¾ùÖµEzlºÍ·½²îVarzlÊÇÊäÈëzlµÄº¯Êý£¬²»ÊÇ¹Ì¶¨³£Á¿¡£Òò´Ë£¬ÔÚ·´Ïò´«²¥¼ÆËã²ÎÊýÌÝ¶ÈÊ±£¬ÐèÒª¿¼ÂÇEzlºÍVarzl¶ÔÌÝ¶ÈµÄÓ°Ïì¡£ÔÚÑµÁ·Íê³Éºó£¬ÓÃÕû¸öÊý¾Ý¼¯ÉÏµÄ¾ùÖµEºÍ·½²îVar´úÌæÃ¿Ò»´ÎÐ¡ÅúÁ¿Ñù±¾µÄ¾ùÖµºÍ·½²î£¬È»ºóÔÚ²âÊÔ½×¶ÎÊ¹ÓÃÕâÁ½¸öÈ«¾ÖÍ³¼ÆÁ¿À´½øÐÐBN²Ù×÷¡£Êý¾Ý¼¯ÉÏµÄ¾ùÖµEºÍ·½²îVar¿ÉÒÔÍ¨¹ýÒÔÏÂ·½Ê½»ñµÃ£º Ã¿´Îµü´úÖ»Ê¹ÓÃÐ¡ÅúÁ¿µÄÑù±¾£¬ÔÚÃ¿´Îµü´úÊ±£¬¶¼½«Êý¾Ý¼¯ÔÚÃ¿²ãÊäÈëµÄ¾ùÖµºÍ·½²î´æ´¢ÆðÀ´£¬µ±±éÀúÕû¸öÊý¾Ý¼¯ºó£¬ÔÙ¸ù¾Ýµü´ú´ÎÊý½«µÃµ½µÄËùÓÐ¾ùÖµºÍ·½²î¼ÆËãÊýÑ§ÆÚÍû£¬ÕâÑù¾Í¿ÉÒÔµÃµ½Õû¸öÊý¾Ý¼¯µÄ¾ùÖµºÍ·½²î¡£
¹ØÓÚBN²ãµÄÊ¹ÓÃÎ»ÖÃ£¬Í¨³£ÊÇÔÚÈ«Á¬½Ó²ãºÍ¾í»ý²ãÊ¹ÓÃÅúÁ¿¹éÒ»»¯´¦Àí£¬²¢ÇÒÒªÔÚ¼¤»îº¯ÊýÖ®Ç°Ê¹ÓÃ¡£Ê¹ÓÃÅúÁ¿¹éÒ»»¯ÓÐºÜ¶àºÃ´¦£¬ÀýÈç¿ÉÒÔ¸Ä½øÕû¸öÍøÂçµÄÌÝ¶ÈÁ÷£¬±ÜÃâ±¥ºÍÐÍ¼¤»îº¯Êýµ¼ÖÂµÄ¡°ÌÝ¶ÈÏûÊ§¡±ÎÊÌâ£¬Ê¹ÍøÂç¾ßÓÐ¸ü¸ßµÄ½¡×³ÐÔ£» ÄÜ¹»ÔÚ¸ü¹ã·¶Î§µÄÑ§Ï°ÂÊºÍ²»Í¬µÄ³õÊ¼ÖµÏÂ½øÐÐ¹¤×÷£¬Ê¹µÃ²ÎÊý³õÊ¼»¯ÎÊÌâ²»ÔÙ¼¬ÊÖ£¬Ê¹ÓÃÅúÁ¿¹éÒ»»¯»áÊ¹ÑµÁ·±äµÃÈÝÒ×£» Êµ¼ùÖ¤Ã÷£¬Ê¹ÓÃÅúÁ¿¹éÒ»»¯¿ÉÒÔÌáÉýÑµÁ·ËÙ¶È£¬¼Ó¿ìÄ£ÐÍÊÕÁ²¡£ÁíÒ»µãÐèÒªÖ¸³öµÄÊÇ£¬BNÒ²¿ÉÒÔ¿´×÷Ò»ÖÖÕýÔò»¯µÄ·½·¨£¬ÒòÎªÃ¿²ãÉñ¾­ÔªµÄÊä³ö¶¼Ô´ÓÚÊäÈëÒÔ¼°Í¬Ò»ÅúÁ¿Ñù±¾ÖÐ±»²ÉÑùµÄÆäËûÑù±¾£¬¸ø¶¨µÄÑµÁ·Ñù±¾²»ÔÙ¶ÔÍøÂçÌá¹©È·¶¨ÐÔµÄÊäÈëÖµ£¬ÊäÈëÖµÓÉËæ»ú²ÉÑùÈ·¶¨µÄÅúÁ¿¾ö¶¨£¬Òò´Ë¾ÍÏñÔÚÊäÈëÖÐÌí¼ÓÒ»Ð©ÔëÉù´Ó¶øÊµÏÖÕýÔò»¯µÄÐ§¹û¡£
5.3.6Ô¤ÑµÁ·
Ô¤ÑµÁ·ÊÇÔçÆÚÑµÁ·Éî²ãÉñ¾­ÍøÂçµÄÒ»ÖÖÓÐÐ§·½Ê½£¬ÊÇÓÉHinton»ùÓÚÉî¶ÈÐÅÄîÍøÂçÌá³öµÄÒ»ÖÖÕë¶ÔÑµÁ·Éî²ãÍøÂçµÄ¿ÉÐÐ·½·¨¡£Ê×ÏÈ£¬Ê¹ÓÃ×Ô¶¯±àÂëÆ÷½øÐÐÖð²ãÌ°À·ÎÞ¼à¶½Ô¤ÑµÁ·£¬È»ºó½øÐÐÎ¢µ÷¡£Ö÷Òª·ÖÎªÒÔÏÂÁ½¸ö½×¶Î¡£
£¨1£© Ô¤ÑµÁ·½×¶Î: ÏÈ½«Éî²ãÍøÂçµÄÊäÈë²ãºÍµÚÒ»¸öÒþ²Ø²ãÈ¡³ö£¬ÎªÍøÂçÌí¼ÓÓëÊäÈë²ãÍ¬µÈÊýÁ¿µÄÊä³ö²ã¹¹Ôì×Ô¶¯±àÂëÆ÷£¬ÓÅ»¯×Ô¶¯±àÂëÆ÷£¬Ê¹µÃÊäÈëºÍÊä³ö±£³ÖÒ»ÖÂ£¬ÕâÑùµÃµ½µÄÖÐ¼ä²ã±íÊ¾¿ÉÒÔ¿´×÷¶ÔÊäÈëµÄÌØÕ÷±íÊ¾¡£Òò´Ë£¬ÓÅ»¯×Ô¶¯±àÂëÆ÷µÄ¹ý³ÌÊµÖÊÉÏ¾ÍÊÇÔÚÑ°ÕÒÊäÈëµÄÆäËûÌØÕ÷±íÊ¾¡£Ê×ÏÈ£¬½«Êä³ö²ãÈ¥µô£¬½ö±£ÁôÊäÈë²ãºÍµÚÒ»¸öÒþ²Ø²ã×÷ÎªÉî²ãÉñ¾­ÍøÂçµÄÇ°Á½²ã£¬ÓÉ´ËµÃµ½ÊäÈë²ãµ½µÚÒ»¸öÒþ²Ø²ãµÄ³õÊ¼»¯²ÎÊý£» È»ºó£¬½«µÚÒ»¸öÒþ²Ø²ãºÍµÚ¶þ¸öÒþ²Ø²ãÈ¡³ö¹¹Ôì×Ô¶¯±àÂëÆ÷£» ½«µÚÒ»¸öÒþ²Ø²ã×÷Îª×Ô¶¯±àÂëÆ÷µÄÊäÈë£¬Ìí¼Ó¶îÍâµÄÊä³ö²ãÊ¹Ö®ÓëµÚÒ»¸öÒþ²Ø²ã±£³ÖÒ»ÖÂ¡£ÓÅ»¯Íê³É¿ÉÒÔµÃµ½µÚÒ»¸öÒþ²Ø²ãºÍµÚ¶þ¸öÒþ²Ø²ãÖ®¼äµÄÁ¬½ÓÈ¨ÖØ£¬ÔÙ½«ÆäÓ¦ÓÃÓÚÉî²ãÍøÂç¡£ÕâÑù²»¶Ï¶ÔÉî²ãÉñ¾­ÍøÂçÑµÁ·µÄÃ¿Ò»²ã½øÐÐÏàÍ¬µÄ²Ù×÷£¬×îÖÕ¿ÉÒÔµÃµ½ËùÓÐ²ã¼äµÄÁ¬½ÓÈ¨ÖØ£¬½«ÕâÐ©È¨ÖØ×÷ÎªÍøÂçµÄ³õÊ¼»¯²ÎÊý¡£
£¨2£© Î¢µ÷½×¶Î: ½«Éñ¾­ÍøÂçÊÓÎªÒ»¸öÕûÌå£¬Ê¹ÓÃÔ¤ÑµÁ·½×¶ÎµÃµ½µÄ²ÎÊý³õÊ¼ÖµºÍÔ­Ê¼ÑµÁ·Êý¾Ý¶ÔÄ£ÐÍ½øÐÐµ÷Õû¡£ÔÚÕâÒ»¹ý³ÌÖÐ£¬²ÎÊý±»½øÒ»²½¸üÐÂ£¬ÐÎ³É×îÖÕµÄÄ£ÐÍ¡£
Ä¿Ç°£¬Ëæ×ÅÊý¾ÝÁ¿µÄÔö¼ÓºÍ¼ÆËãÄÜÁ¦µÄÌáÉý£¬Éî²ãÉñ¾­ÍøÂçÒÑ¾­ºÜÉÙ²ÉÓÃ×Ô¶¯±àÂëÆ÷½øÐÐÔ¤ÑµÁ·ÕâÖÖ·½Ê½ÁË£¬¶øÊÇÖ±½ÓÊ¹ÓÃÑµÁ·Êý¾Ý¶ÔÍøÂçÕûÌå½øÐÐÑµÁ·¡£µ«ÊÇ£¬ÔÚ¼ÆËã×ÊÔ´»òÕßÊ±¼äÓÐÏÞµÄÇé¿öÏÂ£¬Èç¹û²»ÏëÖØÐÂÑµÁ·Ò»¸öÐÂµÄÉñ¾­ÍøÂçÄ£ÐÍ£¬Ò»ÖÖ¼ò±ã²¢ÇÒÊ®·ÖÓÐÐ§µÄ·½·¨ÊÇ£¬Ñ¡ÔñÒ»¸öÒÑ¾­ÔÚÆäËûÈÎÎñÉÏÑµÁ·Íê³ÉµÄÇÒ±íÏÖÁ¼ºÃµÄÄ£ÐÍ£¨³ÆÎªPreª²trained Model£©£¬½«Æä²ÎÊý×÷ÎªÐÂÈÎÎñµÄ³õÊ¼»¯²ÎÊý²¢¸ù¾ÝÐÂÈÎÎñ½øÐÐµ÷Õû¡£ÀýÈç£¬ÓÐÒ»¸öÈÎÎñÊÇ·Ö±æÍ¼Æ¬³¡¾°£¬ÕâÊÇÒ»¸öÍ¼ÏñÊ¶±ðÎÊÌâ£¬¶ÔÓÚ¸ÃÎÊÌâ£¬¿ÉÒÔ´ÓÍ·¿ªÊ¼»ùÓÚËÑ¼¯µÄÊý¾Ý¼¯¹¹½¨Ò»¸öÐÔÄÜÓÅÁ¼µÄÍ¼ÏñÊ¶±ðËã·¨£¬Õâ¿ÉÄÜÐèÒª»¨·ÑÊýÄêµÄÊ±¼ä¡£Èç¹ûÊ¹ÓÃGoogle¹«Ë¾ÔÚImageNetÑµÁ·¼¯ÉÏµÃµ½µÄVGGÄ£ÐÍ×÷ÎªÔ¤ÑµÁ·Ä£ÐÍ£¬»ùÓÚ¸ÃÄ£ÐÍ½øÐÐ²ÎÊý³õÊ¼»¯£¬ÔÚ³¡¾°·Ö±æÈÎÎñÉÏ¶ÔÄ£ÐÍ½øÐÐµ÷ÕûÑµÁ·²¢ÇÒ½øÐÐÎ¢µ÷£¬¾ßÌåÔõÑù½øÐÐÎ¢µ÷ÐèÒª¸ù¾Ý²»Í¬µÄÈÎÎñÈ·¶¨¡£ÕâÖÖ·½·¨¿ÉÒÔ´ó´ó¼õÉÙÑµÁ·Ê±¼ä£¬ÌáÉýÔÚÐÂÈÎÎñÉÏµÄÑµÁ·ËÙ¶È¡£
5.4ÍøÂçÕýÔò»¯
±¾½Ú½éÉÜÍøÂçÕýÔò»¯¡£Ê×ÏÈ£¬²ûÊö½øÐÐÕýÔò»¯µÄÔ­Òò£» È»ºó£¬½éÉÜ¼¸ÖÖ³£ÓÃµÄÕýÔò»¯²ßÂÔ£¬°üÀ¨L1ÕýÔò»¯¡¢L2ÕýÔò»¯¡¢È¨ÖØË¥¼õ¡¢ÌáÇ°Í£Ö¹¡¢Êý¾ÝÔöÇ¿ÒÔ¼°¶ªÆú·¨ºÍ±êÇ©Æ½»¬¡£
5.4.1ÕýÔò»¯µÄÄ¿µÄ
ÓÅ»¯ºÍÕýÔò»¯ÊÇ»úÆ÷Ñ§Ï°ÖÐµÄÁ½¸öÖØÒª·½Ãæ£¬ÓÅ»¯Ö¼ÔÚÑµÁ·¼¯ÉÏ¾¡¿ÉÄÜµØ½µµÍËðÊ§Öµ£¬¼´¼õÐ¡ÑµÁ·Îó²î£¬»ñÈ¡È«¾Ö×îÓÅ½â¡£5.1½ÚºÍ5.2½ÚËùÃèÊöµÄÓÅ»¯Ëã·¨£¬¶¼ÊÇÔÚ×îÐ¡»¯Ä¿±êº¯ÊýµÄ¹ý³ÌÖÐ²»¶Ï¼õÐ¡ÑµÁ·Îó²î¡£µ«ÊÇ£¬ÑµÁ·µÄÄ¿µÄ²»½öÊÇÏ£ÍûÄ£ÐÍÔÚÑµÁ·Êý¾ÝÉÏ±íÏÖµÃºÜºÃ£¬¸üÖØÒªµÄÊÇÄÜ¹»ÔÚÎ´ÖªµÄÐÂÊý¾ÝÉÏ¾ßÓÐÁ¼ºÃµÄÔ¤²âÄÜÁ¦£¬¼´Ä£ÐÍÒª¾ß±¸Á¼ºÃµÄ·º»¯ÄÜÁ¦¡£µ±Ê¹ÓÃÑµÁ·¼¯ÑµÁ·Ä³¸öÄ£ÐÍÊ±£¬½«ÑµÁ·¼¯ÉÏµÄÑµÁ·Îó²î£¨Training Error£©×÷ÎªÄ¿±êº¯Êý£¬Ôò¶ÔÄ£ÐÍµÄÑµÁ·×ª»»ÎªÒ»¸öÓÅ»¯ÎÊÌâ¡£Ê¹ÓÃÑµÁ·¼¯ÑµÁ·Íê³ÉµÄÄ£ÐÍ£¬ÒªÊ¹ÓÃÔÚÏÈÇ°Î´¹Û²âµ½µÄÐÂÊý¾ÝÉÏ²¢¶ÔÆä½øÐÐÔ¤²â¡£Òò´Ë£¬·º»¯Îó²î×÷ÎªºâÁ¿Ä£ÐÍÔÚÐÂÊý¾ÝÉÏµÄ±íÏÖ¶ÈÁ¿£¬±»¶¨ÒåÎªÄ£ÐÍÔÚÐÂÊý¾ÝÉÏµÄÎó²îÆÚÍû£¬¼´

Rexpf=EpLy,fx;¦È=¡Òx¡ÁyLy,fx;¦Èpx,ydxdy£¨5ª²60£©

·º»¯Îó²îÒ»°ãÍ¨¹ýÄ£ÐÍÔÚ²âÊÔ¼¯Êý¾ÝÉÏµÄ²âÊÔÎó²î½øÐÐÆÀ¹À£¬¼´²âÊÔÎó²î1mtest¡¬xtestW£­ytest¡¬22¡£ÓÉÓÚÑµÁ·Êý¾ÝºÍ²âÊÔÊý¾Ý¶¼ÊÇ´ÓÍ¬Ò»·Ö²¼²ÉÑùµÃµ½µÄ£¬Òò´ËÄ£ÐÍµÄÑµÁ·Îó²îÆÚÍûºÍ²âÊÔÎó²îÆÚÍûÊÇÏàÍ¬µÄ¡£Ò»¸öÄ£ÐÍ±íÏÖÁ¼ºÃ±ØÐë¾ß±¸ÒÔÏÂÁ½µã£º ¢ÙÑµÁ·Îó²îÒªµÍ£» ¢ÚÑµÁ·Îó²îºÍ²âÊÔÎó²îÖ®¼äµÄ²î¾àÐ¡¡£¶ÔÓ¦ÓÚÁ½¸ö¼«¶ËµÄÇé¿ö£º Ç·ÄâºÏºÍ¹ýÄâºÏ¡£Èç¹ûÑµÁ·Îó²î²»¹»µÍ£¬»á²úÉúÇ·ÄâºÏÏÖÏó£» ·´Ö®£¬Èç¹ûÑµÁ·Îó²îºÍ²âÊÔÎó²îÖ®¼äµÄ²î¾à¹ý´ó£¬»á²úÉú¹ýÄâºÏÏÖÏó¡£Í¼5ª²17¸ø³öÁËÇ·ÄâºÏ¡¢¹ýÄâºÏÒÔ¼°¸ÕºÃÄâºÏµÄÇéÐÎ¡£


Í¼5ª²17Ç·ÄâºÏ¡¢¹ýÄâºÏÓë¸ÕºÃÄâºÏ



Ò»ÏµÁÐÓÅ»¯Ëã·¨µÄÌá³öÊ¹µÃÉî²ãÉñ¾­ÍøÂçµÄÓÅ»¯ÎÊÌâ²»ÔÙÀ§ÄÑ£¬µ«ÓÉÓÚÉñ¾­ÍøÂçµÄ±íÊ¾ÄÜÁ¦·Ç³£Ç¿£¬³£³£»á³öÏÖÑ§Ï°µ½µÄÄ£ÐÍÍêÃÀµØÄâºÏÑµÁ·Êý¾ÝµÄÇé¿ö£¬´Ó¶øµ¼ÖÂ¹ýÄâºÏÏÖÏó¡£ÕýÔò»¯£¨Regularization£©×÷ÎªÒ»ÖÖ±ÜÃâ¹ýÄâºÏ¡¢Ìá¸ßÄ£ÐÍµÄ·º»¯ÄÜÁ¦µÄ²ßÂÔ£¬ÒÑ±»¹ã·ºÓ¦ÓÃÓÚ²»Í¬µÄ»úÆ÷Ñ§Ï°Ëã·¨ÖÐ¡£±¾½ÚÖ÷ÒªÕë¶ÔÉî¶ÈÑ§Ï°ÖÐ¾­³£Ê¹ÓÃµÄ¼¸ÖÖÕýÔò»¯²ßÂÔ½øÐÐ½éÉÜ¡£±¾ÕÂ½éÉÜµÄÕýÔò»¯²ßÂÔÖ¼ÔÚÌáÉýµ¥Ò»Ä£ÐÍµÄ·º»¯ÐÔÄÜ£¬Í¨¹ýÔÚÏÖÓÐÄ£ÐÍÖÐÌí¼ÓÄ³Ð©²¿·Ö£¬·ÀÖ¹ÔÚÑµÁ·¼¯ÉÏ¹ýÄâºÏ£¬´Ó¶øÊ¹Ä£ÐÍÔÚ²âÊÔ¼¯ÉÏµÄÐ§¹ûµÃµ½ÌáÉý¡£¶ÔÓÚÍ¨¹ý¼¯³É¶à¸öÄ£ÐÍÒÔÊµÏÖÕýÔò»¯µÄ·½·¨£¬½«ÔÚ5.5.3½Ú½éÉÜ¡£
5.4.2L1ºÍL2ÕýÔò»¯
1. ²ÎÊý·¶Êý³Í·£
L1ºÍL2ÕýÔò»¯¶¼ÊôÓÚ²ÎÊý·¶Êý³Í·£µÄ·½·¨£¬±»¹ã·ºÓÃÓÚ»úÆ÷Ñ§Ï°ÖÐ¡£²ÎÊý·¶Ê½³Í·£Í¨¹ýÏòÄ¿±êº¯Êý£¨ÑµÁ·¼¯ÉÏµÄËðÊ§º¯Êý£©Ìí¼Ó³Í·£Ïî£¬ÏÞÖÆÄ£ÐÍµÄ¸´ÔÓ¶È¡£Ìí¼Ó³Í·£ÏîºóµÄÄ¿±êº¯Êý±äÎª

LReg=1N¡ÆNi=1Liyi,fxi;¦È+¦Ç¦¸¦È=L+¦Ç¦¸¦È£¨5ª²61£©

³¬²ÎÊý¦ÇÓÃÀ´ºâÁ¿³Í·£Ïî¦¸¦ÈºÍÊý¾ÝËðÊ§ÏîLÖ®¼äµÄÏà¶ÔÖØÒªÐÔ£» L( )±íÊ¾Êý¾ÝËðÊ§£» NÎªÑµÁ·Ñù±¾µÄÊýÁ¿£» f( )±íÊ¾´ýÑ§Ï°µÄÉñ¾­ÍøÂç£» ³Í·£Ïî±íÊ¾²»Í¬µÄ²ÎÊý·¶Êý¡£L1ÕýÔò»¯ºÍL2ÕýÔò»¯¶ÔÓ¦ÓÚL1·¶ÊýºÍL2·¶Êý£¬·Ö±ð±íÊ¾²ÎÊý¾ØÕóÔªËØµÄ¾ø¶ÔÖµÖ®ºÍÓëÆ½·½ºÍ£¬²»Í¬²ÎÊý·¶ÊýÆ«ºÃ²»Í¬µÄ½â¡£ÐèÒª×¢Òâ£¬Êý¾ÝËðÊ§º¯ÊýL¼ÈÓëÈ¨ÖØWÏà¹Ø£¬Ò²ÓëÆ«ÖÃÏà¹Ø£¬Òò´ËÊ¹ÓÃ·ûºÅ¦È±íÊ¾±äÁ¿£» µ«³Í·£Ïî¦¸¦ÈÒ»°ãÖ»¶ÔÈ¨ÖØ¾ØÕó½øÐÐ³Í·££¬²»»á¶ÔÆ«ÖÃ²ÎÊý½øÐÐÕýÔò»¯¡£ÒòÎªÆ«ÖÃ²ÎÊýÔÚÇ°Ïò´«²¥ÖÐ²»ÓëÊäÈëÊý¾Ý²úÉú»¥¶¯£¬Òò¶ø²»ÐèÒª¿ØÖÆÆäÔÚÊý¾ÝÎ¬¶ÈÉÏµÄÐ§¹û¡£Îª±£³ÖÍ³Ò»£¬Êý¾ÝËðÊ§ÏîºÍ³Í·£Ïî¶¼Ê¹ÓÃ·ûºÅ¦È±íÊ¾±äÁ¿¡£ÏÂÃæÏêÏ¸½éÉÜL1ÕýÔò»¯ºÍL2ÕýÔò»¯ÕâÁ½ÖÖ·¶Êý³Í·£·½·¨¶ÔÄ£ÐÍ´øÀ´µÄÓ°Ïì¡£
2. L2ÕýÔò»¯
L2ÕýÔò»¯ÏòÄ¿±êº¯ÊýÌí¼Ó³Í·£Ïî¦¸¦È=12¡¬W¡¬22£¬³ËÊýÒò×Ó12¿ÉÒÔÊ¹µÃ³Í·£ÏîÔÚÇóÌÝ¶ÈÊ±Ô¼µôÏµÊý2£¬ÊÇÎªÁË¼ÆËã·½±ã¡£L2ÕýÔò»¯Ê¹µÃÈ¨ÖØÇ÷½üÓÚ0£¨×¢Òâ²»ÊÇÎª0£©£¬¿ÉÒÔÍ¨¹ýÊýÑ§·ÖÎöµÃµ½¡£ÁîWª³ÎªÎ´½øÐÐÕýÔò»¯µÄÄ¿±êº¯ÊýL×îÐ¡»¯Ê±µÄ×îÓÅ½â£¬W¡«ÎªÌí¼ÓL2ÕýÔò»¯ºóµÄÄ¿±êº¯ÊýLRegµÄ×îÓÅ½â£¬½«LÔÚ×îÓÅÖµWª³´¦½øÐÐ¶þ½×Ì©ÀÕ¹«Ê½½üËÆÕ¹¿ª£¬²¢Çóµ¼µÃ«ýWL=HW£­Wª³£¬HÎªLÔÚWª³´¦µÄHessian¾ØÕó¡£¶ÔÕýÔò»¯ºóµÄÄ¿±êº¯ÊýLRegÇóµ¼¿ÉµÃ«ýWLReg=HW£­Wª³+¦ÇW£¬µ±W=W¡«Ê±£¬¸Ãµ¼ÊýÎª0£¬½«W¡«´úÈë¿ÉµÃHW¡«£­Wª³+¦ÇW¡«=0£¬ÕûÀí¿ÉµÃW¡«=H+¦ÇI£­1HWª³¡£½«¶Ô³Æ¾ØÕóH½øÐÐ·Ö½âH=Q¦«QT£¬ÆäÖÐ¦«Îª¶Ô½Ç¾ØÕó£¬QÎªµ¥Î»Õý½»µÄÌØÕ÷ÏòÁ¿×é¡£½«¶Ô½Ç»¯µÄH´úÈë¿ÉµÃ

W¡«=Q¦«+¦ÇI£­1¦«QTWª³£¨5ª²62£©

¿ÉÒÔ¿´µ½£¬Ê¹ÓÃL2ÕýÔò»¯µÄÐ§¹ûÊÇÑØ×ÅHÌØÕ÷ÏòÁ¿¶¨ÒåµÄÖáÀ´Ëõ·ÅWª³¡£¾ßÌå¶øÑÔ£¬ÊÇÊ¹ÓÃÒò×Ó¦Ëi¦Ëi+¦Ç¶ÔHÖÐµÚi¸öÌØÕ÷ÏòÁ¿¶ÔÆëµÄWª³µÄ·ÖÁ¿½øÐÐËõ·Å¡£¶ÔÓÚHÌØÕ÷Öµ½Ï´óµÄ·½Ïò£¨¦Ëi¡Ù¦Ç£©ÕýÔò»¯µÄÓ°Ïì½ÏÐ¡£» ¶ø¶ÔÓÚÌØÕ÷Öµ½ÏÐ¡µÄ·½Ïò£¨¦Ëi=¦Ç£©£¬»áÊ¹µÃ²ÎÊý·ÖÁ¿ÊÕËõÖÁ0¸½½ü¡£¶øHµÄÌØÕ÷Öµ´óÐ¡¾ö¶¨²»Í¬²ÎÊý·ÖÁ¿±ä»¯¶ÔÄ¿±êº¯ÊýµÄÓ°Ïì³Ì¶È£¬¶ÔÓÚ²ÎÊý±ä»¯²»»áÒýÆðÄ¿±êº¯ÊýÃ÷ÏÔ±ä»¯µÄ·½Ïò£¨¶ÔÓ¦µÄÌØÕ÷Öµ¦Ëi½ÏÐ¡£©£¬ÕâÐ©Ïà¶Ô²»ÖØÒªµÄ·½ÏòÉÏµÄ·ÖÁ¿ÔÚÑµÁ·¹ý³ÌÖÐÒòÎªÊ¹ÓÃÕýÔò»¯¶ø±»Ë¥¼õ£» ¶ÔÓÚÄÇÐ©²ÎÊý±ä»¯»áÒýÆðÄ¿±êº¯ÊýÇ¿ÁÒ±ä»¯µÄ·½Ïò£¨¦Ëi½Ï´ó£©£¬


Í¼5ª²18L2ÕýÔò»¯¶Ô×îÓÅµãµÄÓ°Ïì

ÕýÔò»¯¶ÔÕâÐ©·½ÏòÉÏµÄ²ÎÊý·ÖÁ¿Ó°ÏìÓÐÏÞ¡£Í¼5ª²18Õ¹Ê¾ÁËL2ÕýÔò»¯µÄÓ°Ïì£¬ÊµÏß±íÊ¾Î´Ê¹ÓÃÕýÔò»¯Ä¿±êº¯ÊýµÄµÈÖµÏß£¬Ô½ÍùÄÚ±íÊ¾Ä¿±êº¯ÊýÖµÔ½Ð¡£¬ÖÐÐÄÊÇÎ´ÕýÔò»¯Ê±µÄ×îÐ¡Öµµã Wª³£» ÐéÏßÎªL2ÕýÔò»¯³Í·£ÏîµÄµÈÖµÏß£¬¶þÕßÏàÇÐµãÎªÊ¹ÓÃÕýÔò»¯ºóÄ¿±êº¯ÊýµÄ×îÐ¡ÖµµãW¡«¡£¿ÉÒÔ¿´µ½£¬¶ÔÄ¿±êº¯ÊýÓ°Ïì½ÏÐ¡µÄ·½ÏòW1£¬ÕýÔò»¯¸ø³öÁËÇ¿ÁÒµÄ³Í·££¬Ê¹µÃW1·½ÏòÊÕËõÖÁ0¸½½ü£¬¶ø¶ÔÄ¿±êº¯ÊýÓ°Ïì½Ï´óµÄ·½ÏòW2Ó°ÏìÏà¶Ô½ÏÐ¡¡£
3. L1ÕýÔò»¯
L1ÕýÔò»¯ÏòÄ¿±êº¯ÊýÒýÈë³Í·£Ïî¦¸¦È=¡¬W¡¬1=¡ÆiWi£¬ÓëL2ÕýÔò»¯µÄÐ§¹û²»Í¬£¬L1ÕýÔò»¯Ê¹µÃÈ¨ÖØ¾ØÕó¾ßÓÐÏ¡ÊèÐÔ¡£½«LÔÚÎ´ÕýÔò»¯Ê±µÄ×îÓÅÖµWª³´¦½øÐÐÒ»½×Ì©ÀÕ¹«Ê½Õ¹¿ªµÃµ½½üËÆµÄµ¼Êý«ýWL=HW£­Wª³£¬Ê¹ÓÃL1ÕýÔò»¯µÄÄ¿±êº¯ÊýÇóµ¼ºó±í´ïÊ½Îª«ýWLReg=HW£­Wª³+¦ÇsignW£¬ÆäÖÐ·ûºÅº¯ÊýsignxÊä³ö¡À1£¨µ±x´óÓÚ0Ê±Êä³ö1£¬·´Ö®Êä³ö-1£©¡£¶ÔÓÚ¸ÃÖÖÐÎÊ½µÄÌÝ¶È±í´ïÊ½£¬ÁîÆäÎª0£¬ÎÞ·¨ÏñL2ÕýÔò»¯Ò»ÑùÖ±½ÓÐ´³ö½âÎö½â¡£½øÒ»²½¼ÙÉèHessian¾ØÕóÊÇ¶Ô½Ç¾ØÕó£¬¼´H=diagH11,¡­,Hnn£¬ÇÒÃ¿¸öÔªËØ¶¼´óÓÚ0£¬¿ÉÒÔÍ¨¹ý¶ÔÊäÈëÊý¾ÝÊ¹ÓÃPCA½øÐÐÔ¤´¦ÀíÊ¹¸ÃÌõ¼þµÃµ½Âú×ã¡£Ö±½Ó¶Ô´øÓÐL1ÕýÔò»¯µÄÄ¿±êº¯ÊýLReg½øÐÐ¶þ½×Ì©ÀÕ¹«Ê½½üËÆ£¬²¢°´ÔªËØ½øÐÐÕ¹¿ª¿ÉµÃ

LReg=L|W=Wª³+¡Æi12HiiWi£­Wª³i2+¦ÇWi£¨5ª²63£©

ÆäÖÐ£¬L|W=Wª³ÎªÎ´ÕýÔò»¯µÄÄ¿±êº¯ÊýÔÚWª³´¦µÄÈ¡Öµ¡£ÏÖÔÚ¶ÔÓÚÈÎÒ»Î¬Wi¶¼¿ÉÒÔÇó³öÊ¹Ä¿±êº¯Êý£¨´øL1ÕýÔò»¯£©×îÐ¡»¯µÄ½âÎö½â¡£

W¡«i=signWª³imaxWª³i£­¦ÇHii,0£¨5ª²64£©

Èç¹ûWª³i¡Ü¦ÇHii£¬ÕýÔò»¯ºó¸Ã·ÖÁ¿W¡«i±»ÍÆÏò0£» ·´Ö®£¬Wª³i>¦ÇHiiÊ±£¬ÕýÔò»¯½«W¡«iÏò0µÄ·½ÏòÍÆ½ø¦ÇHiiµÄ¾àÀë¡£Òò´Ë£¬L1ÕýÔò»¯Ê¹µÃ×îÓÅ½âW¡«¾ßÓÐÏ¡ÊèÐÔ£¬Ê¹µÃÄ³Ð©·ÖÁ¿Îª0¡£Í¼5ª²19Õ¹Ê¾ÁËL1ÕýÔò»¯µÄÓ°Ïì£¬ÐéÏßÎªL1ÕýÔò»¯³Í·£ÏîµÄµÈÖµÏß¡£


Í¼5ª²19L1ÕýÔò»¯¶Ô×îÓÅµãµÄÓ°Ïì

¿ÉÒÔ¿´µ½£¬Ê¹ÓÃL1ÕýÔò»¯µÄÄ¿±êº¯ÊýµÄ×îÐ¡µãW¡«£¬ÔÚË®Æ½Î¬¶ÈÉÏµÄ·ÖÁ¿Îª0¡£L1ÕýÔò»¯´øÀ´µÄÏ¡ÊèÐÔ¿ÉÓÃÓÚÌØÕ÷Ñ¡Ôñ£¨Feature Selection£©£¬¼´´ÓËùÓÐÌØÕ÷ÖÐÑ¡ÔñÓÐÒâÒåµÄÌØÕ÷£¬¼ò»¯»úÆ÷Ñ§Ï°ÎÊÌâ¡£Êµ¼ùÖÐ£¬³ý·Ç½øÐÐÄ£ÐÍÑ¹Ëõ£¬Í¨³£¸üÇãÏòÓÚÊ¹ÓÃL2ÕýÔò»¯£¬Ò²¿ÉÒÔÍ¬Ê±Ê¹ÓÃL1ÕýÔò»¯ºÍL2ÕýÔò»¯£¬ÕâÖÖ·½·¨Ò²½Ð×÷µ¯ÐÔÍøÂçÕýÔò»¯£¨Elastic Net Regularization£©¡£
4. ×î´ó·¶Ê½Ô¼Êø
¶ÔÓÚ´ø³Í·£ÏîµÄÓÅ»¯ÎÊÌâ£¬Êµ¼ÊÉÏ¿ÉÒÔ×ª»¯Îª´øÔ¼ÊøÌõ¼þµÄÓÅ»¯ÎÊÌâ£º ¦Èª³=argmin¦È1N¡ÆNi=1Liyi,fxi;¦È£¬Ô¼ÊøÌõ¼þÎª¦¸¦È¡Ük¡£¦¸¦È´ú±í²»Í¬ÀàÐÍµÄ·¶Êý£¬Òò´Ë¸Ã·½·¨Ò²±»³ÆÎª×î´ó·¶Ê½Ô¼Êø£¨Max Norm Constrains£©£¬¿ÉÒÔÍ¨¹ý¹¹Ôì¹ãÒåLagrangeº¯ÊýÇó½â¡£¸Ã·½·¨Í¨¹ý¶ÔÃ¿¸öÉñ¾­ÔªµÄÈ¨ÖØÏòÁ¿µÄ·¶ÊýÉè¶¨ÉÏÏÞ£¬Ê¹ÓÃÍ¶Ó°ÌÝ¶ÈÏÂ½µÀ´È·±£Ô¼ÊøÌõ¼þµÄÂú×ã£¬ÓÐÑÐ¾¿Ö¤Ã÷Ê¹ÓÃÔ¼ÊøÌõ¼þ±ÈÖ±½ÓÊ¹ÓÃ³Í·£ÏîµÄÐ§¹û»á¸üºÃ¡£¸Ã·½·¨µÄÒ»¸öÓÅµãÊÇ£¬Ê¹ÓÃ½Ï´óµÄÑ§Ï°ÂÊÒ²²»»áµ¼ÖÂÍøÂç³öÏÖÊýÖµ¡°±¬Õ¨¡±µÄÇé¿ö£¬ÒòÎª²ÎÊý¸üÐÂÊ¼ÖÕÊÇ±»Ô¼Êø×ÅµÄ£¬Òò´Ë¿ÉÒÔ¿ìËÙÌ½Ë÷²ÎÊý¿Õ¼ä²¢±£³ÖÒ»¶¨µÄÎÈ¶¨ÐÔ¡£
5.4.3È¨ÖØË¥¼õ
¶ÔÓÚÊ¹ÓÃL2ÕýÔò»¯µÄÄ£ÐÍ£¬ÆäÄ¿±êº¯ÊýÎªLReg=L+¦Ç2¡¬W¡¬22£¬ÆäÖÐLÎªÎ´Ê¹ÓÃÕýÔò»¯µÄËðÊ§º¯Êý£¬¶ÔÆäÇóÌÝ¶ÈµÃµ½±í´ïÊ½«ýWLReg=«ýWL+¦ÇW¡£Ê¹ÓÃÌÝ¶ÈÏÂ½µ·¨Ö´ÐÐ²ÎÊý¸üÐÂ£¬ÔÚÒ»´Îµü´úÖÐ¿ÉµÃW¡ûW£­¦Á¦ÇW+«ýWL£¬ÕûÀí¿ÉµÃW¡û1£­¦Á¦ÇW£­¦Á«ýWL¡£¿ÉÒÔ¿´µ½£¬Ê¹ÓÃL2ÕýÔò»¯»áµ¼ÖÂ¸üÐÂ¹æÔòµÄ¸Ä±ä£¬ÓëÆÕÍ¨ÌÝ¶ÈÏÂ½µ·¨µÄ²ÎÊý¸üÐÂ¹æÔòW¡ûW£­¦Á«ýWL²»Í¬£¬Ê¹ÓÃL2ÕýÔò»¯ºó£¬Ã¿´ÎÊ¹ÓÃÌÝ¶ÈÐÅÏ¢Ö´ÐÐ²ÎÊý¸üÐÂÖ®Ç°£¬ÒªÏÈ¶ÔÀúÊ·²ÎÊýÏòÁ¿½øÐÐÊÕËõ£¬¼´³ËÒÔÒ»¸ö³£ÊýÒò×Ó1£­¦Á¦Ç£¬È»ºóÔÙÏò¸ºÌÝ¶È·½ÏòÇ°½ø½ÏÐ¡µÄÒ»²½¡£ÕýÊÇÓÉÓÚL2ÕýÔò»¯µÄÕâÖÖÌØÐÔ£¬²¿·ÖÎÄÏ×Ò²³ÆL2ÕýÔò»¯ÎªÈ¨ÖØË¥¼õ£¨Weight Decay£©¡£Êµ¼ÊÉÏ£¬È¨ÖØË¥¼õÓÐ¸ü¹ãÒåµÄ¶¨Òå£¬Ö»ÒªÂú×ãÏÂÊ½¼´¿É¡£

W¡û1£­¦ÅW£­¦Á«ýWL£¨5ª²65£©

ÆäÖÐ£¬«ýWLÎªËðÊ§º¯Êý¹ØÓÚWµÄÌÝ¶È£» ¦ÁÓëÆÕÍ¨ÌÝ¶ÈÏÂ½µ·¨µÄº¬ÒåÏàÍ¬£¬ÎªÑ§Ï°ÂÊ£» ¦ÅÎªÈ¨ÖØË¥¼õÏµÊý£¬Í¨³£È¡Öµ½ÏÐ¡¡£Í¨¹ýÒýÈëË¥¼õÏµÊý¦Å£¬ÔÚÃ¿´Î²ÎÊý¸üÐÂÊ±ÏÈ¶Ô²ÎÊý½øÐÐË¥¼õ£¬ÕâÑùµÄ·½·¨¾Í½Ð×÷È¨ÖØË¥¼õ¡£µ±Ê¹ÓÃ±ê×¼ÌÝ¶ÈÏÂ½µ·¨Ê±£¬L2ÕýÔò»¯ÓëÈ¨ÖØË¥¼õµÄÐ§¹ûÏàÍ¬£¬Ë¥¼õÏµÊýÎª¦Å=¦Á¦Ç¡£Òò´Ë£¬ÔÚÒ»Ð©Éî¶ÈÑ§Ï°¿ò¼ÜÖÐ£¬È¨ÖØË¥¼õÍ¨³£Í¨¹ýL2ÕýÔò»¯À´ÊµÏÖ£¬µ«ÊÇÔÚÆäËû¸´ÔÓµÄÓÅ»¯·½·¨ÀýÈçAdam·½·¨ÖÐ£¬¶þÕß²¢²»µÈ¼Û¡£
5.4.4ÌáÇ°Í£Ö¹
¡°ÌáÇ°Í£Ö¹¡±ÊÇÒ»ÖÖ¼òµ¥ÓÐÐ§µÄÕýÔò»¯·½·¨£¬²¢ÇÒÔÚÑµÁ··¢Éú´íÎóÊ±£¬¿ÉÒÔ×÷ÎªÒ»ÖÖÓÐÐ§·ÀÖ¹×ÊÔ´ÀË·ÑµÄ»úÖÆ¡£µ±Ê¹ÓÃÉî²ãÉñ¾­ÍøÂçÕâÀà¾ßÓÐÇ¿´ó±íÊ¾ÄÜÁ¦µÄÍøÂçÊ±£¬³£³£»á·¢Éú¹ýÄâºÏÏÖÏó£¬¶øÍ¨¹ý¼à²âÑµÁ·¹ý³ÌµÄÑ§Ï°ÇúÏß£¬ÄÜ¹»ÈÝÒ×µØÅÐ¶ÏÄ£ÐÍ·¢Éú¹ýÄâºÏµÄÊ±¼äµã²¢¼°Ê±Í£Ö¹ÑµÁ·£¬¼òµ¥È´ÓÐÐ§µØ¶ôÖÆ¹ýÄâºÏÇé¿öµÄ·¢Éú£¬Í¬Ê±±ÜÃâ×ÊÔ´µÄÀË·Ñ¡£Ñ§Ï°ÇúÏßÖ¸ÑµÁ·¼¯Îó²îºÍÑéÖ¤¼¯Îó²îËæµü´ú´ÎÊýµÄ±ä»¯ÇúÏß£¬ÌåÏÖÁËËùÑµÁ·Ä£ÐÍµÄ±íÊ¾ÄÜÁ¦ËæÑµÁ·´ÎÊýÔö¼ÓµÄ±ä»¯Çé¿ö¡£Êµ¼ùÖÐ¼à²âÑ§Ï°ÇúÏßÊ±£¬Í¨³£»á¿´µ½ÕâÑùÒ»ÖÖÇéÐÎ£º ÑµÁ·Îó²îËæ×ÅÊ±¼ä£¨»òµü´ú´ÎÊý£©²»¶Ï½µµÍ£¬¶øÑéÖ¤Îó²î»áÔÚÇ°ÆÚÏÂ½µ£¬µ½Ä³Ò»¸ö½ÚµãºóÓÖ¿ªÊ¼ÉÏÉý£¬×ÜÌå³ÊÏÖUÐÎÇúÏß£¬ÈçÍ¼5ª²20ËùÊ¾¡£Í¨¹ý·ÖÎöÑ§Ï°ÇúÏß¿ÉÖª£¬ÔÚÑµÁ·µÄÇ°°ë¶Î£¬ÑµÁ·Îó²îºÍ²âÊÔÎó²î¶¼±È½Ï¸ß£¬Òò´ËÄ£ÐÍ´¦ÓÚÇ·ÄâºÏ×´Ì¬£» ¶øµ½ºóÆÚ£¬ÑµÁ·Îó²îÇ÷ÓÚÎÈ¶¨½Ó½üÓÚ0£¬µ«²âÊÔÎó²î±È½Ï¸ß£¬Òò´ËÑµÁ·Îó²îÓë²âÊÔÎó²îÖ®¼äµÄ²î¾à±È½Ï´ó£¬·¢Éú¹ýÄâºÏÏÖÏó¡£Òò´Ë£¬¿ÉÒÔÅÐ¶Ï×îÓÅµÄÊ±¿ÌÓ¦¸ÃÊÇÄ³Ò»ÖÐ¼äÊ±¿Ì£¬ÑµÁ·Îó²î´ËÊ±ÒÑ¾­ÎÈ¶¨£¬¶ø²âÊÔÎó²î×îÐ¡£¬ÀíËùµ±È»µÄÏë·¨¾ÍÊÇÔÚ´Ë¿ÌÍ£Ö¹ÑµÁ·£¬¿ÉÒÔ»ñµÃ×îÓÅ¸´ÔÓ¶ÈµÄÄ£ÐÍ¡£


Í¼5ª²20L2ÑµÁ·Îó²î¡¢²âÊÔÎó²îÓëÇ·ÄâºÏ¡¢¹ýÄâºÏÖ®¼äµÄ¹ØÏµ



¡°ÌáÇ°Í£Ö¹¡±²ßÂÔµÄ¾ßÌå²Ù×÷¹ý³Ì£º ·ÖÀëÑµÁ·¼¯ºÍÑéÖ¤¼¯£¬¶ÔÍøÂç½øÐÐËæ»ú³õÊ¼»¯²¢¿ªÊ¼ÑµÁ·£¬Ã¿¸ôÒ»¶¨Ê±¼ä¶Ôµ±Ç°ÑµÁ·ºÃµÄÄ£ÐÍÔÚÑéÖ¤¼¯ÉÏ½øÐÐÆÀ¹À£¬²¢±£Áôµ½Ä¿Ç°ÎªÖ¹Ê¹ÑéÖ¤¼¯Îó²î×îÐ¡µÄÄ£ÐÍ²ÎÊý¡£Èç¹ûÑéÖ¤¼¯Îó²îÔÚÖ¸¶¨µÄÑ­»·´ÎÊýÄÚÃ»ÓÐ½øÒ»²½½µµÍ¾ÍÍ£Ö¹ÑµÁ·£¬²¢Êä³öÑéÖ¤¼¯Îó²î×îÐ¡Ê±µÄÄ£ÐÍ²ÎÊýÅäÖÃ¡£Ê¹ÓÃ¡°ÌáÇ°Í£Ö¹¡±¿ÉÒÔ»ñµÃÊ¹ÑéÖ¤¼¯Îó²î×îÐ¡Ê±¿ÌµÄÄ£ÐÍ£¬¸üÓÐÏ£Íû»ñµÃ¸üµÍµÄ²âÊÔÎó²î£¬¾ßÓÐ¸üºÃµÄ·º»¯ÄÜÁ¦¡£¡°ÌáÇ°Í£Ö¹¡±×÷ÎªÒ»ÖÖÒþÊ½µÄÕýÔò»¯·½·¨£¬¶ÔÕû¸ö¶¯Ì¬ÑµÁ·¹ý³ÌÃ»ÓÐÈÎºÎÓ°Ïì£¬¼ÈÃ»ÓÐ¸Ä±äÄ¿±êº¯ÊýÒ²Ã»ÓÐ¸Ä±äÍøÂç½á¹¹£¬Ö»ÐèÒª¶¨ÆÚ¶ÔÄ£ÐÍ½øÐÐÆÀ¹À£¬²¢ÇÒ±£´æ×î¼ÑµÄÄ£ÐÍ²ÎÊýÅäÖÃ¡£ÕâÐ©¹ý³Ì¿ÉÒÔ²¢ÐÐ»¯£¬¶ÔÑµÁ·¹ý³Ì²úÉúµÄÓ°ÏìÉõÎ¢¡£ÁíÍâ£¬¡°ÌáÇ°Í£Ö¹¡±¿ÉÒÔÓëÆäËûÕýÔò»¯²ßÂÔ½áºÏÊ¹ÓÃ£¬¸ü´óÏÞ¶ÈµØÌáÉýÄ£ÐÍµÄ·º»¯ÄÜÁ¦¡£
ÓëÆäËûÕýÔò»¯·½·¨Ïà±È£¬¡°ÌáÇ°Í£Ö¹¡±´æÔÚµÄÒ»¸öÈ±µãÊÇ£¬ÐèÒª·ÖÀë²¿·ÖÊý¾Ý×÷ÎªÑéÖ¤¼¯¡£Õâ»á¼õÉÙ¿ÉÒÔÓÃÓÚÑµÁ·µÄÊý¾Ý£¬ÀíÏëµÄÇé¿öÊÇÊ¹ÓÃ¾¡¿ÉÄÜ¶àµÄÊý¾ÝÓÃÓÚÄ£ÐÍµÄÑµÁ·¡£ÎªÁËÄÜ¹»³ä·ÖÀûÓÃÕâ²¿·Ö·ÖÀë³öÈ¥µÄÊý¾Ý£¬¿ÉÒÔ²ÉÓÃ¶þ´ÎÑµÁ·£¬¼´ÔÚµÚÒ»ÂÖÑµÁ·ÖÐÊ¹ÓÃ¡°ÌáÇ°Í£Ö¹¡±ºó£¬ÔÙ½«ËùÓÐÊý¾ÝÓÃÓÚ¶þ´ÎÑµÁ·¹ý³Ì¡£µÚ¶þÂÖÑµÁ·ÓÐÁ½ÖÖ²ßÂÔ¿ÉÒÔÊ¹ÓÃ£º Ò»ÖÖ·½·¨ÊÇÔÙ´Î³õÊ¼»¯ÍøÂç£¬È»ºóÊ¹ÓÃÈ«²¿Êý¾Ý¼¯½øÐÐÑµÁ·£¬²¢ÔÚÈ·¶¨µÄÑµÁ·´ÎÊýºóÍ£Ö¹£¬ÕâÀïÈ·¶¨µÄÑµÁ·´ÎÊýÊÇÖ¸µÚÒ»ÂÖÑµÁ·ÖÐÊ¹ÑéÖ¤¼¯Îó²î×îÐ¡Ê±µÄÑµÁ·´ÎÊý£» ÁíÍâÒ»ÖÖ·½·¨ÊÇ£¬Ê¹ÓÃµÚÒ»ÂÖÑµÁ·µÃµ½µÄÄ£ÐÍ²¢ÔÚ´Ë»ù´¡ÉÏÊ¹ÓÃÈ«²¿Êý¾Ý¼ÌÐø½øÐÐÑµÁ·¡£
¡°ÌáÇ°Í£Ö¹¡±¾ßÓÐÕýÔò»¯Ð§¹û£¬¿ÉÒÔÕâÑù½âÊÍ£º ½«Ñ§Ï°ÂÊ¦ÁºÍµü´ú´ÎÊý¦ÓµÄ³Ë»ý¿´×÷È¨ÖØË¥¼õÏµÊý¦ÅµÄµ¹Êý£¬¼´¦Á¦Ó¡Ö1¦Å£¬Ê¹ÓÃ¹Ì¶¨µÄÑ§Ï°ÂÊµü´úÓÅ»¯¦Ó´Î£¬Ïàµ±ÓÚ½«²ÎÊý¿Õ¼äÏÞÖÆÔÚ³õÊ¼²ÎÊýµÄÐ¡ÁÚÓòÖÐ¡£¿ÉÒÔÖ¤Ã÷£¬Ê¹ÓÃ¶þ´ÎÎó²îº¯ÊýµÄ¼òµ¥ÏßÐÔÄ£ÐÍ£¬µ±Ê¹ÓÃÆÕÍ¨ÌÝ¶ÈÏÂ½µËã·¨Ê±£¬ÌáÇ°ÖÕÖ¹Ïàµ±ÓÚL2ÕýÔò»¯¡£ÈçÍ¼5ª²21ËùÊ¾£¬ÊµÏß±íÊ¾¶þ´ÎÎó²îº¯ÊýµÄµÈÖµÏß£¬×ó²àÐéÏß±íÊ¾ÆÕÍ¨ÌÝ¶ÈÏÂ½µËã·¨Ö´ÐÐ²ÎÊý¸üÐÂµÄÂ·Ïß£¬W¡«ÎªÊ¹ÓÃ¡°ÌáÇ°Í£Ö¹¡±È·¶¨µÄ²ÎÊýÈ¡Öµ¡£¿ÉÒÔ¿´µ½£¬¡°ÌáÇ°Í£Ö¹¡±·½·¨ÖÐ£¬ÔÚ¹ì¼£½ÏÔçµÄµã´¦¾ÍÍ£Ö¹ÁËÑµÁ·¹ý³Ì£» ÓÒ²àÐéÏßÎªL2³Í·£ÏîµÄµÈÖµÏß£¬ÊÇ²»Í¬Ö±¾¶µÄÍ¬ÐÄÔ²£¬ÐéÏßÓëÊµÏÖÏàÇÐµÄµãÎªÍ¨¹ýL2ÕýÔò»¯È·¶¨µÄ×îÓÅÖµW¡«¡£¶Ô±È×óÓÒÍ¼¿ÉÒÔ¿´³ö£¬¶þÕßµÄÐ§¹ûÊÇÒ»ÑùµÄ¡£Êµ¼ùÖÐ£¬¡°ÌáÇ°Í£Ö¹¡±±ÈÈ¨ÖØË¥¼õ¸üÓÐÓÅÊÆ£¬ÒòÆä²»ÐèÒª¶Ô¶à¸ö³¬²ÎÊýÖµ£¨Ë¥¼õÏµÊý¦Å£©½øÐÐÊµÑé£¬ÄÜÒ»²½µ½Î»µØÈ·¶¨ºÏÊÊµÄÕýÔò»¯³Ì¶È¡£


Í¼5ª²21¡°ÌáÇ°Í£Ö¹¡±ÓëL2ÕýÔò»¯µÄÐ§¹û¶Ô±È


5.4.5Êý¾ÝÔöÇ¿
ÖÚËùÖÜÖª£¬Éî¶ÈÑ§Ï°ÒÀ¿¿´óÊý¾ÝÇý¶¯²ÅµÃÒÔÑ¸ËÙ·¢Õ¹¡£Éî¶ÈÑ§Ï°Ä£ÐÍµÄ¸´ÔÓ¶ÈÒÔ¼°¹æÄ££¬¾ö¶¨ÁË±ØÐëÓÐ³ä·Ö¶àµÄÊý¾Ý²ÅÄÜÑµÁ·³ö·º»¯ÐÔÄÜÁ¼ºÃµÄÄ£ÐÍ£¬Ê¹ÓÃ¸ü¶à¸ßÖÊÁ¿µÄÊý¾Ý½øÐÐÑµÁ·×ÜÄÜµÃµ½¸üºÃµÄÐ§¹û£¬Òò´ËÔö¼ÓÑµÁ·Êý¾ÝÁ¿ÊÇÌáÉýÄ£ÐÍ·º»¯ÄÜÁ¦×îÖ±½ÓµÄ·½·¨¡£µ«ÊÇ£¬Ä³Ð©Çé¿öÏÂÊý¾ÝÁ¿ÓÐÏÞ£¬¿ÉÒÔÊ¹ÓÃÊý¾ÝÔöÇ¿£¨Data Augmentation£©¼¼ÊõÉú³ÉÐÂµÄÊý¾ÝÌí¼ÓÖÁÑµÁ·¼¯ÖÐÒÔÀ©´óÊý¾ÝÁ¿¡£¼´Ê¹Êý¾Ý¼¯¹æÄ£×ã¹»´ó£¬Ò²¿ÉÄÜ²»ÄÜ¸²¸ÇÈ«²¿³¡¾°£¬ÀýÈçÍ¼ÏñÊý¾Ý¿ÉÄÜ²»ÄÜÍêÈ«º­¸Ç²»Í¬µÄÊÓ½Ç¡¢²»Í¬µÄ¹âÏßÕÕÉäµÈÇé¿ö£¬Ê¹µÃÑµÁ·³öµÄÄ£ÐÍ¶ÔÑµÁ·¼¯ÖÐÎ´³öÏÖ¹ýµÄ³¡¾°·º»¯ÐÔ²»Ç¿¡£ÁíÍâ£¬Ä³Ð©Êý¾ÝµÄ²É¼¯¼°´¦Àí¿ÉÄÜÀ§ÄÑ¶È¼«¸ß£¬ÐèÒª¸ß°ºµÄ³É±¾£¬Ê¹ÓÃÊý¾ÝÔöÇ¿¼¼Êõ×Ô¶¯Éú³ÉÑµÁ·Êý¾Ý£¬¿ÉÒÔ½µµÍ»ñÈ¡Êý¾ÝµÄÑ¹Á¦¡£×ÛÉÏËùÊö£¬Ê¹ÓÃÊý¾ÝÔöÇ¿¼¼Êõ¿ÉÒÔÀ©´óÊý¾Ý¼¯¹æÄ££¬Ê¹Éñ¾­ÍøÂçÑ§Ï°µ½²»Ïà¹ØµÄÄ£Ê½£¬Ìá¸ßÄ£ÐÍ½¡×³ÐÔ£¬·ÀÖ¹¹ýÄâºÏ¡£
Êý¾ÝÔöÇ¿¼¼Êõ×î³£Ó¦ÓÃÓÚÍ¼ÏñÊ¶±ðÎÊÌâÖÐ£º Ã¿¸öÑµÁ·Ñù±¾¶¼ÊÇÒ»¸öÊý¾Ýµã¶Ôx,y£¬ÆäÖÐxÊÇÍ¼Æ¬£¬yÊÇ±êÇ©£¬¼´Í¼Æ¬ËùÊôµÄÀà¡£Ö»Òª¶ÔÔ­Ê¼Í¼Æ¬½øÐÐÒ»ÏµÁÐ²Ù×÷ºÍ×ª»¯¶ø²»¸Ä±ä±êÇ©£¬¾Í¿ÉÒÔÉú³ÉÐÂµÄÊý¾Ýµã¶Ôx¡ä,y¡£Ó¦ÓÃÓÚÍ¼ÏñµÄ²»¸Ä±ä±êÇ©µÄ×ª»»²Ù×÷ÓÐºÜ¶à¡£
£¨1£© Æ½ÒÆ£¨shift£©£º ½«Í¼ÏñÑØË®Æ½»òÕß´¹Ö±·½ÏòÒÆ¶¯Èô¸É¸öÏñËØ¡£
£¨2£© Ðý×ª£¨rotation£©£º ½«Í¼ÏñË³Ê±Õë»òÕßÄæÊ±ÕëÐý×ªÒ»¶¨½Ç¶È¡£
£¨3£© Ëõ·Å£¨zoom In/Out£©£º ±£³ÖÍ¼ÏñµÄ±ÈÀý½øÐÐÕûÌåµÄ·Å´ó»òÕßËõÐ¡¡£
£¨4£© ·­×ª£¨flip£©£º ½«Í¼ÏñÑØË®Æ½»ò´¹Ö±·½Ïò½øÐÐ·­×ª¡£
£¨5£© ²Ã¼ô£¨clip£©£º ½«Í¼ÏñËæ»ú²Ã¼ô³ÉÈÎÒâ´óÐ¡¡£
³ýÁËÒÔÉÏ·½·¨Íâ£¬»¹ÓÐ¸÷ÖÖ·ÂÉäÀà±ä»»¡¢ÊÓ¾õ±ä»»µÈ¡£ÒÔÉÏ·½·¨ÊôÓÚ¿Õ¼ä¼¸ºÎ±ä»»·½·¨£¬Ò²¿ÉÒÔ¶ÔÏñËØÑÕÉ«½øÐÐ±ä»»£¬ÀýÈçÌí¼ÓÔëÉùÒÔ¼°Ä£ºý²Ù×÷¡£Ó¦ÓÃÕâÐ©×ª»»²Ù×÷Ê±±ØÐë×¢Òâ£¬²»ÄÜ¸Ä±äÍ¼ÏñµÄÀà±ð¡£ÀýÈç£¬ÔÚ¹âÑ§×Ö·ûÊ¶±ð£¨Optical Character Recognition£¬OCR£©ÈÎÎñÖÐ£¬ÐèÒª´ÓÊäÈëµÄÍ¼ÏñÖÐÊ¶±ð³ö¶ÔÓ¦µÄ¹âÑ§×Ö·û£¬ÕâÖÖÇéÐÎÏÂ£¬Ë®Æ½·­×ªºÍÐý×ª180¡ãÕâÁ½ÖÖ×ª»»²Ù×÷¾Í²»ÊÊÓÃ£¬ÒòÎªË®Æ½·­×ª»á½«×Ö·û¡°b¡±±äÎª¡°d¡±£¬Ðý×ª180¡ã»á½«×Ö·û¡°6¡±±äÎª¡°9¡±¡£Òò´Ë£¬¶Ô²»Í¬µÄÈÎÎñÑ¡ÔñºÏÊÊµÄ×ª»»²Ù×÷¡£
²»½öÍ¼ÏñÊý¾Ý¿ÉÒÔÓ¦ÓÃÊý¾ÝÔöÇ¿¼¼Êõ£¬ÎÄ±¾Êý¾ÝÏàÓ¦µÄÒ²ÓÐÒ»ÏµÁÐÊý¾ÝÔöÇ¿·½·¨£¬ÀýÈçËæ»úÉ¾³ý¡¢´òÂÒ´ÊÐò¡¢Í¬Òå´ÊÌæ»»¡¢»ØÒë¡¢ÎÄµµ²Ã¼ôµÈ¡£Êý¾ÝÔöÇ¿¼¼ÊõÒ²¿ÉÒÔÓ¦ÓÃÓÚÓïÒôÊ¶±ðÈÎÎñ£¬ÀýÈç¿ÉÒÔÍ¨¹ýÏòÊäÈë²ã×¢ÈëÔëÉùÀ´ÊµÏÖÊý¾ÝÔöÇ¿¡£¸ü¸ß¼¶µÄÊý¾ÝÔöÇ¿²ßÂÔ¿ÉÓÃÓÚÉú³É¶Ô¿¹ÍøÂç£¬ÀýÈç¿ÉÒÔÓÃÀ´Éú³ÉÐÂµÄÍ¼Ïñ£¬Ò»Ð©·½·¨¿ÉÄÜÒ²ÊÊÓÃÓÚÎÄ±¾Êý¾Ý¡£
ÔÚ²»Í¬µÄÈÎÎñÖÐ£¬ÏòÉñ¾­ÍøÂçµÄÊäÈë²ã×¢ÈëÔëÉù»òÕßÒýÈëËæ»úÐÔ±»¿´×÷ÊÇÊý¾ÝÔöÇ¿µÄÒ»ÖÖ·½Ê½¡£Í¨¹ý¶ÔÊäÈë²ãÌí¼ÓËæ»úÔëÉùÔÙ½øÐÐÑµÁ·£¬ÄÜ¹»½µµÍÄ£ÐÍ¶ÔÔëÉùµÄÃô¸ÐÐÔ£¬ÌáÉýÄ£ÐÍ½¡×³ÐÔ¡£Êµ¼ÊÉÏ£¬²»½öÊÇÊäÈë²ã£¬ÏòÖÐ¼äÒþ²Ø²ã»òÕßÊä³ö²ãÌí¼ÓÔëÉù¶¼ÊÇ¿ÉÐÐµÄ£¬¶ÔÓ¦ÓÚºóÃæ½«Òª½éÉÜµÄDropout·½·¨ºÍ±êÇ©Æ½»¬·½·¨£¬ÒÔ¼°¾í»ýÍøÂçÖÐµÄËæ»ú³Ø»¯£¨Stochastic Pooling£©¡£Õâ¼¸ÖÖ·½·¨¶¼·ûºÏÒ»¸ö·¶Ê½£¬¼´ÔÚÑµÁ·½×¶ÎÒýÈëÔëÉù»òÕßËæ»úÐÔ£¬È»ºóÔÚ²âÊÔ½×¶ÎÏû³ýÕâÖÖ²»È·¶¨ÐÔ¡£ÀýÈç£¬Ê¹ÓÃÊý¾ÝÔöÇ¿¼¼ÊõÒÔÄ³ÖÖ·½Ê½±ä»»Í¼Ïñ²¢±£³Ö±êÇ©²»±ä£¬¼ÙÉèÕâÖÖ±ä»»ÎªËæ»ú²Ã¼ô²»Í¬´óÐ¡µÄÍ¼Ïñ£¬È»ºó´úÌæÔ­Ê¼Í¼Ïñ½øÐÐÑµÁ·£¬²âÊÔÖÐÔò»áÍ¨¹ýÆÀ¹ÀÄ³Ð©¹Ì¶¨µÄ²Ã¼ôÍ¼Ïñ»òÕß¶Ô²»Í¬µÄ²Ã¼ôÍ¼ÏñÈ¡Æ½¾ùÀ´µÖÏûÕâÖÖËæ»úÐÔ¡£ÑµÁ·Ê±£¬Ö»Ðè½«Ëæ»ú×ª»»Ó¦ÓÃÓÚÊäÈëÊý¾Ý£¬ÕâÖÖ·½Ê½¶ÔÍøÂçÓÐÕýÔò»¯Ð§¹û¡£
5.4.6¶ªÆú·¨
¶ªÆú·¨£¨Dropout£©ÊÇÒ»ÖÖÔÚÑµÁ·Éñ¾­ÍøÂçÊ±£¬ÒÔ¸ÅÂÊ1£­p¶ªÆú²¿·ÖÉñ¾­ÔªµÄ·½·¨¡£Dropout×÷ÎªÒ»ÖÖ¼òµ¥È´¼«ÆäÓÐÐ§µÄÕýÔò»¯·½·¨£¬ÓÉSrivastavaÌá³ö£¬¸Ã·½·¨¿ÉÒÔÓëL1ÕýÔò»¯¡¢L2ÕýÔò»¯ÒÔ¼°×î´ó·¶Ê½Ô¼ÊøµÈÆäËûÕýÔò»¯·½·¨½áºÏÊ¹ÓÃ¡£
DropoutµÄ¾ßÌå²Ù×÷Á÷³Ì£º ÔÚÃ¿´Îµü´ú½øÐÐÇ°Ïò´«²¥Ê±£¬¶ÔÓÚËùÓÐµÄÊäÈëºÍÒþ²Øµ¥Ôª¶¼Ëæ»ú²ÉÑùµÃµ½Ò»¸ö¶ÔÓ¦µÄ¶þÖµÑÚÂë£¬¸Ã¶þÖµÑÚÂëm¡Ê0,1dÊÇ´Ó²ÎÊýÎªpµÄ²®Å¬Àû·Ö²¼ÖÐ²ÉÑùµÃµ½µÄ£¬²»Í¬µ¥ÔªµÄÑÚÂëÊÇ¶ÀÁ¢²ÉÑùµÄ¡£ÑÚÂëÎª1µÄµ¥Ôª±»±£ÁôÏÂÀ´£¬ÑÚÂëÎª0µÄµ¥Ôª±»¶ªÆú¡£DropoutÊÇÖð²ã½øÐÐµÄ¡£Ê×ÏÈ£¬½«ÊäÈëxÓëÊäÈëµ¥ÔªµÄÑÚÂëÏà³Ë£¬Ê¹µÃ²¿·ÖÊäÈëµ¥Ôª±»ÖÃ0¡£È»ºó£¬¼ÌÐøÏòÇ°´«²¥£¬Ã¿¾­¹ýÒ»²ãÏÈ¼ÆËã³ö¸Ã²ãµÄÊä³öÖµÓë¶ÔÓ¦µÄµ¥ÔªÑÚÂëÏà³Ë£¬Òò´ËÃ¿²ã¶¼ÓÐ²¿·ÖÒþ²Øµ¥Ôª±»Ëæ»úÖÃ0¡£µ±Ç°Ïò´«²¥Íê³Éºó£¬ÓÉÓÚ²¿·ÖÉñ¾­Ôª±»¶ªÆú£¬ÍøÂç¹æÄ£»áËõÐ¡£¬±ä³ÉÔ­Ê¼ÍøÂçµÄÒ»¸ö×ÓÍøÂç£¬ÈçÍ¼5ª²22ËùÊ¾£¬È»ºóÔÚ×ÓÍøÂçÖÐ½øÐÐ·´Ïò´«²¥²¢¸üÐÂ²ÎÊý¾ØÕó¡£×¢Òâ£¬Ã¿´Îµü´úÇ°Ïò´«²¥Éñ¾­Ôª¶¼ÒªÒÔ¸ÅÂÊp¶ÔÑÚÂë½øÐÐ²ÉÑù£¬Òò´ËÃ¿´Îµü´ú±»¶ªÆúµÄÉñ¾­Ôª¶¼²»ÊÇÏàÍ¬µÄ£¬Òò¶øÊµ¼ÊÉÏÃ¿´Îµü´ú¶¼ÊÇÔÚÑµÁ·´ÓÔ­Ê¼ÍøÂç³éÑùµÃµ½µÄÒ»¸ö×ÓÍøÂç£¬²¢ÇÒÖ»¸üÐÂ×ÓÍøÂç¶ÔÓ¦²¿·ÖµÄ²ÎÊý¼¯£¬Ê£Óà²¿·ÖµÄ²ÎÊýÈÔ±£³Ö¡£Òò´Ë£¬ÕâÐ©×ÓÍøÂçÖ®¼äÊÇ¹²Ïí²ÎÊýµÄ¡£¶ÔÓÚÉÏÎÄÖÐµÄ±£Áô¸ÅÂÊp£¨¶ªÆú¸ÅÂÊÎª1£­p£©£¬Í¨³£¶ÔÊäÈëµ¥ÔªºÍÒþ²Øµ¥ÔªÊÇ²»Í¬µÄ£¬ÊäÈëµ¥ÔªÒ»°ãÉèÖÃÎª0.8£¬¾¡¿ÉÄÜ±£Áô½Ï¶àµÄÊäÈë£¬Ê¹µÃÊäÈë±ä»¯²»»áÌ«´ó£» ¶øÒþ²Øµ¥ÔªµÄ±£Áô¸ÅÂÊÒ»°ãÉèÖÃÎª0.5£¬ÕâÑùÉú³ÉµÄÍøÂçÓÐ×î´óµÄËæ»úÐÔ¡£²»¿¼ÂÇÊäÈëµ¥Ôª£¬¶ÔÓÚº¬ÓÐn¸öÒþ²Øµ¥ÔªµÄÉñ¾­ÍøÂç£¬Í¨¹ýDropoutÉú³ÉµÄ×ÓÍøÂç×Ü¹²ÓÐ2n¸ö£¬Èç¹ûÔ­Ê¼ÍøÂçºÜÅÓ´ó£¬ÄÇÃ´Í¨¹ý²ÉÑù»ñµÃµÄ×ÓÍøÂçÊýÁ¿¾ßÓÐÖ¸Êý¼¶±ð¡£


Í¼5ª²22Éñ¾­ÍøÂçÊ¹ÓÃDropoutÇ°ºó¶Ô±È



Dropout¿ÉÒÔ¿´×÷ÔÚµ¥Ò»Ä£ÐÍÖÐ½øÐÐ¼¯³ÉÑ§Ï°£¬DropoutÖÐËùÓÐ×ÓÍøÂç¶¼²»¶ÀÁ¢£¬¶øÊÇÍ¨¹ý¼Ì³Ð¸¸ÍøÂç²ÎÊýµÄ²»Í¬×Ó¼¯À´¹²Ïí²ÎÊý¡£ÁíÍâ£¬ÓÉÓÚ×ÓÍøÂçÊýÁ¿¾Þ´ó£¬Ã¿¸ö³éÑùµÃµ½µÄ×ÓÍøÂç¶¼Ã»ÓÐ¾­¹ýÍêÈ«µÄÑµÁ·£¬Ã¿´Îµü´úÖÐ½öÑµÁ·Ò»¸ö×ÓÍøÂç£¬²ÎÊý¹²ÏíÊ¹µÃÆäÓà×ÓÍøÂçÒ²ÓÐÁ¼ºÃµÄ²ÎÊýÉè¶¨£¬Òò´Ë×îÖÕÑµÁ·µÃµ½µÄÍøÂç¿ÉÒÔÊÓÎª¼¯³ÉÁËÊýÁ¿ÎªÖ¸Êý¼¶±ðµÄ²»Í¬×ÓÍøÂçµÄ¼¯³ÉÄ£ÐÍ¡£
Ä£ÐÍÑµÁ·Íê³Éºó£¬ÎªÏû³ýÑµÁ·Ê±ÒýÈëµÄËæ»úÐÔ£¬ÔÚ²âÊÔ½×¶Î²¢²»Ê¹ÓÃDropout¡£ÒòÎª²âÊÔ½×¶Î¶ÔÑù±¾µÄÔ¤²âÐèÒªÓÐÒ»¸öÈ·¶¨µÄ½á¹û£¬Èç¹û±£ÁôÕâÖÖËæ»úÐÔ£¬ÄÇÃ´¿ÉÄÜÊ¹ÓÃÍ¬Ò»²âÊÔÑù±¾½øÐÐÁ½´Î²âÊÔ£¬¶øÄ£ÐÍ¿ÉÄÜ»á¸ø³ö²»Ò»ÑùµÄ½á¹û¡£ÓÉÓÚÔÚÑµÁ·¹ý³ÌÖÐÊ¹ÓÃÁËDropout¶ø²âÊÔ½×¶ÎÎ´Ê¹ÓÃ£¬¶ÔÓÚÈÎÒ»Éñ¾­Ôª£¬»áµ¼ÖÂÊä³öµÄÆÚÍûÖµÔÚÑµÁ·½×¶ÎºÍ²âÊÔ½×¶Î²»Ò»ÖÂ¡£ÀýÈç£¬¶ÔÓÚÄ³Ò»Éñ¾­ÔªµÄ¼¤»îÖµx£¬Ê¹ÓÃDropoutÓë¶þÖµÑÚÂëÏà³Ëºó£¬¸ÃÉñ¾­ÔªµÄÆÚÍûÊä³öÎªpx+1£­p0£¬ÒÔ1£­pµÄ¸ÅÂÊÊä³öÎª0£¬ÒÔpµÄ¸ÅÂÊÖ±½ÓÊä³ö¡£²âÊÔ½×¶ÎÉñ¾­Ôª×ÜÊÇ¼¤»îµÄ£¬Òò´ËÆÚÍûÊä³ö×ÜÎªx¡£ÎªÁË±£Ö¤ÑµÁ·½×¶ÎÓë²âÊÔ½×¶ÎÊä³öµÄÆÚÍûÖµÒ»ÖÂ£¬ÐèÒªÔÚ²âÊÔ½×¶Î½«¸Ãµ¥ÔªÉñ¾­ÔªµÄÈ¨ÖØ³ËÒÔµ¥ÔªµÄ±£Áô¸ÅÂÊp£¬´Ó¶øÊ¹µÃÆÚÍûÊä³öÓÉx±äÎªpx£¬Ö¸µ¼ÕâÖÖÐÞ¸ÄµÄ×¼Ôò±»³ÆÎªÈ¨ÖØ±ÈÀýÍÆ¶Ï¹æÔò£¨Weight Scaling Inference Rule£©¡£¾­ÑéÖ¤Ã÷£¬ÕâÖÖ½üËÆÍÆ¶Ï¹æÔòÔÚÉñ¾­ÍøÂçÉÏ±íÏÖÁ¼ºÃ¡£Êµ¼ùÖÐ£¬ÎªÌáÉý²âÊÔ½×¶ÎµÄÐ§ÂÊ£¬±ÜÃâÔÚ²âÊÔ½×¶Î¸ù¾Ý¸ÅÂÊp¶ÔÉñ¾­ÔªµÄ¼¤»îÖµ½øÐÐÊýÖµµ÷Õû£¬³£ÓÃµÄÒ»ÖÖ¼¼ÇÉÊÇÔÚ²âÊÔÊ±²»×öÈÎºÎ´¦Àí£¬¶øÔÚÑµÁ·½×¶Î³ýÒÔ±£Áô¸ÅÂÊpÒÔ½øÐÐÊýÖµµ÷Õû£¬ÕâÖÖ·½·¨½Ð×÷·´ÏòËæ»ú¶ªÆú£¨Inverted Dropout£©¡£±ÈÆðÆÕÍ¨µÄDropout£¬¸Ã·½·¨µÄÒ»¸öºÃ´¦ÔÚÓÚ£¬ÎÞÂÛÊÇ·ñÊ¹ÓÃËæ»ú¶ªÆú£¬Ô¤²â½×¶ÎµÄ´úÂë¶¼¿ÉÒÔ±£³Ö²»±ä¡£
SrivastavaµÈÈËÔÚÂÛÎÄÖÐ±íÊ¾£¬DropoutÊÇÒ»ÖÖ·Ç³£ÓÐÐ§µÄÕýÔò»¯·½·¨¡£ÆäÏÔÖøÓÅµãÊÇ¼ÆËã·½±ã£¬Ö»ÐèÔÚÃ¿´Îµü´úÊ±Ëæ»ú³éÑùÉú³Én¸ö¶þÖµÑÚÂëÓëÉñ¾­ÔªÏà³Ë£» ÁíÍâÒ»¸öÓÅµãÊÇ£¬Dropout¼¸ºõÔÚËùÓÐÊ¹ÓÃ·Ö²¼Ê½±íÊ¾²¢ÇÒ²ÉÓÃÌÝ¶ÈÏÂ½µËã·¨ÑµÁ·µÄÄ£ÐÍÉÏ¶¼±íÏÖÁ¼ºÃ¡£³ý´ËÖ®Íâ£¬Dropout»¹¿ÉÒÔ½øÐÐÀ©Õ¹£¬²»½ö¿ÉÒÔÒÔÈÎÒâ¸ÅÂÊ¶ÔÉñ¾­Ôª½øÐÐ¶ªÆú£¬»¹¿ÉÒÔ¶ÔÉñ¾­ÔªÖ®¼äµÄÁ¬½Ó»òÕßÉñ¾­ÍøÂçÖÐµÄÄ³Ð©²ã½øÐÐËæ»ú¶ªÆú£¬·Ö±ð¶ÔÓ¦ÓÚDropconnect·½·¨ºÍËæ»úÉî¶È·½·¨¡£Dropconnect·½·¨ÔÚÇ°Ïò´«²¥Ê±Ëæ»ú½«È¨ÖØ¾ØÕóÖÐµÄÄ³Ð©ÖµÉèÖÃÎªÁã£¬Ëæ»úÉî¶È·½·¨ÔÚÑµÁ·Ê±Ëæ»ú¶ªÆúÉñ¾­ÍøÂçµÄ²¿·Ö²ã£¬¶øÔÚ²âÊÔÊ±Ê¹ÓÃÍêÕûµÄÍøÂç¡£
DropoutÕâÖÖÕýÔò»¯²ßÂÔ£¬ÔÚÑµÁ·½×¶ÎÎªÍøÂçÒýÈëËæ»úÐÔ»òÕßÔëÉùÒÔ·ÀÖ¹¹ýÄâºÏ£¬¶øÔÚ²âÊÔ½×¶ÎÏû³ýÕâÖÖËæ»úÐÔÀ´Ìá¸ß·º»¯ÄÜÁ¦µÄ·½·¨£¬Êµ¼ÊÉÏÅúÁ¿¹éÒ»»¯Ò²·ûºÏÕâÖÖ²ßÂÔ¡£µ±Ê¹ÓÃBNÑµÁ·Ä£ÐÍÊ±£¬ÏàÍ¬µÄÊý¾Ýµã¿ÉÄÜ³öÏÖÔÚ²»Í¬µÄÐ¡ÅúÁ¿ÖÐ£¬¶ÔÓÚµ¥¸öÊý¾Ýµã£¬ÔÚÑµÁ·¹ý³ÌÖÐ¸Ãµã»áÈçºÎ±»ÕýÔò»¯¾ßÓÐÒ»¶¨µÄËæ»úÐÔ£¨²»Í¬Ð¡ÅúÁ¿¼ÆËãµÃµ½µÄ¾ùÖµºÍ·½²î²»Í¬£¬Ê¹ÓÃBNµ÷ÕûºóµÄÊý¾ÝÒ²»á²»Í¬£©£¬µ«ÊÇÔÚ²âÊÔ¹ý³ÌÖÐ£¬Í¨¹ýÊ¹ÓÃ»ùÓÚÈ«¾ÖÍ³¼ÆµÄÕýÔò»¯·½·¨£¨Ê¹ÓÃÕû¸öÊý¾Ý¼¯ÉÏµÄ¾ùÖµºÍ·½²î¶ÔÊý¾Ý½øÐÐµ÷Õû£©À´µÖÏûÕâ¸öËæ»úÐÔ£¬¶ø²»ÊÇ²ÉÓÃÐ¡ÅúÁ¿½øÐÐ¹À¼Æ¡£Êµ¼ÊÉÏ£¬µ±Ê¹ÓÃBNÑµÁ·Éñ¾­ÍøÂçÊ±£¬Ò»°ã²»»áÔÙÊ¹ÓÃDropout£¬½öÊ¹ÓÃBN¾ÍÄÜ¸øÍøÂç´øÀ´×ã¹»µÄÕýÔò»¯Ð§¹û¡£È»¶ø£¬DropoutÔÚÄ³ÖÖ³Ì¶ÈÉÏ¸üºÃÒ»Ð©£¬ÒòÎªÆä¿ÉÒÔÍ¨¹ý¸Ä±ä²ÎÊýpÀ´µ÷ÕûÕýÔò»¯µÄÇ¿¶È£¬BN²¢Ã»ÓÐÕâÖÖ¿ØÖÆ»úÖÆ¡£
5.4.7±êÇ©Æ½»¬
×÷ÎªÑµÁ·Ê±ÒýÈëËæ»úÐÔÕâÖÖÕýÔò»¯·¶Ê½µÄÁíÒ»¾ßÌåÊµÀý£¬±êÇ©Æ½»¬£¨Label Smoothing£©¼¼Êõ¶ÔÍøÂçÊä³ö¼´Ñù±¾±êÇ©ÒýÈëÁËÒ»¶¨µÄÔëÉù¡£Êý¾Ý¼¯ÄÚµÄÑù±¾¿ÉÄÜ»á²úÉúÎó±ê¼Ç£¬¼´¶ÔÓ¦Ñù±¾µÄ±êÇ©ÊÇ´íÎóµÄ£¬Èç¹ûÊ¹ÓÃÕâÐ©Îó±ê¼ÇµÄÑù±¾Êý¾Ý½øÐÐÑµÁ·£¬»áµ¼ÖÂÍøÂç¹ýÄâºÏ£¬Ó°ÏìÔ¤²âµÄÐ§¹û¡£
¿ÉÒÔÍ¨¹ýÏÔÊ½µØ¶Ô±êÇ©µÄÔëÉù½øÐÐ½¨Ä£À´¸ÄÉÆÕâÖÖÇé¿ö¡£±êÇ©Æ½»¬¼¼Êõ²ÉÓÃÒÔÏÂË¼Â·½â¾öÕâ¸öÎÊÌâ£º ²»ÔÙÊ¹ÓÃÓ²±àÂë±êÇ©£¬ÔÚÑµÁ·Ê±¼ÙÉè±êÇ©¿ÉÄÜ´íÎó£¬²¢½«ÕâÖÖ´íÎó±àÂëÔÚ±êÇ©ÖÐ£¬Ê¹ÓÃÈí±àÂë±êÇ©¡£ÆäÖÐ£¬Ó²±àÂë±êÇ©Ê¹ÓÃoneª²hotÏòÁ¿±íÊ¾Ñù±¾µÄ±êÇ©£¬¼´y=0,¡­,0,1,0,¡­,0T£¬Èç¹ûÓÐkÖÖÀà±ð£¬ÏàÓ¦µÄ±êÇ©ÊÇÒ»¸ökÎ¬ÏòÁ¿£¬²¢ÇÒÕýÈ·Àà±ð¶ÔÓ¦µÄÔªËØÎª1£¬ÆäÓàÔªËØÎª0¡£Ê¹ÓÃÓ²±àÂë±êÇ©Ê±£¬Èç¹ûÊ¹ÓÃsoftmax·ÖÀàÆ÷¼°¶ÔÓ¦µÄ½»²æìØËðÊ§º¯Êý£¬»áÊ¹µÃÄ£ÐÍÓÀÔ¶×·ÇóÕýÈ·Àà±ðµÄ¸ÅÂÊÇ÷½üÓÚ1£¬¶ø´íÎóÀà±ðµÄ¸ÅÂÊÇ÷½üÓÚ0£¬ÕâÊ¹µÃÎ´¾­¹ýsoftmaxº¯Êý½øÐÐ¸ÅÂÊ¹éÒ»»¯µÄÀà±ð·ÖÖµÔ½À´Ô½´ó£¬ÓëÆäËûÀà±ðµÄ·ÖÖµÏà±È¹ý´ó£¬Òò´Ë¶ÔÓ¦ÕýÈ·Àà±ðµÄÈ¨ÖØ»áÔ½À´Ô½´ó£¬ÓëÆäËûÀàµÄÈ¨ÖØ²îÒì¾Þ´ó£¬´Ó¶øµ¼ÖÂ¹ýÄâºÏÏÖÏó¡£²»½öÈç´Ë£¬Èç¹û±êÇ©ÊÇ´íÎó±ê¼ÇµÄ»áµ¼ÖÂ¸üÑÏÖØµÄ¹ýÄâºÏÏÖÏó¡£¶ÔÓÚ½»²æìØËðÊ§º¯Êý£¬Ä£ÐÍÊä³öÓÀÔ¶²»¿ÉÄÜ´ïµ½1£¨ÕýÈ·Àà±ð£©»òÕß0£¨´íÎóÀà±ð£©£¬Òò´ËÄ£ÐÍÎªÁË¸ü½üÒ»²½±Æ½üÕâÁ½¸öÖµ»áÒ»Ö±½øÐÐÓÅ»¯£¬´Ó¶øÊ¹µÃÈ¨ÖØ²»¶ÏÔö´ó¡£
±êÇ©Æ½»¬¼¼ÊõÔòÍ¨¹ýÒýÈëÔëÉù¶Ô±êÇ©½øÐÐÆ½»¬£¬½«È·ÇÐµÄÀà±ð¸ÅÂÊ0ºÍ1Ìæ»»ÎªÏà¶ÔÈÝÒ×ÊµÏÖµÄÖµ¦ÅºÍ1£­¦Å£¬Ä£ÐÍÊä³öÔÚ´ïµ½Õâ¸öÄ¿±êºó£¬±ã²»ÔÙ¼ÌÐø½øÐÐÓÅ»¯£¬´Ó¶øÊµÏÖÕýÔò»¯¡£¿ÉÒÔ¿´×÷Ñù±¾ÒÔ¸ÅÂÊ¦Å±»»®·ÖÆäËûÀà£¬Èç¹ûÓÐKÖÖÀà±ð£¬ÄÇÃ´»®ÎªÈÎÒâÒ»ÖÖ´íÎóÀà±ðµÄ¸ÅÂÊÎª¦ÅK£­1£¬ÕýÈ·±ê¼ÇµÄ¸ÅÂÊÎª1£­¦Å£¬Òò´ËÈí±àÂë±êÇ©µÄÐÎÊ½Îªy=¦ÅK£­1,¡­,¦ÅK£­1,1£­¦Å,¦ÅK£­1,¡­,¦ÅK£­1T¡£Í¨¹ýÊ¹ÓÃÈí±àÂë±êÇ©£¬±êÇ©Æ½»¬¼¼ÊõÄÜ¹»±ÜÃâÄ£ÐÍÊä³ö¹ý¶ÈÄâºÏÓ²±àÂë±êÇ©£¬ÄÜ¹»·ÀÖ¹Ä£ÐÍ×·ÇóÈ·ÇÐ¸ÅÂÊÍ¬Ê±²»Ó°ÏìÄ£ÐÍÑ§Ï°ÕýÈ··ÖÀàµÄÄÜÁ¦¡£
ÉÏÎÄÁîËùÓÐ´íÎóÀà±ðµÄ¸ÅÂÊ¶¼ÊÇÏàÍ¬µÄ£¬¼´¦ÅK£­1£¬¸üºÃµÄ×ö·¨ÊÇ¿¼ÂÇÀà±ðÖ®¼äµÄÏà¹ØÐÔÒÔ¸³Óè´íÎóÀà±ð²»Í¬µÄ¸ÅÂÊ¡£
¶ÔÓÚ±¾½ÚÉæ¼°µÄÕýÔò»¯·½·¨£¬L1ÕýÔò»¯¡¢L2ÕýÔò»¯ÔÚ´«Í³»úÆ÷Ñ§Ï°ÖÐÊ¹ÓÃ½Ï¶à£¬µ«ÊÇÔÚÉî²ãÉñ¾­ÍøÂçÖÐÆä×÷ÓÃÓÐÏÞ¡£Ä¿Ç°£¬Éî¶ÈÑ§Ï°ÖÐ½Ï¶àÊ¹ÓÃµÄÕýÔò»¯·½·¨Ö÷ÒªÓÐ¼òµ¥ÓÐÐ§µÄ¡°ÌáÇ°Í£Ö¹¡±²ßÂÔ¡¢DropoutºÍBNµÈ¡£¶ÔÓÚÕýÔò»¯·½·¨µÄÊ¹ÓÃ£¬Ó¦ÓÐµÄ·ÅÊ¸£¬¼´ÏÈ²»Ê¹ÓÃÕýÔò»¯²ßÂÔ½øÐÐÄ£ÐÍÑµÁ·£¬¹Û²ìÑ§Ï°ÇúÏß£¬µ±·¢Éú¹ýÄâºÏÏÖÏóÊ±£¬ÔÙ¿¼ÂÇÒýÈë¸÷ÖÖÕýÔò»¯·½·¨¡£ÁíÍâ£¬¶àÖÖÕýÔò»¯²ßÂÔÒ²¿ÉÒÔ½áºÏÊ¹ÓÃ£¬ÒÔ»ñµÃ¸ü½øÒ»²½µÄÌáÉý¡£
5.5ÑµÁ·Éî²ãÉñ¾­ÍøÂçµÄÐ¡¼¼ÇÉ
±¾½Ú½éÉÜÑµÁ·Éî²ãÉñ¾­ÍøÂçµÄÐ¡¼¼ÇÉ£¬°üÀ¨Êý¾ÝÔ¤´¦Àí¡¢³¬²ÎÊýµ÷ÓÅ¡¢¼¯³ÉÑ§Ï°ºÍ¼àÊÓÑµÁ·¹ý³Ì¡£
5.5.1Êý¾ÝÔ¤´¦Àí
Éî¶ÈÑ§Ï°ÖÐ³£³£ÐèÒª¶ÔÊý¾Ý½øÐÐÔ¤´¦Àí£¬ÒòÎªÔ­Ê¼ÑµÁ·Êý¾ÝÖÐ£¬Ã¿Ò»Î¬ÌØÕ÷µÄÀ´Ô´ÒÔ¼°¶ÈÁ¿µ¥Î»¶¼ÓÐ¿ÉÄÜ²»Í¬£¬´Ó¶øÔì³ÉÌØÕ÷Ö®¼äÈ¡Öµ·¶Î§²»Í¬¡£ÀýÈç£¬ÔÚÅÐ¶ÏÁã¼þÊÇ·ñºÏ¸ñµÄÈÎÎñÖÐ£¬Ñ¡È¡µÄÈý¸öÌØÕ÷·Ö±ðÎªÁã¼þ³¤¶È¡¢Ö±¾¶ºÍ±íÃæ¹â»¬¶È¡£¶Ô¡°³¤Ï¸ÐÎ¡±Áã¼þ£¬³¤¶ÈµÄÈ¡Öµ·¶Î§¾Í»á´óÓÚÖ±¾¶µÄÈ¡Öµ·¶Î§£¬¶Ô¡°¶Ì´ÖÐÎ¡±Áã¼þÔò·´Ö®¡£¶ÔÓÚÕâÖÖ²»Í¬ÌØÕ÷È¡Öµ·¶Î§²îÒì½Ï´óµÄÔ­Ê¼Êý¾Ý£¬Ê¹ÓÃ»ùÓÚÏàËÆÐÔ¶ÈÁ¿µÄ»úÆ÷Ñ§Ï°Ëã·¨£¨ÀýÈç×î½üÁÚ·ÖÀàÆ÷£©Ê±£¬ÒòÎªÒª¼ÆËãÀýÈçÑù±¾Ö®¼äµÄÅ·ÊÏ¾àÀëÀ´ºâÁ¿²»Í¬Ñù±¾Ö®¼äµÄÏàËÆÐÔ£¬È¡Öµ·¶Î§½Ï´óµÄÌØÕ÷»áÕ¼Ö÷µ¼×÷ÓÃ£¬ËùÒÔÊ¹ÓÃÖ®Ç°±ØÐëÒª¶ÔÔ­Ê¼ÑµÁ·Ñù±¾½øÐÐÔ¤´¦Àí£¬½«²»Í¬Î¬¶ÈµÄÌØÕ÷È¡Öµ·¶Î§ÏÞÖÆÔÚÍ¬Ò»¸öÇø¼ä¡£ÁíÍâ£¬¼´Ê¹Éñ¾­ÍøÂç¿ÉÒÔ×Ô¶¯µ÷Õû²ÎÊýÀ´ÊÊÓ¦²»Í¬ÌØÕ÷µÄÈ¡Öµ·¶Î§£¬Ò²»áµ¼ÖÂÑµÁ·Ð§ÂÊµÍÏÂ£¬Ê¹ÓÃÊý¾ÝÔ¤´¦Àí¿ÉÒÔ¼õÉÙÈË¹¤¸ÉÔ¤²¢ÇÒÌáÉýÊÕÁ²ËÙ¶È¡£Òò´Ë£¬Êý¾ÝÔ¤´¦ÀíÒÑ¾­³ÉÎª±ØÒªµÄÒ»²½£¬ÔÚºÜ¶àÉî¶ÈÑ§Ï°Ëã·¨ÖÐÆð×ÅÖØÒª×÷ÓÃ¡£Êý¾ÝÔ¤´¦ÀíÒ»°ãÎ»ÓÚÊý¾ÝÔöÇ¿²Ù×÷Ö®ºó£¬Ä£ÐÍÑµÁ·Ö®Ç°£¬ÑµÁ·Á÷³ÌÒ»°ãÎªÊý¾Ý²É¼¯¡¢Êý¾Ý±ê¼Ç£¨¿ÉÑ¡£©¡¢Êý¾ÝÔöÇ¿£¨¿ÉÑ¡£©¡¢Êý¾ÝÔ¤´¦ÀíºÍÄ£ÐÍÑµÁ·£¬¿É½«ÑµÁ·Á÷³Ì·ÖÎªÊý¾ÝºÍÄ£ÐÍÁ½²¿·Ö¡£Ä£ÐÍÑµÁ·°üÀ¨ÑµÁ·¹ý³ÌµÄËùÓÐ·½Ãæ£¬ÀýÈçÄ£ÐÍ¼Ü¹¹Éè¼Æ¡¢²ÎÊý³õÊ¼»¯²ßÂÔ¡¢ÓÅ»¯·½·¨¡¢ÕýÔò»¯²ßÂÔ¡¢¸÷ÖÖ³¬²ÎÊýµÄÉèÖÃÒÔ¼°Êµ¼ùÖÐÊ¹ÓÃµÄÐ¡¼¼ÇÉµÈ£¬Æä½á¹ûÊÇ²úÉúÒ»¸öÐÔÄÜÁ¼ºÃµÄÄ£ÐÍ£» Ä£ÐÍÑµÁ·Ö®Ç°µÄ²½Öè¶¼ÊÇ¶ÔÓÚÊý¾ÝµÄ´¦Àí£¬Æä½á¹ûÊÇ²úÉúÄÜÓÃÓÚÑµÁ·Ä£ÐÍµÄÊý¾Ý¼¯ºÏ¡£
Í¨³£Ê¹ÓÃµÄÊý¾ÝÔ¤´¦Àí°üÀ¨ÒÔÏÂÁ½ÖÖ·½·¨£º Êý¾Ý¹éÒ»»¯£» °×»¯¡£ÏÂÃæ½«¶ÔÕâÁ½ÖÖ´¦Àí·½·¨½øÐÐÏêÏ¸½éÉÜ¡£
Êý¾Ý¹éÒ»»¯£¨Data Normalization£©Ò²³ÆÊý¾Ý±ê×¼»¯£¬Ò»°ã×÷ÎªÊý¾ÝÔ¤´¦ÀíµÄµÚÒ»²½£¬½«Êý¾Ý°´±ÈÀýËõ·Å£¬Ê¹Ö®ÂäÈëÒ»¸öÐ¡µÄÌØ¶¨Çø¼äÄÚ¡£ÓÐºÜ¶à·½·¨¿ÉÒÔÊµÏÖÊý¾Ý¹éÒ»»¯£¬ÔÚÉî¶ÈÑ§Ï°ÖÐ±È½Ï³£ÓÃµÄÖ÷ÒªÓÐËõ·Å¹éÒ»»¯ºÍ±ê×¼¹éÒ»»¯¡£
Ëõ·Å¹éÒ»»¯ÊÇ·Ç³£¼òµ¥µÄÒ»ÖÖ¹éÒ»»¯·½·¨£¬ËüÍ¨¹ýËõ·Å½«Êý¾ÝËùÓÐÌØÕ÷µÄÈ¡Öµ·¶Î§ÖØÐÂµ÷½Ú£¬Ê¹µÃÃ¿Ò»Î¬ÌØÕ÷µÄÈ¡ÖµÂäÔÚ£Û0,1£Ý»ò£Û-1,1£Ý¡£¶ÔÓÚÃ¿Ò»Î¬ÌØÕ÷x£¬µ÷½Ú¹«Ê½Îª

x^i=xi£­miniximaxixi£­minixi(5ª²66)

ÆäÖÐ£¬min(x)ºÍmax(x)·Ö±ðÊÇËùÓÐÑù±¾ÖÐµÄÌØÕ÷xµÄ×îÐ¡ÖµºÍ×î´óÖµ¡£ÀýÈç£¬ÔÚ´¦ÀíÍ¼ÏñÊ±£¬Ã¿¸öÏñËØ¶¼ÊÇÒ»Î¬ÌØÕ÷£¬ËùÓÐÏñËØµÄ³õÊ¼Öµ¶¼ÔÚ£Û0,255£Ý¡£Òò´Ë£¬¶ÔÓÚÃ¿Ò»¸öÏñËØ£¬Ö»ÐèÒª½«Æä³ýÒÔ255¾Í¿ÉÒÔËõ·ÅÖÁ£Û0,1£Ý¡£
±ê×¼¹éÒ»»¯ÊÇÁíÍâÒ»ÖÖ±È½Ï³£ÓÃµÄ¹éÒ»»¯·½·¨£¬Ò²³ÆÎªzª²score¹éÒ»»¯¡£¾­¹ý±ê×¼¹éÒ»»¯´¦Àíºó£¬ËùÓÐÎ¬¶ÈµÄÌØÕ÷¶¼·þ´Ó¾ùÖµÎª0¡¢·½²îÎª1µÄ±ê×¼ÕýÌ¬·Ö²¼¡£Æä¾ßÌå×ö·¨ÊÇ£¬¶ÔÓÚÑµÁ·¼¯ÄÚµÄËùÓÐÑù±¾£¬¼ÙÉèÑù±¾ÊýÁ¿ÎªN£¬¶ÔÓÚÃ¿Ò»Î¬ÌØÕ÷x£¬Ê×ÏÈ¼ÆËãÌØÕ÷xÔÚËùÓÐÑµÁ·Ñù±¾ÉÏµÄ¾ùÖµºÍ±ê×¼²î£¬ÈçÊ½£¨5ª²67£©ºÍÊ½£¨5ª²68£©¡£

¦Ì=1N¡ÆNi=1xi£¨5ª²67£©

¦Ò2=1N¡ÆNi=1xi£­¦Ì2£¨5ª²68£©

È»ºó£¬½«ËùÓÐÑù±¾µÄÌØÕ÷x¼õÈ¥¾ùÖµµÃµ½ÁãÖÐÐÄ»¯µÄÊý¾Ý£¬ÔÙ³ýÒÔ±ê×¼²î£¬µ÷ÕûÊýÖµ·¶Î§£¬µÃµ½ÐÂµÄÌØÕ÷Öµ£¬ÈçÊ½£¨5ª²69£©¡£

x^i=xi£­¦Ì¦Ò£¨5ª²69£©

Í¼5ª²23Õ¹Ê¾ÁËÔ­Ê¼Êý¾Ý¡¢ÁãÖÐÐÄ»¯Êý¾ÝºÍ±ê×¼¹éÒ»»¯ºóµÄÊý¾Ý·Ö²¼¡£¿ÉÒÔ¿´µ½£¬Ïà¶ÔÓÚ¶þÎ¬Ô­Ê¼Êý¾Ý£¬È¥¾ùÖµºóµÄÊý¾ÝÊÇÒÔÔ­µãÎªÖÐÐÄµÄ£¬È»ºóÁ½¸öÎ¬¶È¶¼³ýÒÔ±ê×¼²îµ÷ÕûÊýÖµ·¶Î§£¬Ë«Ïò¼ýÍ·Ãè»æÁËÊý¾Ý²»Í¬Î¬¶ÈµÄÊýÖµ·¶Î§£¬ÖÐ¼äµÄÁãÖÐÐÄ»¯Êý¾ÝÁ½¸öÎ¬¶ÈµÄÊýÖµ·¶Î§²»Í¬£¬±ê×¼¹éÒ»»¯µÄÊý¾ÝÁ½¸öÎ¬¶ÈÊýÖµ·¶Î§ÏàÍ¬¡£


Í¼5ª²23Ô­Ê¼Êý¾Ý¡¢ÁãÖÐÐÄ»¯Êý¾ÝÓë±ê×¼¹éÒ»»¯ºóµÄÊý¾ÝÍ¼Æ¬À´×Ô£º ¶Å¿Í.CS231n¿Î³Ì±Ê¼Ç·­Òë£º ÏßÐÔ·ÖÀà±Ê¼Ç£¨ÉÏ£©£ÛZ/OL£Ý.https://zhuanlan.zhihu.com/p/20918580.


×¢Òâ£¬¶ÔÓÚÍ¼ÏñÊý¾Ý£¬ÓÉÓÚÏñËØµÄÊýÖµ·¶Î§ÊÇ0~255£¬Òò´ËÒ»°ã²»ÐèÒª¶ÔÍ¼Ïñ½øÐÐ±ê×¼¹éÒ»»¯²Ù×÷£» ¶ÔÓÚÒôÆµÊý¾Ý£¬¸Ã·½·¨ÊÇÊ®·ÖÓÐÓÃµÄ¡£
°×»¯ÊÇÁíÒ»ÖÖÊý¾ÝÔ¤´¦Àí·½·¨£¬ÕâÖÖ·½·¨ÐèÒªÏÈ¶ÔÊý¾Ý½øÐÐÁãÖÐÐÄ»¯´¦Àí¡£°×»¯µÄÄ¿µÄÊÇÈ¥³ýÊäÈëÐÅÏ¢µÄÈßÓàÐÅÏ¢¡£ÀýÈçÍ¼ÏñÊý¾Ý£¬ÏàÁÚÏñËØÖ®¼ä¾ßÓÐºÜÇ¿µÄÏà¹ØÐÔ£¬ÕâÖÖÏà¹ØÐÔ¶ÔÓÚÄ£ÐÍÑµÁ·¶øÑÔÊÇÈßÓàµÄ¡£Ê¹ÓÃ°×»¯½øÐÐÔ¤´¦Àíºó£¬¿ÉÒÔ´ó´ó½µµÍÌØÕ÷Ö®¼äµÄÏà¹ØÐÔ£¬Ê¹µÃËùÓÐÎ¬¶ÈµÄÌØÕ÷¶¼ÓÐÏàÍ¬µÄ·½²î¡£Êý¾Ý°×»¯Ê×ÏÈÐèÒªÊ¹ÓÃÖ÷³É·Ö·ÖÎö£¨Principal Component Analysis£¬PCA£©·½·¨È¥³ý²»Í¬³É·ÖÖ®¼äµÄÏà¹ØÐÔ¡£ÊìÏ¤PCAµÄ¶ÁÕß¿ÉÄÜÖªµÀ£¬PCAËã·¨Ò»°ãÓÃÓÚ½µÎ¬£¬´Ë´¦²»ÔÙÓÃÓÚ½µÎ¬£¬¶øÊÇÊ¹ÓÃPCAÈ¥³ýÌØÕ÷¼äµÄÏà¹ØÐÔ£¬ÔÚÇó³öÌØÕ÷ÏòÁ¿ºó£¬Ö±½Ó½«Êý¾ÝÓ³Éäµ½ÐÂµÄÌØÕ÷¿Õ¼ä£¨Ïàµ±ÓÚ×ø±ê¿Õ¼äµÄÐý×ª£©¡£°×»¯²Ù×÷µÄÊäÈëÊÇÌØÕ÷»ù×¼ÉÏµÄÊý¾Ý£¬ÁîÃ¿¸öÎ¬¶È¶¼³ýÒÔÆäÌØÕ÷ÖµÀ´¶ÔÊýÖµ·¶Î§½øÐÐ¹éÒ»»¯¡£Òò´Ë£¬°×»¯µÄ²½ÖèÖ÷Òª°üÀ¨PCAÔ¤´¦ÀíºÍ°×»¯²Ù×÷¡£ÏêÏ¸¹ý³ÌÈçÏÂ£º 
£¨1£© ¶ÔÊý¾Ý½øÐÐÁãÖÐÐÄ»¯´¦Àí£¬¼´Êý¾ÝµÄÃ¿Ò»Î¬¶È¶ÀÁ¢µÄÌØÕ÷¶¼¼õÈ¥¸ÃÌØÕ÷µÄÑù±¾¾ùÖµ£¬¼¸ºÎÉÏ¿ÉÒÔÀí½âÎªÔÚÃ¿¸öÎ¬¶ÈÉÏ¶¼½«Êý¾Ý¼¯µÄÖÐÐÄÇ¨ÒÆµ½Ô­µã¡£
£¨2£© Çó½âÊý¾ÝµÄÐ­·½²î¾ØÕó£¬¶ÔÐ­·½²î¾ØÕó·Ö½âµÃµ½ÌØÕ÷ÏòÁ¿£¬È»ºó½«¾­¹ýÁãÖÐÐÄ»¯´¦ÀíµÄÔ­Ê¼Êý¾ÝÍ¶Ó°µ½ÌØÕ÷ÏòÁ¿ÉÏ½øÐÐ×ø±ê×ª»»£¬¸Ã¹ý³ÌÈ¥³ýÁËÊý¾ÝµÄÏà¹ØÐÔ¡£PCAÔÚ±¾²½ÖèÖ»Ñ¡È¡²¿·ÖÌØÕ÷ÏòÁ¿£¬¶ªÆúÄÇÐ©·½²î½ÏÐ¡µÄÎ¬¶È£¬´Ó¶øÊµÏÖ½µÎ¬¡£
£¨3£© ½«ÉÏÒ»²½µÃµ½µÄÒÔÌØÕ÷ÏòÁ¿Îª»ù×¼µÄÊý¾ÝµÄÃ¿Ò»Î¬¶¼³ýÒÔ¶ÔÓ¦Î¬¶ÈµÄÌØÕ÷Öµ£¬ÕâÑùµÃµ½µÄÊý¾Ý±»ÖØÐÂµ÷ÕûÊýÖµ·¶Î§£¬Êý¾ÝµÄ·Ö²¼±ä³É¾ùÖµÎª0¡¢Ð­·½²î¾ØÕóÎªµ¥Î»¾ØÕóµÄ¸ßË¹·Ö²¼¡£
Í¼5ª²24Õ¹Ê¾ÁË¶ÔÓÚ¶þÎ¬Ô­Ê¼Êý¾Ý£¬·Ö±ðÊ¹ÓÃPCA½øÐÐÈ¥Ïà¹ØÐÔÒÔ¼°Ê¹ÓÃ°×»¯²Ù×÷Ö®ºóÊý¾ÝµÄ·Ö²¼¡£¶ÔÓÚÍ¼×ó²àµÄ¶þÎ¬Ô­Ê¼Êý¾Ý£¬ÖÐ¼ä±íÊ¾µÄÊÇ¾­¹ýPCA²Ù×÷µÄÊý¾Ý¡£¿ÉÒÔ¿´³ö£¬È¥Ïà¹ØÐÔµÄÊý¾ÝÊÇÁãÖÐÐÄµÄ£¬±ä»»µ½ÁËÊý¾ÝÐ­·½²î¾ØÕóµÄ»ù×¼ÖáÉÏ£¬Ð­·½²î¾ØÕó±ä³É¶Ô½ÇÕó¡£°×»¯ºóµÄÊý¾Ý£¬Ã¿¸öÎ¬¶È¶¼±»ÌØÕ÷Öµµ÷ÕûÁËÊýÖµ·¶Î§£¬½«Êý¾ÝÐ­·½²î¾ØÕó±äÎªµ¥Î»¾ØÕó¡£´Ó¼¸ºÎÉÏ½âÊÍ£¬¾ÍÊÇ¶ÔÊý¾ÝÔÚ¸÷¸ö·½ÏòÉÏÀ­ÉìÑ¹Ëõ£¬Ê¹Ö®·þ´Ó¸ßË¹·Ö²¼¡£


Í¼5ª²24Ô­Ê¼Êý¾Ý¡¢È¥Ïà¹ØÐÔÊý¾ÝÓë°×»¯ºóµÄÊý¾Ý¢Ù



Êµ¼ÊÉÏ£¬¶ÔÓÚÍ¼ÏñÊý¾Ý£¬´ó²¿·ÖÇé¿öÏÂÖ»½øÐÐÁãÖÐÐÄ»¯µÄ´¦Àí£¬¶ø²»»á¹éÒ»»¯ÏñËØÖµ¡£ÒòÎª¶ÔÓÚÍ¼ÏñÀ´Ëµ£¬Ã¿¸öÏñËØÒÑ¾­¾ßÓÐÏà¶ÔÒ»ÖÂµÄ·¶Î§ºÍ·Ö²¼£¬Ã»ÓÐ±ØÒª½øÐÐ¹éÒ»»¯¡£Ïà±ÈÖ®ÏÂ£¬Ò»°ãµÄ»úÆ÷Ñ§Ï°ÎÊÌâµÄÊý¾ÝÓÐÈ¡Öµ·¶Î§²î±ðºÜ´óµÄÌØÕ÷£¬ÐèÒª¶ÔÕâÐ©ÌØÕ÷½øÐÐ¹éÒ»»¯´¦Àí¡£¶ÔÓÚPCA»òÕß°×»¯µÈ¸üÎª¸´ÔÓµÄÔ¤´¦Àí²Ù×÷£¬Í¼ÏñÓ¦ÓÃÁìÓòÒ²²»»áÊ¹ÓÃ¡£ÐèÒª×¢ÒâµÄÊÇ£¬Èç¹ûÔÚÑµÁ·½×¶Î½øÐÐÁËÊý¾ÝÔ¤´¦Àí£¬ÄÇÃ´ÔÚ²âÊÔ½×¶ÎÒ²ÐèÒª×öÔ¤´¦Àí¡£ÀýÈç£¬ÑµÁ·½×¶ÎÇó³öÁËÑµÁ·¼¯Êý¾ÝµÄ¾ùÖµ£¬ÔÚ²âÊÔ½×¶ÎÍ¬ÑùÓ¦Ê¹ÓÃÕâ¸ö¾ùÖµ×öÏàÍ¬µÄ´¦Àí¡£×ÜÖ®£¬¶ÔÓÚÍ¼ÏñÊý¾Ý£¬Ö»½øÐÐÁãÖÐÐÄ»¯µÄÔ¤´¦Àí£¬Ê¹ÓÃÕû¸öÑµÁ·¼¯¼ÆËã³ö¾ùÖµÍ¼Ïñ£¬Æä³ß´çºÍÃ¿ÕÅÍ¼ÏñÏàÍ¬£¬È»ºó½«ËùÓÐÑµÁ·Í¼Ïñ¶¼¼õÈ¥¾ùÖµÍ¼ÏñµÄÖµ£» ¶Ô²âÊÔÍ¼ÏñÒ²Òª½øÐÐÏàÍ¬µÄ²Ù×÷£¬½«²âÊÔÍ¼Ïñ¼õÈ¥ÕâÕÅ¾ùÖµÍ¼ÏñÈ»ºóÔÙÊäÈëÍøÂç¡£
5.5.2³¬²ÎÊýµ÷ÓÅ
Éñ¾­ÍøÂçÖÐ´æÔÚÐíÐí¶à¶àµÄ³¬²ÎÊý£¬ÔÚÇ°ÎÄÓÅ»¯²¿·ÖÆµ·±Ìá¼°µÄÑ§Ï°ÂÊ¾ÍÊÇÉñ¾­ÍøÂçÖÐ×îÖØÒªµÄ³¬²ÎÊýÖ®Ò»¡£³¬²ÎÊýÊÇÒ»ÀàÔÚÄ£ÐÍ¿ªÊ¼Ñ§Ï°Ö®Ç°¾ÍÒªÉèÖÃµÄ²ÎÊý£¬²»ÄÜÏñÈ¨ÖØ¾ØÕóÄÇÑùÍ¨¹ýÑµÁ·µÃµ½¡£Éñ¾­ÍøÂçÖÐ´æÔÚµÄ³¬²ÎÊýÖ÷Òª°üÀ¨ÒÔÏÂ¼¸Àà¡£
£¨1£© ÍøÂç½á¹¹Àà£º °üÀ¨Éñ¾­ÍøÂçµÄ×éÖ¯ÐÎÊ½¡¢²ãÊý¡¢Ã¿²ãÉñ¾­ÔªÊýÁ¿¡¢¼¤»îº¯ÊýµÄÀàÐÍ¡¢¾í»ýÍøÂçÖÐµÄºË¿í¶ÈÒÔ¼°Ã¿²ãºËÊýÁ¿¡¢ÊÇ·ñÊ¹ÓÃÁãÌî³ä¡¢³Ø»¯·½Ê½µÄÑ¡Ôñ¡¢¾í»ýºÍ³Ø»¯²½³¤¡¢ÊÇ·ñÊ¹ÓÃDropoutÒÔ¼°Dropout±ÈÂÊµÈ¡£
£¨2£© ÓÅ»¯Àà£º °üÀ¨ÓÅ»¯Ëã·¨µÄÑ¡Ôñ¡¢Ñ§Ï°ÂÊµÄÉèÖÃ¡¢Ð¡ÅúÁ¿Ñù±¾µÄÊýÁ¿¡¢È¨ÖØË¥¼õÏµÊý£¬Èç¹ûÑ¡Ôñ¶¯Á¿·¨»òAdam·½·¨£¬»¹ÓÐË¥¼õÂÊµÈ¡£
£¨3£© ÕýÔòÀà£º °üÀ¨ÕýÔò»¯²ßÂÔµÄÑ¡ÔñÒÔ¼°ÕýÔò»¯ÏµÊý¡£
¾¡¹ÜÉñ¾­ÍøÂçÓÐ·Ç³£¶àµÄ³¬²ÎÊýÐèÒªÉèÖÃ£¬µ«ÊÇ²»Í¬³¬²ÎÊýµÄÉèÖÃÄÑ¶ÈÊÇ²»Í¬µÄ¡£ÀýÈç£¬¶ÔÓÚDropout±ÈÂÊ£¬Ò»°ãÑ¡Îª0.5£» ¶¯Á¿·¨ÖÐµÄË¥¼õÒò×Ó¦Ñ£¬¸ù¾Ý¾­ÑéÒ»°ãÉèÖÃÎª0.5£¬0ª±9£¬0.95ºÍ0.99ÖÐµÄÒ»¸öÖµ¡£Òò´Ë£¬ÕâÖÖÀàÐÍµÄ³¬²ÎÊýÒ»°ãÉèÖÃÎª¾­ÑéÉÏ±íÏÖÁ¼ºÃµÄÊýÖµ¼´¿É£¬¶ø²»±ØÖØÐÂ³¢ÊÔ²»Í¬µÄÖµÀ´ÕÒµ½×îÓÅµÄÉèÖÃ¡£µ«ÊÇ£¬¶ÔÓÚÑ§Ï°ÂÊÕâ¸öÊ®·ÖÖØÒªµÄ³¬²ÎÊý£¬±ØÐë½÷É÷ÉèÖÃ£¬ÒòÎªËüÒÔÒ»ÖÖ¸üÎª¸´ÔÓµÄ·½Ê½¿ØÖÆÄ£ÐÍµÄÐÔÄÜ£¬¼È²»ÄÜÉèÖÃµÃÌ«´óÒ²²»ÄÜÌ«Ð¡¡£Òò´Ë£¬Èç¹ûÓÉÓÚÊ±¼äÏÞÖÆ»òÕß¼ÆËã´ú¼ÛÏÞÖÆ¶øÖ»ÄÜµ÷ÕûÉÙÁ¿µÄ³¬²ÎÊý£¬Ó¦µ±ÓÅÏÈµ÷ÕûÑ§Ï°ÂÊ¡£ 
³¬²ÎÊýÔÚ¸ü¸ß²ã´ÎÉÏ¿ØÖÆ×ÅÄ£ÐÍµÄÐÔÄÜ£¬Òò´ËÔÚÊµ¼ù¹ý³ÌÖÐ£¬×ÜÏ£ÍûÕÒµ½Ò»×é×îÓÅµÄ³¬²ÎÊýÅäÖÃ£¬ÌáÉýÑµÁ·µÄÐ§¹û£¬Ê¹µÃÄ£ÐÍ·¢»Ó×î´óµÄÐÔÄÜ£¬Õâ¾ÍÊÇ³¬²ÎÊýÓÅ»¯£¨Hyperparameter Optimization£©ÎÊÌâ£¬Ò²³ÆÎªÄ£ÐÍÑ¡Ôñ£¨Model Selection£©ÎÊÌâ¡£ÓëÆÕÍ¨µÄÓÅ»¯ÎÊÌâ²»Í¬£¬³¬²ÎÊýÓÅ»¯´æÔÚÒ»¶¨µÄÀ§ÄÑ¡£Ê×ÏÈ£¬³¬²ÎÊýÓÅ»¯ÊÇÒ»¸ö×éºÏÓÅ»¯ÎÊÌâ£¬²»ÄÜÊ¹ÓÃÌÝ¶ÈÏÂ½µËã·¨½øÐÐÓÅ»¯£¬²»´æÔÚÒ»ÖÖÍ¨ÓÃ¶øÓÐÐ§µÄÓÅ»¯·½·¨£» Æä´Î£¬ÎªÆÀ¹À²»Í¬µÄ²ÎÊýÅäÖÃÐÔÄÜ¶øÍêÕûµØÑµÁ·Ä£ÐÍËùÐèµÄÊ±¼ä´ú¼Û·Ç³£¸ß¡£Òò´Ë£¬³¬²ÎÊýÓÅ»¯²¢²»ÄÜ¿´×÷¼òµ¥µÄ²ÎÊýÓÅ»¯ÎÊÌâ¡£Ò»×é³¬²ÎÊýÅäÖÃ±íÏÖÈçºÎ£¬Í¨³£Í¨¹ýÓÅ»¯Ëã·¨ÔÚ¶ÀÁ¢Êý¾Ý¼¯£¨¼´ÑéÖ¤¼¯£©ÉÏµÄÐÔÄÜ±íÏÖÀ´ºâÁ¿£¬Ò»°ã²ÉÓÃ½»²æÑéÖ¤À´¹À¼Æ²»Í¬²ÎÊýÅäÖÃÔÚÑéÖ¤¼¯ÉÏµÄ±íÏÖ£¬´Ó¶ø¹À¼ÆÆä·º»¯ÐÔÄÜ¡£½»²æÑéÖ¤ÊÇÒ»ÖÖ¼ìÑé³¬²ÎÊýÉèÖÃÐ§¹ûµÄ·½·¨¡£Ê×ÏÈ£¬Ê¹ÓÃÔ¤ÏÈÈ·¶¨µÄ³¬²ÎÊýÔÚÑµÁ·¼¯ÉÏ½øÐÐÑµÁ·£¬È»ºóÔÙÔÚ¶ÀÁ¢µÄÊý¾Ý¼¯£¨¼´ÑéÖ¤¼¯£©ÉÏÆÀ¹ÀÉèÖÃµÄ³¬²ÎÊýµÄ±íÏÖ£¬Ò»°ã¼ìÑéÔÚÑéÖ¤¼¯ÉÏµÄ´íÎóÂÊ£¬×îÖÕÑ¡ÔñÔÚÑéÖ¤¼¯ÉÏ±íÏÖ×îºÃµÄ³¬²ÎÊýÅäÖÃÀ´È·¶¨×îÖÕÑµÁ·Ä£ÐÍ£» È»ºóÔÙÊ¹ÓÃ¶îÍâµÄ¶ÀÁ¢Êý¾Ý¼¯¡ª¡ª²âÊÔ¼¯À´ÆÀ¹À×îÖÕÄ£ÐÍÔÚÎ´ÖªÊý¾ÝÉÏµÄ·º»¯ÐÔÄÜ¡£ÆäÖÐ£¬ÐèÒª×¢ÒâµÄÊÇ£¬ÎÞÂÛÑµÁ·¼¯¡¢ÑéÖ¤¼¯»ò²âÊÔ¼¯£¬¶¼ÊÇ´ÓÍ¬Ò»·Ö²¼ÖÐ³éÈ¡µÄ£¬ËüÃÇ¶ÀÁ¢ÇÒÍ¬·Ö²¼¡£ÁíÍâ£¬²âÊÔÊý¾ÝÔÚÄ£ÐÍÑµÁ·ÆÚ¼äÊÇ²»¿É¼ûµÄ£¬Ö»ÓÐÔÚÄ£ÐÍ×îÖÕÑµÁ·Íê³ÉºóÓÃÓÚ²âÊÔ½×¶Î£¬²âÊÔÊý¾Ý²»¿ÉÓÃÓÚÑµÁ·½×¶Î£¬ÒòÎªÕâÑù¿ÉÄÜ»á²úÉú¹ýÄâºÏÏÖÏó£¬ÎÞ·¨ÕýÈ·ÆÀ¹ÀÄ£ÐÍµÄ·º»¯ÐÔÄÜ¡£¶øÑµÁ·¼¯ºÍÑéÖ¤¼¯¶¼ÊÇÔÚÑµÁ·½×¶ÎÊ¹ÓÃµÄ£¬ÑéÖ¤¼¯ÊÇ´ÓÑµÁ·¼¯ÖÐ·ÖÀë³öµÄ¶ÀÁ¢Êý¾Ý¼¯£¬¶þÕßÒ»¸öÓÃÓÚÈ·¶¨³¬²ÎÊý£¬ÁíÒ»¸öÓÃÓÚÈ·¶¨Ä£ÐÍÖÐ¿ÉÑ§Ï°µÄ²ÎÊý¡£
Êµ¼ùÖÐÉèÖÃ³¬²ÎÊý³£ÓÃµÄ·½·¨ÓÐÈË¹¤ÉèÖÃ¡¢Íø¸ñËÑË÷ÒÔ¼°Ëæ»úËÑË÷µÈ£¬ÏÂÃæ¶ÔÕâÐ©·½·¨½øÐÐÏêÏ¸½éÉÜ¡£
1. ÈË¹¤ÉèÖÃ
ÈË¹¤ÉèÖÃ³¬²ÎÊý±ØÐë³ä·ÖÁË½â³¬²ÎÊý¡¢ÑµÁ·Îó²îºÍ·º»¯Îó²îÒÔ¼°¼ÆËã×ÊÔ´£¨°üÀ¨ÄÚ´æºÍÔËÐÐÊ±¼ä£©Ö®¼äµÄ¹ØÏµ£¬ÆäÄ¿±êÊÇÔÚÓÐÏÞÔËÐÐÊ±¼äºÍÄÚ´æ´óÐ¡µÄÌõ¼þÏÂ£¬×îÐ¡»¯·º»¯Îó²î£¬¼´ÌáÉýÄ£ÐÍÔÚÎ´ÖªÊý¾ÝÉÏµÄ·º»¯ÐÔÄÜ¡£Èç¹ûÄ³Ð©³¬²ÎÊýÅäÖÃÔÚÊµ¼ùÖÐÖ¤Ã÷¾ßÓÐ²»´íµÄÐ§¹û£¬¿ÉÒÔÖ±½Ó»ùÓÚÕâÐ©¾­ÑéÅäÖÃ¡£ÁíÍâ£¬ÔÚÒÑÓÐÏàÍ¬ÀàÐÍµÄÓ¦ÓÃ»ò¼Ü¹¹ÉÏ±íÏÖ²»´íµÄ²ÎÊýÅäÖÃÒ²¿ÉÒÔÖ±½ÓÊ¹ÓÃ¡£ÈË¹¤ËÑË÷Ö÷ÒªÒÀ¿¿Ê¹ÓÃÕßµÄ¾­ÑéºÍÅÐ¶ÏÀ´ÉèÖÃ³¬²ÎÊý£¬ºÃ´¦ÊÇ¿ÉÒÔ´ó´ó½µµÍËÑË÷×îÓÅ³¬²ÎÊýµÄÊ±¼äºÍ¼ÆËã´ú¼Û£¬²¢ÇÒ¶ÔÓÚÄ³Ð©³¬²ÎÊý¶øÑÔÑ¡Ôñ¾­ÑéÖµÒ»°ã±íÏÖ²»´í¡£
2. Íø¸ñËÑË÷
Íø¸ñËÑË÷ÊÇÒ»ÖÖ´«Í³µÄ³¬²ÎÊýÓÅ»¯·½·¨£¬Í¨¹ý¶Ô³¬²ÎÊý¿Õ¼äµÄÒ»¸ö½ÏÐ¡µÄÓÐÏÞ×Ó¼¯½øÐÐËÑË÷£¬¼´Í¨¹ý³¢ÊÔ×éºÏ¸÷¸ö³¬²ÎÊýµÄ²»Í¬ÅäÖÃÀ´È·¶¨Ò»×é±íÏÖ²»´íµÄ³¬²ÎÊýÅäÖÃ¡£ÀýÈç£¬¶ÔÓÚÒ»¸öº¬ÓÐK¸ö³¬²ÎÊýµÄÄ£ÐÍ£¬Ã¿¸ö¿ÉÐÐµÄ³¬²ÎÊýÅäÖÃx¶¼ÊÇ³¬²ÎÊýÈ¡Öµ¿Õ¼ä¦ÖµÄÒ»¸öµã£¬¦Öª¼RK¡£Èç¹ûµÚk¸ö³¬²ÎÊýÓÐmK¸ö¿ÉÐÐµÄÈ¡Öµ£¬¶ÔÓÚËùÓÐ³¬²ÎÊý£¬¹²ÓÐm1¡Ám2¡Á¡­¡ÁmK¸ö¿ÉÐÐµÄ³¬²ÎÊýÅäÖÃ£¬Èç¹ûÄ³Ð©²ÎÊýÊÇÁ¬ÐøÊµÖµ»òÕßËÑË÷·¶Î§ÎÞ½ç£¬ÔÚÒýÓÃÍø¸ñËÑË÷Ö®Ç°ÐèÒª¶ÔÕâÐ©²ÎÊýÉèÖÃ±ß½ç²¢½øÐÐÀëÉ¢»¯¡£Ò»°ã¶øÑÔ£¬¶ÔÓÚÁ¬ÐøµÄ³¬²ÎÊý£¬²»ÄÜµÈ¼ä¸ô³éÈ¡½øÐÐÀëÉ¢»¯£¬ÐèÒª¸ù¾Ý³¬²ÎÊý±¾ÉíµÄÌØµãÀ´ÀëÉ¢»¯¡£ÀýÈç£¬¶ÔÓÚÑ§Ï°ÂÊ£¬Í¨³£ÊÇÔÚ¶ÔÊý³ß¶ÈÉÏ½øÐÐ²ÉÑù£¬Ñ¡È¡µÄÑ§Ï°ÂÊÒ»°ãÎª0.1£¬0.01£¬0.001µÈÊýÖµ£» µ«¶ÔÓÚDropoutÂÊ£¬¿ÉÄÜÔÚ£¨0£¬1£©½øÐÐ¾ùÔÈ²ÉÑù¸üºÏÊÊ¡£¶ÔÓÚ³¬²ÎÊýµÄËÑË÷·¶Î§£¬Ã¿¸ö³¬²ÎÊý×îÐ¡Öµ»òÕß×î´óÖµ¿ÉÒÔ»ùÓÚÏÈÇ°ÏàËÆÊµÑéµÃµ½µÄ¾­Ñé±£ÊØµØ½øÐÐÑ¡È¡£¬ÒÔ±£Ö¤×îÓÅµÄ³¬²ÎÊýÅäÖÃÔÚËÑË÷·¶Î§ÄÚ¡£ÔÚÈ·¶¨ÁËÃ¿¸ö³¬²ÎÊýµÄÓÐÏÞÖµ¼¯ºó£¬¾Í¿ÉÒÔ¶Ô²»Í¬³¬²ÎÊý×éºÏ½øÐÐËÑË÷ÁË£¬ÈçÍ¼5ª²25×óÍ¼Õ¹Ê¾ÁËÒ»¸öÖ»º¬ÓÐÁ½¸ö³¬²ÎÊýµÄÀý×Ó£¬¶ÔÓÚ¸ÃÀý£¬Ã¿¸ö³¬²ÎÊý¶¼°üº¬Èý¸ö¿ÉÄÜµÄÈ¡Öµ£¬Íø¸ñËÑË÷Ëã·¨Í¨¹ýÑ¡È¡²»Í¬³¬²ÎÊýÈ¡Öµ×éºÏ½øÐÐÑµÁ·£¬¼´Ñ¡ÔñÍ¼ÖÐÃ¿¸öÍø¸ñµãÀ´ÑµÁ·²»Í¬µÄÄ£ÐÍ£¬×îºóÔÚÑéÖ¤¼¯ÉÏ²âÊÔÕâÐ©Ä£ÐÍµÄÐÔÄÜ£¬Ñ¡È¡Ò»×éÐÔÄÜ×îºÃµÄÅäÖÃ¡£
Í¨³£ÐèÒª¶à´ÎÊ¹ÓÃÍø¸ñËÑË÷À´È·¶¨×îÓÅµÄÅäÖÃ£¬ÕâÑùÐ§¹û»á¸üºÃ¡£¶ÔÓÚ³¬²ÎÊý¦Á£¬ÔÚÆäÀëÉ¢»¯µÄÖµ¼¯ºÏ{-1£¬0£¬1}ÄÚÖ´ÐÐÍø¸ñËÑË÷´Ó¶øÈ·¶¨¦ÁµÄ×î¼ÑÈ¡ÖµÎª¼¯ºÏÖÐµÄ1£¬¼«ÓÐ¿ÉÄÜÊÇÒòÎªÉèÖÃµÄËÑË÷·¶Î§¹ýÐ¡£¬µÍ¹ÀÁË×îÓÅÖµ¦ÁËùÔÚµÄ·¶Î§£¬Òò´ËÐèÒª¸Ä±äËÑË÷µÄ·¶Î§£¬ÀýÈçÔÚ¼¯ºÏ{1£¬2£¬3}ÔÙ´Î½øÐÐËÑË÷¡£Êµ¼ùÖÐÍ¨³£²ÉÓÃ´ÖÏ¸Á£¶È½áºÏ½øÐÐËÑË÷£¬Ê×ÏÈ´Ó´ÖÁ£¶ÈÍø¸ñ¿ªÊ¼ËÑË÷£¬ÀýÈçÏÈÔÚ¼¯ºÏ{1£¬2£¬3}ÖÐ½øÐÐËÑË÷£¬Èç¹û×î¼ÑÖµÎª1£¬¾ÍËõÐ¡·¶Î§£¬Ï¸»¯ÎªÏ¸Á£¶ÈÍø¸ñ½øÐÐËÑË÷£¬ÔÚ¼¯ºÏ{-0.1£¬0£¬1}ÉÏ½øÐÐ¾«È·ËÑË÷¡£
Íø¸ñËÑË÷´æÔÚµÄÒ»¸öÎÊÌâÊÇ£¬Æä½öÊÊÓÃÓÚÍøÂçÖÐº¬ÉÙÁ¿³¬²ÎÊýµÄÇé¿ö£¬ÀýÈçº¬ÓÐÈý¸ö»òÕßÈý¸öÒÔÏÂµÄ³¬²ÎÊýµÄÍøÂç£¬³£ÓÃÍø¸ñËÑË÷¡£Ò»µ©³¬²ÎÊýÊýÁ¿Ã÷ÏÔÔö¼Ó£¬¼ÆËã´ú¼Û»áÏàÓ¦µØËæ×Å³¬²ÎÊýµÄÊýÁ¿³ÊÖ¸Êý¼¶Ôö³¤£¬¶ÔÓÚK¸ö³¬²ÎÊýµÄËùÓÐ¿ÉÄÜµÄÅäÖÃ£¬×Ü¹²ÐèÒªÑµÁ·m1¡Ám2¡Á¡­¡ÁmK¸öÄ£ÐÍ²¢ÐèÒª¶ÔÕâÐ©Ä£ÐÍ½øÐÐÐÔÄÜÆÀ¹À¡£¶ÔÓÚ½Ï´óµÄKºÍ¸ü¶àµÄ¿ÉÄÜÈ¡Öµ£¬¼ÆËãÁ¿¾Þ´ó£¬ËäÈ»¿ÉÒÔ²¢ÐÐµØÑµÁ·²»Í¬µÄÄ£ÐÍ£¬Ò²ÎÞ·¨Ìá¹©ÁîÈËÂúÒâµÄËÑË÷¹æÄ£¡£
3. Ëæ»úËÑË÷
Íø¸ñËÑË÷ÊÇÒ»ÖÖÇî¾¡ËùÓÐÍø¸ñµã£¨Ã¿¸öÍø¸ñµã´ú±íÒ»ÖÖ³¬²ÎÊýÅäÖÃ£©µÄ·½·¨£¬ÐèÒª¾Þ´óµÄÔËËãÁ¦¡£Ëæ»úËÑË÷×÷ÎªÍø¸ñËÑË÷µÄÌæ´ú·½·¨£¬¼òµ¥·½±ã£¬¿ÉÒÔ¿ìËÙµØÊÕÁ²µ½Á¼ºÃÈ¡Öµµã¡£ÓëÍø¸ñËÑË÷²»Í¬£¬Ëæ»úËÑË÷²»ÔÙ¶ÔËÑË÷·¶Î§½øÐÐ¹Ì¶¨²ÉÑù£¬¶øÊÇ¶Ô³¬²ÎÊý½øÐÐ¹Ì¶¨´ÎÊýµÄËæ»úËÑË÷£¬¶ÔÃ¿Ò»¸ö³¬²ÎÊýÔÚ¹Ì¶¨·¶Î§ÄÚ½øÐÐËæ»ú²ÉÑù£¬È»ºóÑ¡È¡Ò»¸öÐÔÄÜ×îÓÅµÄÅäÖÃ¡£
Ëæ»úËÑË÷±ÈÍø¸ñËÑË÷¸üÓÐÐ§µÄÔ­ÒòÔÚÓÚ£¬²»Í¬µÄ³¬²ÎÊý¶ÔÓÚÄ£ÐÍÐÔÄÜµÄÓ°ÏìÊÇ²»Í¬µÄ£¬¶ÔÓÚÄ³Ð©³¬²ÎÊýÀýÈçÑ§Ï°ÂÊ£¬¶ÔÄ£ÐÍÐÔÄÜÓ°Ïì½Ï´ó£¬¶øÁíÍâÒ»Ð©ÏñÕýÔò»¯ÏµÊýµÄ³¬²ÎÊý¶ÔÄ£ÐÍÐÔÄÜµÄÓ°Ïì¾ÍºÜÐ¡¡£Èç¹ûÊ¹ÓÃÍø¸ñËÑË÷£¬»áÔÚ²»ÖØÒªµÄ²ÎÊýÉÏ×ö´óÁ¿²»±ØÒªµÄ³¢ÊÔ£¬ÀýÈç¶ÔÓÚÄ³¸ö³¬²ÎÊý¦Á£¬ÆäÈ¡Öµ¶ÔÄ£ÐÍÐÔÄÜÓ°ÏìÉõÎ¢£¬´ËÊ±Íø¸ñËÑË÷¶ÔÓÚ¸Ã²ÎÊýµÄÁ½¸ö²»Í¬µÄÈ¡Öµ£¨ÆäËû³¬²ÎÊýÈ¡Öµ¶¼ÏàÍ¬µÄÇé¿öÏÂ£©»á¸ø³ö¼¸ºõÏàÍ¬µÄ½á¹û¡£¶øËæ»úËÑË÷ÖÐ£¬ÆäËû³¬²ÎÊýÈ¡ÖµÁ½´Î¶¼ÏàÍ¬µÄ¸ÅÂÊÊÇºÜµÍµÄ£¬Ëæ»úËÑË÷Ëæ»ú²ÉÑùµÄÁ½×é³¬²ÎÊýÅäÖÃÒ»°ã²»»áºÜÏàËÆ£¬ËùÒÔËæ»úËÑË÷»á±ÈÍø¸ñËÑË÷¸ü¿ìµØÕÒµ½½ÏÓÅÈ¡Öµ£¬¼õÉÙÁË¶Ô²»ÖØÒª²ÎÊýµÄ¹ý¶ÈÌ½Ë÷¡£
ÈçÍ¼5ª²25ËùÊ¾£¬Í¼ÖÐÓÐÁ½¸öÐèÒª½øÐÐËÑË÷µÄ³¬²ÎÊý£¬·Ö±ðÊ¹ÓÃÍø¸ñËÑË÷ºÍËæ»úËÑË÷µÃµ½Í¼Ê¾²ÉÑùµã¡£Á½¸ö³¬²ÎÊýÒ»¸ö±È½ÏÖØÒª£¬¶ÔÄ£ÐÍÐÔÄÜÓ°Ïì½Ï´ó£¬ÁíÍâÒ»¸ö¶ÔÄ£ÐÍÐÔÄÜÓ°Ïì½ÏÐ¡£¬Í¼ÖÐµÄÇúÏßÏÔÊ¾ÁËÖØÒª²ÎÊýÁ¼ºÃÈ¡ÖµµÄÎ»ÖÃ¡£¿ÉÒÔ¿´µ½£¬Èç¹û²ÉÓÃÍø¸ñËÑË÷¾ÍÖ»ÄÜ²ÉÑùµ½3¸öÖµ¶ø´í¹ýÁËÖØÒª²ÎÊýÁ¼ºÃÈ¡ÖµµÄÇøÓò¡£¶øËæ»úËÑË÷¿ÉÒÔÌ½Ë÷ÖØÒª±äÁ¿µÄ²»Í¬È¡Öµ£¬¾¡¿ìÕÒµ½Á¼ºÃÈ¡ÖµµÄÇøÓò£¬¿ÉÒÔÊ¹ÓÃ¸üÉÙµÄËÑË÷´ÎÊý¸ü¿ìËÙµØÈ·¶¨Á¼ºÃÈ¡Öµ¡£


Í¼5ª²25Íø¸ñËÑË÷ÓëËæ»úËÑË÷µÄ¶Ô±È



ÓëÍø¸ñËÑË÷ÀàËÆ£¬Í¨³£Ò²»áÓÉ´ÖÁ£¶Èµ½Ï¸Á£¶È½øÐÐ¶à´ÎËæ»úËÑË÷£¬»ùÓÚÇ°Ò»´ÎµÄ½á¹ûÏ¸»¯ËÑË÷·¶Î§À´¸Ä½øÏÂÒ»´ÎËÑË÷£¬Ö±µ½ÕÒµ½Ò»¸ö±È½ÏºÏÊÊµÄÅäÖÃ¡£
4. ±´Ò¶Ë¹ÓÅ»¯
³¬²ÎÊýµÄËÑË÷Ò²¿ÉÒÔ¿´×÷Ò»ÖÖÓÅ»¯ÎÊÌâ£¬½«³¬²ÎÊýÓÅ»¯ÎÊÌâÓÃÊ½£¨5ª²70£©±íÊ¾¡£

xª³=argminx¡Ê¦Öfx£¨5ª²70£©

ÆäÖÐ£¬¾ö²ß±äÁ¿xÊÇ³¬²ÎÊý£» ÓÅ»¯µÄÄ¿±êº¯Êýf(¡¤)ÊÇÑéÖ¤¼¯ÉÏµÄÐÔÄÜ¶ÈÁ¿£¬ÀýÈçÑéÖ¤¼¯ÉÏµÄ´íÎóÂÊ£» xª³ÊÇÀíÏëµÄ³¬²ÎÊý×éºÏ£¬ÊÇËÑË÷µÄÄ¿±ê£» ¦Ö±íÊ¾¿ÉÐÐ³¬²ÎÊýÓò£¬xµÄÈ¡Öµ¿ÉÒÔÊÇÓò¦ÖÖÐµÄÈÎºÎÖµ¡£¼òµ¥À´Ëµ£¬³¬²ÎÊýÓÅ»¯ÎÊÌâ¼´ÕÒµ½ÔÚÑéÖ¤¼¯ÐÔÄÜ¶ÈÁ¿ÉÏ±íÏÖ×î¼ÑµÄ³¬²ÎÊý¡£
Ò»¸ö±È½ÏºÏÀíµÄÏë·¨ÊÇÏñÑµÁ·Ä£ÐÍ²ÎÊýÒ»Ñù¶Ô³¬²ÎÊý½øÐÐÓÅ»¯£¬¼ÆËãÑéÖ¤¼¯ÉÏÎó²îº¯Êý¹ØÓÚ³¬²ÎÊýµÄÌÝ¶È£¬È»ºóÖ´ÐÐÌÝ¶ÈÏÂ½µËã·¨½øÐÐ¸üÐÂ¡£µ«ÊÇ£¬Õâ¸öÏë·¨´ó¶àÊýÇé¿öÏÂÊÇ²»¿ÉÊµÏÖµÄ£¬Ò»·½ÃæÒòÎª³¬²ÎÊýÓÅ»¯ÐèÒª¸ß¶îµÄ¼ÆËãºÍ´æ´¢³É±¾£» ÁíÒ»·½ÃæÎó²îº¯Êý¹ØÓÚ³¬²ÎÊý²»Ò»¶¨¿Éµ¼£¬ÒòÎªÄ³Ð©³¬²ÎÊý¿ÉÄÜÊÇÀëÉ¢µÄ¡£Õë¶ÔÒÔÉÏÎÊÌâ£¬Ìá³öÒ»ÏµÁÐ»ùÓÚÄ£ÐÍµÄ³¬²ÎÊýËÑË÷Ëã·¨£¬ÆäÖÐÖ®Ò»¾ÍÊÇ±´Ò¶Ë¹ÓÅ»¯£¨Bayesian Optimization£¬BO£©¡£ÓëÍøÂçËÑË÷ºÍËæ»úËÑË÷ÕâÖÖµ±Ç°ËÑË÷½á¹û¶ÀÁ¢ÓÚÀúÊ·ËÑË÷½á¹ûµÄ·½Ê½²»Í¬£¬±´Ò¶Ë¹ÓÅ»¯Ö¼ÔÚÑ°ÕÒ¸ü¼Ó¸ßÐ§µÄËÑË÷Ëã·¨£¬Æä³ä·ÖÀûÓÃÀúÊ·ËÑË÷½á¹û£¬²¢ÔÚ´Ë»ù´¡ÉÏ½øÐÐ½øÒ»²½µÄÌ½Ë÷¡£±´Ò¶Ë¹ÓÅ»¯¸ù¾ÝÀúÊ·ÐÅÏ¢¶ÔÄ¿±êº¯Êý½¨Á¢¸ÅÂÊÄ£ÐÍ£¬½«³¬²ÎÊýÓ³ÉäÎªÄ¿±êº¯ÊýµÄµÃ·Ö¸ÅÂÊpy|x£¬½¨Á¢µÄ¸ÅÂÊÄ£ÐÍ±»³ÆÎªÄ¿±êº¯ÊýµÄ¡°´úÀí¡±£¬Ñ¡ÔñÔÚ´úÀíº¯ÊýÉÏ±íÏÖ×î¼ÑµÄ³¬²ÎÊý£¬²¢ÓÃ´Ë³¬²ÎÊýÀ´ÆÀ¹ÀÄ¿±êº¯ÊýÒÔºâÁ¿Ñ¡ÔñµÄ³¬²ÎÊýµÄ±íÏÖ¡£È»ºó£¬¸Ã×é³¬²ÎÊýºÍÄ¿±êº¯Êý×é³ÉÐÂµÄÊý¾Ýµã¶Ô£¬×÷ÎªÀúÊ·ÐÅÏ¢¸üÐÂ¸ÅÂÊÄ£ÐÍÒÔÊµÏÖ¶ÔÄ¿±êº¯Êý¸ü¼Ó¾«×¼µÄ½¨Ä££¬ÔÙÔÚ¸üÐÂºóµÄÄ£ÐÍÉÏÑ¡Ôñ×îÓÐ¿ÉÄÜµÄ½â²¢ÆÀ¹ÀÄ¿±êº¯Êý£¬Èç´Ë·´¸´¡£Òò´Ë£¬±´Ò¶Ë¹ÓÅ»¯¿ò¼ÜÄÜ¹»Ê¹ÓÃ½ÏÉÙµÄÆÀ¹À´ÎÊýÇóµÃÄ¿±êº¯ÊýµÄ½üËÆ×îÓÅ½â¡£
ÐèÒª×¢ÒâµÄÊÇ£¬³¬²ÎÊýÓÅ»¯ÊÇÒ»¸ö¡°ºÚºÐÓÅ»¯¡±ÎÊÌâ£¬ÒòÎª¹ØÓÚ¾ö²ß±äÁ¿xµÄÄ¿±êº¯Êýfx²¢²»¿ÉÖª£¬¼´³¬²ÎÊýºÍÑéÖ¤¼¯ÉÏÐÔÄÜ¶ÈÁ¿ÖµÖ®¼äµÄÓ³Éä¹ØÏµÎÞ·¨»ñµÃ£¬Òò´ËÔÚÓÅ»¯µÄ¹ý³ÌÖÐÖ»ÄÜ»ñÈ¡Ä£ÐÍµÄÊäÈëÖµºÍÊä³öÖµ£¬²»ÄÜ»ñÈ¡Ä£ÐÍÑµÁ·¹ý³ÌÖÐµÄÌÝ¶ÈÐÅÏ¢£¬Ò²²»ÄÜÊ¹ÓÃÍ¹ÓÅ»¯·½·¨Çó½â¡£ÁíÍâ£¬ÆÀ¹ÀÄ¿±êº¯ÊýµÄ´ú¼ÛÊÇ°º¹óµÄ£¬ÒòÎª¶ÔÓÚ²»Í¬µÄ³¬²ÎÊýÅäÖÃ£¬ÒªÏë»ñÈ¡Ä¿±êº¯ÊýÖµÀ´ÆÀ¹À³¬²ÎÊýÅäÖÃÔÚÑéÖ¤¼¯ÉÏµÄ±íÏÖ£¬ÐèÒª°´ÕÕÑ¡È¡µÄ³¬²ÎÊýÅäÖÃ¶ÔÄ£ÐÍ½øÐÐÍêÕûµÄÑµÁ·£¬È»ºóÔÙÔÚÑéÖ¤¼¯ÉÏ½øÐÐÆÀ¹À£¬¼ÆËãÏàÓ¦µÄÐÔÄÜ¶ÈÁ¿£¬¶ÔÓÚÉî²ãÉñ¾­ÍøÂçÕâÖÖ¸´ÔÓÄ£ÐÍ£¬³¬²ÎÊýÊýÁ¿±È½Ï¶à£¬ÑµÁ·¸´ÔÓ¶È¸ß£¬ÖÜÆÚÒ²±È½Ï³¤£¬¿ÉÄÜÐèÒªÊýÌì²ÅÄÜÍê³É¡£¶ø±´Ò¶Ë¹ÓÅ»¯Ç¡ºÃ¿ÉÒÔ½â¾öÉÏÊöÎÊÌâ£¬ÆäÍ¨¹ýÑ¡Ôñ´úÀí¶ø·ÇÖ±½Ó¶ÔÄ¿±êº¯Êý½øÐÐÓÅ»¯£¬ÒòÎª´úÀíÓÐ¾ßÌåµÄÐÎÊ½ÇÒ±ÈÄ¿±êº¯Êý¸üÈÝÒ×ÓÅ»¯¡£ÁíÍâ£¬±´Ò¶Ë¹ÓÅ»¯³ä·ÖÀûÓÃÀúÊ·ÐÅÏ¢£¬¾¡Á¿¼õÉÙÆÀ¹ÀÄ¿±êº¯ÊýµÄ´ÎÊý£¬ÆÀ¹À´ú¼ÛÏà¶Ô½ÏµÍ¡£Òò´Ë£¬ÆäÔÚÄ¿±êº¯Êý±í´ïÊ½Î´Öª¡¢·ÇÍ¹¡¢¶à·å¡¢ÆÀ¹À´ú¼Û¸ß°º£¨ÐèÒª»¨·Ñ¸ß¶î´ú¼Û²ÅÄÜ¹Û²âµ½Ä¿±êº¯ÊýµÄ·µ»ØÖµ£©µÄ¸´ÔÓÓÅ»¯ÎÊÌâÉÏ±íÏÖÁ¼ºÃ£¬ÒÑ±»×÷ÎªÒ»ÖÖÓÐÐ§·½·¨¹ã·ºÊ¹ÓÃ¡£
ÔÚÆäËûÁìÓò£¬±´Ò¶Ë¹ÓÅ»¯Ò²±»³ÆÎªÐò¹á¿ËÀï½ðÓÅ»¯£¨Sequential Kriging Optimization£¬SKO£©¡¢»ùÓÚÄ£ÐÍµÄÐò¹áÓÅ»¯£¨Sequential Modelª²based Optimization£¬SMBO£©¡¢¸ßÐ§È«¾ÖÓÅ»¯£¨Efficient Global Optimization£¬EGO£©£¬ËüÊÇÒ»ÖÖ»ùÓÚÄ£ÐÍµÄÐò¹áÓÅ»¯·½·¨£¬ÔÚÇ°Ò»´ÎÆÀ¹ÀÍê³Éºó²ÅÄÜ½øÐÐÏÂÒ»´ÎÆÀ¹À£¬Òò´Ë±´Ò¶Ë¹ÓÅ»¯ÊÇË³ÐòµÄ¡£ÓÉÓÚÆäÀûÓÃÀúÊ·ÐÅÏ¢ÐÞÕýÓÅ»¯£¬Òò´ËÄÜºÄ·Ñ½ÏÉÙµÄÆÀ¹À´ú¼ÛµÃµ½Ò»¸ö½üËÆ×îÓÅ½â¡£±´Ò¶Ë¹ÓÅ»¯Ëã·¨Á÷³ÌÈç±í5ª²7ËùÊ¾£¬ÆäÓÅ»¯¹ý³ÌÊÇË³ÐòµÄ£¬ÌåÏÖÔÚÑ­»·ÌåÄÚÏàÍ¬²Ù×÷µÄ¶à´ÎÑ­»·¡£¶Ô¸ÃËã·¨½øÐÐ¼òµ¥½éÉÜ£º ÊäÈë²ÎÊýf¡¢¦Ö¡¢S¡¢M·Ö±ð±íÊ¾Ä¿±êº¯Êý¡¢¿ÉÐÐ³¬²ÎÊýÓò¡¢²É¼¯º¯Êý£¨Acquisition Function£©¡¢Ä¿±êº¯ÊýµÄ¸ÅÂÊ´úÀíÄ£ÐÍ£¨Probabilistic Surrogate Model£©¡£ÆäÖÐ£¬²É¼¯º¯ÊýºÍ¸ÅÂÊ´úÀíÄ£ÐÍÊÇ±´Ò¶Ë¹ÓÅ»¯¿ò¼ÜµÄºËÐÄ²¿·Ö£¬²É¼¯º¯ÊýÊÇÒ»ÖÖÑ¡Ôñ³¬²ÎÊýµÄ±ê×¼£¬Ä¿µÄÊÇÑ¡Ôñµ±Ç°×îÓÐÇ±Á¦µÄ½â´Ó¶ø±ÜÃâ²»±ØÒªµÄ²ÉÑù¡£´úÀíÄ£ÐÍÊÇÒÔ£¨³¬²ÎÊýÅäÖÃ£¬Ä¿±êº¯ÊýÖµ£©ÎªÊý¾Ýµã¶Ô½¨Á¢µÄÄ£ÐÍ£¬Ìæ´úÄ¿±êº¯Êý½øÐÐ½¨Ä£²¢½øÐÐÓÅ»¯£¬ÔÚÓÅ»¯¹ý³ÌÖÐ²»¶Ï¸ù¾ÝÐÂÔöµÄÊý¾Ýµã½øÐÐµ÷ÕûÒÔ¸üºÃµØ±Æ½üÄ¿±êº¯Êý¡£´úÀíÄ£ÐÍµÄÑ¡ÔñÓÐºÜ¶àÖÖ£¬³£ÓÃµÄÓÐËæ»úÉ­ÁÖ£¨Random Forest£¬RF£©¡¢¸ßË¹¹ý³Ì£¨Gaussian Processes£¬GPs£©µÈ¡£Í¬Àí£¬²É¼¯º¯ÊýÒ²ÓÐ¶àÖÖÑ¡Ôñ£¬³£ÓÃµÄÓÐÆÚÍû¸ÄÉÆ£¨Expected Improvement£¬EI£©º¯Êý¡¢¸ÅÂÊ¸ÄÉÆ£¨Probability of Improvement£¬PI£©º¯Êý¡¢¸ßË¹¹ý³ÌÖÃÐÅÉÏ½ç£¨GP Upper Confidence Bound£¬GPª²UCB£©µÈ¡£²»Í¬µÄ±´Ò¶Ë¹ÓÅ»¯·½·¨µÄ²É¼¯º¯ÊýºÍ´úÀíÄ£ÐÍÓÐËù²»Í¬£¬ÐèÒªÕë¶Ô¾ßÌåÎÊÌâ½øÐÐÑ¡Ôñ¡£
¶ÔÓÚ±´Ò¶Ë¹ÓÅ»¯Ëã·¨Á÷³ÌÃ¿Ò»²½µÄÏêÏ¸½âÊÍÈç±í5ª²7ËùÊ¾¡£


±í5ª²7±´Ò¶Ë¹ÓÅ»¯Ëã·¨Á÷³Ì



1. ÊäÈë²ÎÊý: f£¬¦Ö£¬S£¬M

2. ³õÊ¼»¯Êý¾Ý¼¯f,x¡úD£º Ê×ÏÈÔÚ¿ÉÐÐ³¬²ÎÊýÓòÖÐËæ»ú²ÉÑù£¬È»ºóÊ¹ÓÃÑ¡ÔñµÄ³¬²ÎÊýÅäÖÃÑµÁ·Ä£ÐÍ²¢½øÐÐÆÀ¹ÀÀ´¹¹Ôì³õÊ¼Êý¾Ý¼¯D={x1,y1,¡­,xn,yn}£¬ÆäÖÐyi=fxi£¬¸ÃÊý¾Ý¼¯ÓÃÀ´ÑµÁ·´úÀíÄ£ÐÍ¡£

3. ¶ÔÓÚ|D|¡Üi¡ÜT£¬Ö´ÐÐÈçÏÂ²Ù×÷£º ³õÊ¼»¯Êý¾Ý¼¯ºó½øÈëÑ­»·Ìå½øÐÐµü´úÓÅ»¯£¬TÎªÑ­»·´ÎÊý£¬ÐèÈËÎªÉè¶¨£¬ÊÇ²ÎÊýÑ¡ÔñµÄ´ÎÊý»òÕßÄ¿±êº¯ÊýÆÀ¹À´ÎÊý£¬Òò´ËT²»ÄÜÌ«´ó£¬ÒòÎªÆÀ¹ÀÄ¿±êº¯ÊýµÄ´ú¼ÛÊÇ°º¹óµÄ¡£

4. Ñ¡ÔñÄ£ÐÍº¯Êýpy|x,D¡û(M,D): ¸ù¾ÝÑ¡ÔñµÄ¸ÅÂÊ´úÀíÄ£ÐÍ£¬»ùÓÚÊý¾Ý¼¯D¿É¼ÆËãµÃµ½¾ßÌåµÄÄ£ÐÍº¯Êý±í´ïÐÎÊ½£¬´Ó¶øµÃµ½¶ÔÓÚ²»Í¬µÄÊäÈëÄ¿±êº¯ÊýµÄºóÑé¸ÅÂÊ¡£

5. xi¡ûargmaxx¡Ê¦ÖSx,py|x,D: ¸ù¾Ý´úÀíÄ£ÐÍ¸ø³öµÄ½á¹û£¬¼´Ä¿±êº¯ÊýµÄºóÑé¸ÅÂÊ·Ö²¼£¬ÓÉ²É¼¯º¯ÊýÈ·¶¨µÄ±ê×¼À´Ñ¡ÔñÏÂÒ»¸ö×î¾ßÇ±Á¦µÄ³¬²ÎÊý¡£

6. yi¡ûfxi£º Ê¹ÓÃÑ¡ÔñµÄ³¬²ÎÊý´úÈëÄ£ÐÍ½øÐÐÑµÁ·²¢ÆÀ¹À£¬µÃµ½Êä³öÖµyi¡£

7. D¡ûD¡Èxi,yi£º ×îºó½«ÐÂµÄÊý¾Ýµã¶Ô¼ÓÈëÊý¾Ý¼¯DÖÐ£¬×÷ÎªÀúÊ·ÐÅÏ¢ÒÔ¸ü¾«È·µØ¸üÐÂ´úÀíÄ£ÐÍ£¬ÕÆÎÕ¸ü¶àÐÅÏ¢µÄ´úÀíÄ£ÐÍ¶Ô³¬²ÎÊýµÄÑ¡Ôñ»áÔ½À´Ô½ÓÐ°ÑÎÕ¡£

ÏÂÃæ²ÉÓÃÒ»¸ö¾ßÌåµÄÀý×ÓÏêÏ¸ÃèÊö±´Ò¶Ë¹ÓÅ»¯µÄ¾ßÌåÁ÷³Ì£¬¸ÃÀý×ÓÊ¹ÓÃ¸ßË¹¹ý³Ì»Ø¹é½¨Á¢¸ÅÂÊ´úÀíÄ£ÐÍ¡£¼ÙÉèÄ¿±êº¯Êýfx·þ´Ó¸ßË¹¹ý³Ì£¬Ã¿´Îµü´úÍ¨¹ýÒÑÓÐµÄN×éÊµÑé½á¹ûD=xn,ynNn=1£¨ynÎªfxnµÄ¹Û²âÖµ£©¶Ô¸ßË¹¹ý³Ì½øÐÐ½¨Ä££¬Ôò¶ÔÓÚÈÎÒâ³¬²ÎÊý£¬Ä¿±êº¯ÊýÖµ¶¼·þ´Ó¸ßË¹·Ö²¼£¬¼´py|x,D=Ny|¦Ì,¦Ò2£¬¼ÆËã³öfxµÄºóÑé·Ö²¼±ã¿ÉÒÔÊ¹ÓÃ²É¼¯º¯ÊýÀ´È·¶¨ÏÂÒ»¸ö³¬²ÎÊý¡£Ê×ÏÈ£¬¶ÔÓÚ³õÊ¼Êý¾Ý¼¯D£¨ÓÐÈý¸öÊý¾Ýµã£©£¬Í¨¹ý¸ßË¹¹ý³Ì»Ø¹éµÃµ½²ÎÊýÔÚÃ¿Ò»¸öÈ¡Öµµã´¦Ä¿±êº¯ÊýµÄºóÑé¸ÅÂÊ·Ö²¼£¬Ã¿¸öµã¶¼·þ´Ó¸ßË¹·Ö²¼£¬ÐéÏß´ú±íµÄÊÇ´úÀíÄ£ÐÍÔ¤²âµÄÄ¿±êº¯ÊýµÄ¾ùÖµ£¬ÒõÓ°ÇøÓò´ú±íµÄÊÇÄ¿±êº¯ÊýÒÔ¾ùÖµÎªÖÐÐÄÒ»¸ö·½²îÄÚµÄÇøÓò£¬ÊµÏß´ú±íÕæÊµÄ¿±êº¯ÊýÖµ¡£¿ÉÒÔ¿´µ½¶ÔÓÚÒÑÖªµÄÊý¾Ýµã£¬Æä·½²îºÜÐ¡£¬ÒòÎªÆäÕæÊµÄ¿±êº¯ÊýÖµÊÇÒÑÖªµÄ£¬Òò´Ë¾ßÓÐ¸ß¶ÈÈ·¶¨ÐÔ¡£¶ÔÓÚÆäËû³¬²ÎÊý¶ÔÓ¦µÄµã£¬Ò²¸ø³öÁËÏàÓ¦µÄ¾ùÖµºÍ·½²î£¬ÆäÖÐ¾ùÖµ´ú±í¸ÃµãÆÚÍû»ñµÃµÄÐ§¹û£¬¾ùÖµÔ½´ó±íÊ¾¶ÔÓ¦¸ÃµãµÄ³¬²ÎÊýÅäÖÃÔÚÄ£ÐÍÉÏ±íÏÖÔ½ºÃ¡£Òò´Ë£¬Ö±¹ÛÉÏÓ¦µ±Ñ¡Ôñ¾ùÖµ½Ï´óµÄµã£¬¶ø·½²î·´Ó³¸ÃµãµÄÐ§¹ûµÄ²»È·¶¨ÐÔ£¬·½²îÔ½´óËµÃ÷¸ÃµãÊÇ·ñÄÜÔÚÄ£ÐÍÉÏÈ¡µÃÁ¼ºÃÐ§¹ûµÄ¸ÅÂÊÔ½²»ÄÜÈ·¶¨£¬¼«¿ÉÄÜ´øÀ´ÏÔÖøµÄÐ§¹ûÌáÉýÒ²ÓÐ¿ÉÄÜÐ§¹ûºÜ²î£¬Òò´ËÒ²Ó¦¸ÃÈ¥Ì½Ë÷¡£Èç¹û×·ÇóÎÈÍ×¶øÑ¡Ôñ¾ùÖµ´óµÄµã£¬Õâ³ÆÎªÀûÓÃ£¨Exploitation£©£¬¶øÃ°ÏÕÑ¡Ôñ·½²î´óµÄµãÔò³Æ×÷Ì½Ë÷£¨Exploration£©£¬²»Í¬µÄ³¡¾°Ó¦¸ÃÑ¡Ôñ²»Í¬µÄ²ßÂÔ¡£Èç¹ûÐèÒªÈ·¶¨³¬²ÎÊýÅäÖÃµÄÄ£ÐÍ±È½Ï¸´ÔÓ£¬ÑµÁ·ÆðÀ´·ÑÊ±·ÑÁ¦£¬ÕâÖÖÇé¿öÏÂÓ¦¾¡Á¿Ñ¡Ôñ¾ùÖµ½Ï´óµÄ³¬²ÎÊýÅäÖÃ£» ¶øÈç¹û¼ÆËãÁ¦×ã¹»ÇÒÄ£ÐÍÒ×ÓÚÑµÁ·£¬¾Í²»ÄÜ·ÅÆúÌ½Ë÷µÄ»ú»á£¬¿ÉÒÔÑ¡Ôñ·½²î½Ï´óµÄµãÒÔÌ½Ë÷ÐÔÄÜ¸üºÃµÄÅäÖÃ·½°¸¡£Êµ¼ÊÉÏ£¬²É¼¯º¯Êý¾ÍÊÇÔÚÀûÓÃºÍÌ½Ë÷Ö®¼äÈ¨ºâ£¬¸ø³ö×î´ó»¯²É¼¯º¯ÊýµÄ½â¡£ÀýÈç£¬UCBËã·¨ÖÐµÄ²É¼¯º¯ÊýÎª¾ùÖµ¼ÓÉÏn±¶µÄ·½²î£¬¸üÎª¸´ÔÓµÄEIº¯Êý£¬Æä±í´ïÊ½ÈçÏÂ£º 

EIx,D=¡Ò¡Þ£­¡Þmaxyª³£­y,0py|x,Ddy£¨5ª²71£©

ÆäÖÐ£¬yª³=minyn,1¡Ün¡ÜNÊÇµ±Ç°ÒÑÓÐÑù±¾ÖÐµÄ×îÓÅÖµ¡£¸ÃÓÅ»¯ÎÊÌâµÄÄ¿±êÊÇÑ°ÕÒÔÚµ±Ç°Ä£ÐÍpy|x,DÏÂ£¬fx³¬¹ýyª³µÄÆÚÍû×î´óµÄµãx¡£
¼ÙÉè±¾ÀýÖÐÊ¹ÓÃ×î¼òµ¥µÄUCBËã·¨£¬²¢½«²É¼¯º¯Êý»æ³ö£¬ÈçÍ¼5ª²26ËùÊ¾¡£×î´ó»¯²É¼¯º¯ÊýµÄµãÒÑÓÃÐÇºÅ±ê³ö£¬Ê¹ÓÃ¸Ãµã´ú±íµÄ³¬²ÎÊýÑµÁ·Ä£ÐÍ£¬²¢ÆÀ¹ÀÄ£ÐÍÔÚ¸Ã×é³¬²ÎÊý×éºÏÏÂµÄÐ§¹û£¬½«µÃµ½µÄ¹Û²âÊý¾Ý¼ÓÈëÊý¾Ý¼¯£¬ÔòÊý¾Ý¼¯ÄÚµÄÑù±¾¾Í±ä³ÉÁË4¸ö£¬Ê¹ÓÃÐÂµÄÊý¾Ý¼¯¸üÐÂ¸ÅÂÊÄ£ÐÍ£¬ÖØÐÂµÃµ½Ä¿±êº¯ÊýµÄºóÑé¸ÅÂÊ·Ö²¼²¢ÔÙ´Î¼ÆËã²É¼¯º¯Êý£¬ÈçÍ¼5ª²27ËùÊ¾¡£¿ÉÒÔ¿´µ½£¬Í¼ÖÐÓÒ±ßµãµÄ¾ùÖµºÍ·½²î¶¼±È½Ï´ó£¬Ó¦µ±×÷ÎªÌ½Ë÷µÄÇøÓò£¬²É¼¯º¯Êý¸ø³öÏàÍ¬µÄ½á¹û£¬Æä¸ø³öµÄÍÆ¼ö³¬²ÎÊýÎ»ÓÚÓÒ±ßÇøÓò¡£ÔÙ´ÎÊ¹ÓÃÍÆ¼öµÄ³¬²ÎÊýÑµÁ·ºÍÆÀ¹À£¬¸üÐÂÄ£ÐÍ£¬²»¶ÏÖØ¸´ÉÏÊö¹ý³Ì¡£Í¼5ª²28Õ¹Ê¾ÁËµ±Êý¾Ý¼¯ÓÐ7¸öÑù±¾Ê±µÄÐ§¹û£¬¿ÉÒÔ¿´µ½£¬µ±Ñù±¾Ô½À´Ô½¶àÊ±£¬¶ÔÓÚÄ¿±êº¯ÊýÔ¤²âµÄ²»È·¶¨ÐÔÖð½¥½µµÍ¡£ÒòÎª»ñµÃÁË¸ü¶àµÄÐÅÏ¢£¬ÐÞÕýµÄ¸ßË¹¹ý³Ì»áÔ½À´Ô½½Ó½üÄ¿±êº¯ÊýµÄÕæÊµ·Ö²¼£¬Òò´ËÄÜ¹»ÔÚ¼«ÉÙÑù±¾µÄÇé¿öÏÂ±Æ½üÕæÊµÄ¿±êº¯Êý¡£µ±È»£¬Êµ¼ÊÖÐÉî¶ÈÑ§Ï°ÖÐµÄ³¬²ÎÊýÓÅ»¯ÊÇÒ»¸öºÚºÐÎÊÌâ£¬²¢²»ÄÜµÃÖªÕæÊµµÄÄ¿±êº¯ÊýÇúÏß£¬Í¨¹ýÊ¹ÓÃ´úÀíÄ£ÐÍ¿ÉÒÔ½Ï´ó¸ÅÂÊÕÒµ½Ò»¸ö±íÏÖ²»´íµÄ½â¡£


±´Ò¶Ë¹ÓÅ»¯·½·¨ÒÑ¾­ÊÇÒ»ÖÖ±È½Ï³ÉÊìµÄ³¬²ÎÊýÓÅ»¯·½·¨£¬PythonÓïÑÔÖÐ¾ÍÓÐ¼¸¸ö±´Ò¶Ë¹ÓÅ»¯¿â¿ÉÒÔÖ±½Óµ÷ÓÃ£¬ËüÃÇ¹ØÓÚÄ¿±êº¯ÊýÊ¹ÓÃµÄ´úÀíËã·¨²»Í¬£¬ÀýÈçSpearmint£¨¸ßË¹¹ý³Ì´úÀí£©¡¢SMAC£¨Ëæ»úÉ­ÁÖ»Ø¹é£©¡¢TPE£¨Tree Parzen Estimator£¬ÆäÖÐÒ»ÖÖÊµÏÖÊÇHyperopt£©¡£±´Ò¶Ë¹ÓÅ»¯ÈÔÈ»ÊÇÒ»¸öÖØÒªµÄÑÐ¾¿ÁìÓò£¬¶ÔÓÚÆä´æÔÚµÄÖÖÖÖÎÊÌâ£¬ÒÑ´æÔÚ²¿·Ö½â¾ö´ëÊ©¡£ÀýÈçÊ¹ÓÃ¸ßË¹¹ý³Ì½¨Ä£ÐèÒª¼ÆËãÐ­·½²î¾ØÕóµÄ


Í¼5ª²26Ñù±¾ÊýÎª3Ê±¸ÅÂÊ´úÀíÄ£ÐÍ¸ø³öµÄÔ¤²âÒÔ¼°²É¼¯º¯Êý¸ø³öµÄÍÆ¼öµãÍ¼Æ¬À´×Ô£º tobe.±´Ò¶Ë¹ÓÅ»¯: Ò»ÖÖ¸üºÃµÄ³¬²ÎÊýµ÷ÓÅ·½Ê½£ÛZ/OL£Ý.https://zhuanlan.zhihu.com/p/29779000.




Í¼5ª²27Ñù±¾ÊýÎª4Ê±¸üÐÂµÄ¸ÅÂÊ´úÀíÄ£ÐÍºÍ²É¼¯º¯Êý¢Ù


Äæ¾ØÕó£¬Ê±¼ä¸´ÔÓ¶ÈÎªOn3£¬Ôò¿ÉÒÔÊ¹ÓÃÒ»ÏµÁÐ½üËÆ¼¼ÊõÔÚ¾«¶ÈºÍ¸´ÔÓ¶ÈÖ®¼äÈ¨ºâ¡£ÁíÍâ£¬¹ØÓÚ±´Ò¶Ë¹ÓÅ»¯Ëã·¨µÄÀ©Õ¹Ò²ÓÐºÜ¶àÑÐ¾¿£¬ÀýÈç¸ÅÂÊ´úÀíÄ£ÐÍÏò¸ßÎ¬À©Õ¹¡¢Ïò¶àÈÎÎñÀ©Õ¹¡¢Ïò¶³ÈÚ£¨Freezeª²thaw£©À©Õ¹¡£ÏàÓ¦µØ£¬¶ÔÓÚ²É¼¯º¯ÊýµÄÀ©Õ¹ÓÐ£º Ìá³ö¾ßÓÐ´ú¼ÛÃô¸ÐÐÔµÄ²É¼¯º¯Êý£¬½øÐÐ²¢ÐÐ»¯À©Õ¹µÈ¡£¶ÔÓÚ´Ë²¿·ÖÄÚÈÝ²»½øÐÐÏêÏ¸½éÉÜ£¬¸ÐÐËÈ¤µÄ¶ÁÕß¿É×ÔÐÐ²éÔÄÏà¹Ø×ÊÁÏ¡£


Í¼5ª²28Ñù±¾ÊýÎª7Ê±¸üÐÂµÄ¸ÅÂÊ´úÀíÄ£ÐÍºÍ²É¼¯º¯ÊýÍ¼Æ¬À´×Ô£º tobe.±´Ò¶Ë¹ÓÅ»¯: Ò»ÖÖ¸üºÃµÄ³¬²ÎÊýµ÷ÓÅ·½Ê½£ÛZ/OL£Ý.https://zhuanlan.zhihu.com/p/29779000.


5. ¶¯Ì¬×ÊÔ´·ÖÅä
¾¡¹Ü¶ÔÓÚ³¬²ÎÊýÓÅ»¯µÄÑÐ¾¿ÓÐºÜ¶à£¬µ«ÊÇ¾ø´ó¶àÊý¶¼½«³¬²ÎÊýÓÅ»¯ÎÊÌâ¿´×÷ºÚºÐÎÊÌâ£¬²¢ÇÒÖ»ÓÐÔÚÄ£ÐÍ¾­¹ýÍêÕûÑµÁ·ÖÁÊÕÁ²ºó²Å¶ÔÆä½øÐÐÆÀ¹À¡£¶ÔÓÚÉî²ãÉñ¾­ÍøÂç£¬Ã¿×é³¬²ÎÊýµÄÆÀ¹À´ú¼Û¹ý¸ß£¬Òò´Ë²¿·ÖÑÐ¾¿³¢ÊÔÀûÓÃÖÐ¼ä½á¹û£¬ÀýÈçJamiesonºÍTalwalkarÔÚËùÖøÂÛÎÄÖÐÌáµ½µÄ£¬ÀûÓÃÄ£ÐÍÑµÁ·µÄµü´úÊôÐÔ£¨Ê¹ÓÃÌÝ¶ÈÏÂ½µ·¨ÑµÁ·Ä£ÐÍ£©£¬½«³¬²ÎÊýÓÅ»¯ÊÓ×÷·ÇËæ»ú×îÓÅ±ÛÊ¶±ðµÄÒ»¸öÊµÀý£¬ÆÀ¹ÀÖÐ¼ä½á¹ûµÄÖÊÁ¿£¨²»ÓÃÍêÈ«ÑµÁ·µÄÄ£ÐÍ£©£¬ÔÚÑµÁ·µÄÔçÆÚ½×¶Î¾ÍÉáÆúÄÇÐ©ËÆºõ²»ºÏÊÊµÄ³¬²ÎÊýÅäÖÃ£¬¶ø½«¸ü¶àµÄ×ÊÔ´Áô¸øÓÐÏ£Íû»ñµÃ×î¼ÑÐ§¹ûµÄ³¬²ÎÊýÅäÖÃ£¬¼ÌÐø½øÐÐÑµÁ·¡£×îÓÅ±ÛÊ¶±ð£¨Best Arm Identification£©ÊÇ¶à±ÛÀÏ»¢»ú£¨Multiª²armed Bandits£©Ä¿±êº¯ÊýµÄÁ½ÖÖÐÎÊ½Ö®Ò»£¬Ö¼ÔÚ¸ø¶¨ÓÐÏÞµÄ´ÎÊýÄÚ£¬ÕÒµ½Ê¹Æ½¾ùÊÕÒæ×î´óµÄ±Û£» ¶ÔÓÚ¶à±ÛÀÏ»¢»úÎÊÌâ£¬ÓÐËæ»úºÍ·ÇËæ»úÁ½ÖÖÉèÖÃ¡£³¬²ÎÊýÓÅ»¯¿ÉÒÔ¿´×÷¶à±ÛÀÏ»¢»úÖÐ·ÇËæ»ú×îÓÅ±ÛÊ¶±ðÎÊÌâ£¬ÆäÖÐÃ¿Ò»¸öÒ¡±Û¶ÔÓ¦Ò»¸ö¹Ì¶¨µÄ³¬²ÎÊýÅäÖÃ£¨N¸öÒ¡±ÛÔò¶ÔÓ¦N×é³¬²ÎÊýÅäÖÃ£©£¬ Ò¡±Û´ÎÊýB¶ÔÓ¦ÓÚ¿ÉÀûÓÃµÄÓÐÏÞ×ÊÔ´×ÜÊý¡£Òò´Ë£¬ÎªÁËºÏÀíÀûÓÃ×ÊÔ´£¬½«¸ü¶àµÄ×ÊÔ´Áô¸ø¸üÓÐ¿ÉÄÜµÄÅäÖÃ£¬¼´ÔÚÄ£ÐÍÑµÁ·ÔçÆÚÍ£Ö¹ÄÇÐ©¿´ÆðÀ´²»Ì«ÓÐÏ£ÍûµÄ³¬²ÎÊýÅäÖÃ£¬Ê¹ÓÃ¸ü¶àµÄ×ÊÔ´¶ÔºòÑ¡µÄ³¬²ÎÊýÅäÖÃ½øÐÐ½øÒ»²½É¸Ñ¡£¬´ËÊ±Ã¿×éÅäÖÃµÃµ½µÄ×ÊÔ´¸ü¶à£¬Òò´ËÆÀ¹ÀµÄ½á¹û¸üÎª×¼È·£¬ÖðÂÖÉ¸Ñ¡Ö±ÖÁÈ·¶¨×îÓÅÅäÖÃ²¢Êä³ö¡£¶ÔÓÚ¸ÃÎÊÌâµÄ½â¾ö·½°¸¡ª¡ªÖð´Î¼õ°ë£¨Successive Halving£©Ëã·¨£¬Æä¾ßÌå¹ý³ÌÈçÍ¼5ª²29ËùÊ¾¡£

Ò»¹²½øÐÐT£¨T=log2n£­1£©ÂÖÉ¸Ñ¡£¬Ã¿ÂÖÉ¸Ñ¡Öð´Î¼õ°ëÖ±ÖÁÑ¡³ö×îÓÅµÄ³¬²ÎÊýÅäÖÃ¡£ÏÈ½«×ÜµÄ×ÊÔ´·ÖÎªT·Ý£¬Ã¿Ò»ÂÖÉ¸Ñ¡Ê¹ÓÃÒ»·Ý×ÊÔ´£¬µÚÒ»ÂÖÉ¸Ñ¡¶ÔËùÓÐ³¬²ÎÊýÅäÖÃ¶¼½øÐÐÆÀ¹À£¬Òò´ËµÚÒ»ÂÖÉ¸Ñ¡ÖÐÃ¿Ò»×é³¬²ÎÊýÅäÖÃ·Öµ½µÄ×ÊÔ´Îª×Ü×ÊÔ´µÄ1/TN£¬NÎª³¬²ÎÊýÅäÖÃ×éÊý¡£¸ù¾ÝÆÀ¹À½á¹ûÑ¡ÔñÒ»°ëÊýÁ¿µÄ³¬²ÎÊýÅäÖÃ½øÈëµÚ¶þÂÖÉ¸Ñ¡£¬µÚ¶þÂÖÉ¸Ñ¡Ö»ÓÐÒ»°ë



Successive Halving Algorithm

input:Budget B,n arms where £›i,k denotes the kth loss from the ith arm

Initialize: S0=£Ûn£Ý.

For k=0£¬1£¬¡­£¬¡¸log2(n)¢S-1

Pull each arm in Sk for rk=B£üSk£ü¡¸log2(n)¢S  additional times and set Rk=¡Ækj=0rj.

Let ¦Òk be a bijection on Sk such that £›¦Òk(1),Rk¡Ü£›¦Òk(2),Rk¡Ü¡­¡Ü£›¦Òk(£üSk£ü),Rk

Sk+1=£ûi¡ÊSk¡Ã£›¦Òk(i),Rk¡Ü£›¦Òk( ¢T£üSk£ü/2¡¹),Rk£ý

output: Singleton element of S ¡¸log2(n)¢S


Í¼5ª²29Öð´Î¼õ°ëËã·¨Í¼Æ¬À´×Ô£º Jamieson K£¬Talwalkar A.Nonª²stochastic best arm identification and hyperparameter optimization£ÛC£Ý//Artificial Intelligence and Statistics.2016: 240ª²248.



ÊýÁ¿µÄ³¬²ÎÊýÅäÖÃ£¬Æä¿ÉÀûÓÃµÄ×ÊÔ´ÈÔÈ»ÎªÒ»·Ý£¬Òò´ËÃ¿Ò»×é³¬²ÎÊý·Öµ½µÄ×ÊÔ´ÊÇµÚÒ»ÂÖµÄÁ½±¶£¬Òò´ËÓÐ¸ü¶àµÄ×ÊÔ´½øÐÐ¸ü×¼È·µÄÆÀ¹À¡£ÔÙ¸ù¾ÝÆÀ¹À½á¹û¼ÌÐøÉ¸Ñ¡Ö±µ½Êä³ö×îÓÅÅäÖÃ£¬É¸Ñ¡ÂÖÊýÔ½¶àÃ¿×é³¬²ÎÊý·ÖÅäµ½µÄ×ÊÔ´Ô½¶à¡£ÔÚÖð´Î¼õ°ëËã·¨ÖÐ£¬³¬²ÎÊýÅäÖÃµÄÊýÁ¿NÊ®·Ö¹Ø¼ü£¬ËùÓÐµÄ³¬²ÎÊýÅäÖÃ¶¼ÊÇ´Ó¿ÉÐÐ³¬²ÎÊýÓòÖÐ²ÉÑùµÃµ½µÄ¡£Èç¹û²ÉÑùµÄÊýÁ¿Ô½¶à£¬ÄÇÃ´²ÉÑùÖÐ°üº¬×î¼ÑÅäÖÃµÄ¿ÉÄÜÐÔÔ½¸ß¡£µ«ÊÇ×ÜÌåÉÏ£¬Ã¿×éÅäÖÃ·Öµ½µÄ×ÊÔ´Ò²Ô½ÉÙ£¬ÔçÆÚÆÀ¹ÀµÄ½á¹û¾ÍºÜÓÐ¿ÉÄÜ²»×¼È·¡£·´Ö®£¬Èç¹ûÑ¡ÔñµÄN½ÏÐ¡£¬¶ÔÓÚ³¬²ÎÊýµÄÆÀ¹À¾Í»áÔ½×¼È·£¬µ«ºÜÓÐ¿ÉÄÜÎÞ·¨µÃµ½×îÓÅÅäÖÃ£¬Òò´ËNµÄÉèÖÃÊÇÒ»¸ö¹Ø¼üÎÊÌâ¡£À´×Ô JMLR 2018 ×îÐÂµÄÑÐ¾¿Ìá³öÒ»ÖÖ¸Ä½øËã·¨¡ª¡ªHyperBand£¬Í¨¹ý³¢ÊÔ²»Í¬µÄNÀ´Ñ¡È¡×îÓÅµÄ³¬²ÎÊý¡£Ëã·¨Á÷³ÌÈçÍ¼5ª²30ËùÊ¾£¬±¾ÖÊÊÇÔÚÖð´Î¼õ°ë·¨µÄÍâ²ãÔö¼ÓÒ»²ãÑ­»·£¬Íâ²ãÑ­»·ÓÃÓÚÈ·¶¨ºÏÊÊµÄNÖµ£¬²»Í¬Ñ­»·²ÉÑùµÃµ½ÓÃÓÚÆÀ¹ÀµÄ³¬²ÎÊý×éºÏµÄÊýÁ¿²»Í¬£¬¶øÄÚ²ãÑ­»·¼´Öð´Î¼õ°ëËã·¨£¬Í¨¹ýÖð




Algorithm 1: HYPERBAND algorithm for hyperparameter optimization.

input: R,¦Ç(default ¦Ç=3)

initialization: smax=¢Tlog¦Ç(R)¡¹,B=(smax+1)R
1for s¡Ê{smax,smax-1,¡­,0} do

2

3
4
5
6
7
8
9
n=
BR¦Çs(s+1)  ,r=R¦Ç-s
//begin SUCCESSIVEHALVING with (n,r) inner loop
T=get_hyperparameter_configuration(n)
for i¡Ê{0,¡­,s} do

ni=¢Tn¦Ç-i¡¹
ri=r¦Çi
L={run_then_return_val_loss(t,ri):t¡ÊT}
T=top_k(T,L,¢Tni/¦Ç¡¹)
end

10end
11return Configuration with the smallest intermediate loss seen so far.


Í¼5ª²30HyperBandËã·¨Í¼Æ¬À´×Ô£º Li L£¬Jamieson K£¬DeSalvo G£¬et al.Hyperband: a novel banditª²based approach to hyperparameter optimization£ÛJ£Ý.Journal of Machine Learning Research,2017,18(1): 6765ª²6816.


ÂÖÉ¸Ñ¡ÌôÑ¡³ö×îÓÅµÄ³¬²ÎÊýÅäÖÃ¡£ÎÄÖÐ¸ø³öÁËÒ»¸ö»ùÓÚMNISTÊý¾Ý¼¯¶ÔLeNetÍøÂçÊ¹ÓÃHyperBandËã·¨½øÐÐ³¬²ÎÊýµ÷ÓÅµÄÊ¾Àý£¬²¢½«µü´ú´ÎÊý¶¨ÒåÎªÔ¤Ëã£¨budget£©£¬¼´Ò»¸öepoch´ú±íÒ»¸öÔ¤Ëã¡£³¬²ÎÊýËÑË÷¿Õ¼ä°üÀ¨Ñ§Ï°ÂÊ¡¢ÓÃÓÚÅúÁ¿ÌÝ¶ÈÏÂ½µµÄÅú´óÐ¡¡¢¾í»ýºËÊýÄ¿µÈ£¬Í¼5ª²31µÄ±íÖÐ¸ø³öÁËÐèÒªÑµÁ·µÄ³¬²ÎÊý×éµÄÊýÁ¿ºÍÃ¿×é³¬²ÎÊý×ÊÔ´·ÖÅäÇé¿ö¡£sÎª²»Í¬µÄÍâ²ãÑ­»·£¬²»Í¬Ñ­»·ÖÐ³¬²ÎÊýÅäÖÃÊýÁ¿N²»Í¬£¬·Ö±ðÎª81¡¢27¡¢9¡¢6ºÍ5£» niÎªÄÚ²ãÑ­»·Öð´Î¼õ°ëËã·¨µÚiÂÖÐèÒªÆÀ¹ÀÉ¸Ñ¡µÄ³¬²ÎÊýÅäÖÃµÄÊýÁ¿£» riÎªÃ¿Ò»×éÅäÖÃ·ÖÅäµÃµ½µÄ×ÊÔ´¡£¾­¹ýÖðÂÖÉ¸Ñ¡µÃµ½µ±Ç°N×é³¬²ÎÊýÅäÖÃÏÂ£¬ÆÀ¹ÀÐÔÄÜ×îºÃµÄÒ»×é¡£Í¼5ª²31ÖÐÓÒÍ¼¸ø³öÁË²»Í¬µÄs£¨´ú±í²»Í¬µÄN£©¶ÔËÑË÷½á¹ûµÄÓ°Ïì£¬¿ÉÒÔ¿´µ½s=0£¨¶ÔÓ¦N=81£©»òÕßs=4£¨¶ÔÓ¦N=5£©±íÏÖ¶¼²»ÊÇ×îºÃµÄ£¬Òò´ËÑ¡ÔñºÏÊÊµÄNÊµ¼ÊÉÏÊÇ¶ÔÀûÓÃºÍÌ½Ë÷µÄÈ¨ºâ£¬¹ØÓÚ¸ÃËã·¨µÄ¾ßÌåÏ¸½Ú¿É²Î¿¼Ïà¹ØÂÛÎÄ¡£



Í¼5ª²31²»Í¬µÄsÊ¹ÓÃHyperBandËã·¨µÄ±íÏÖÍ¼Æ¬À´×Ô£º Li L£¬Jamieson K£¬DeSalvo G£¬et al.Hyperband: a novel banditª²based approach to hyperparameter optimization£ÛJ£Ý.Journal of Machine Learning Research,2017,18(1): 6765ª²6816.


ÉÏÊöËã·¨ÖÐ¶Ô³¬²ÎÊýµÄ²ÉÑùÄ¬ÈÏÊ¹ÓÃ¾ùÔÈËæ»ú²ÉÑù£¬ÓÐÐ©Ëã·¨ÔÚ´Ë»ù´¡ÉÏ½áºÏÁË±´Ò¶Ë¹ÓÅ»¯½øÐÐ²ÉÑù£¬ÀýÈçBOHBËã·¨¡£BOHBËã·¨ÒÀÀµHyperBandËã·¨À´¾ö¶¨Ã¿´ÎÔËÐÐ¶àÉÙ×é²ÎÊýºÍÃ¿×é²ÎÊý·ÖÅä¶àÉÙÔ¤Ëã£¬ËüµÄ¸Ä½øÖ®´¦ÊÇ½« HyperBandËã·¨ÖÐÃ¿¸öÑ­»·¿ªÊ¼Ê±Ëæ»úÑ¡Ôñ²ÎÊýµÄ·½·¨Ìæ»»³ÉÒÀÀµÀúÊ·Êý¾Ý½¨Á¢Ä£ÐÍ£¨±´Ò¶Ë¹ÓÅ»¯£©½øÐÐ²ÎÊýÑ¡Ôñ¡£Ò»µ©±´Ò¶Ë¹ÓÅ»¯Éú³ÉµÄ²ÎÊý´ïµ½µü´úËùÐèµÄÅäÖÃÊý£¬ ¾Í»áÊ¹ÓÃÕâÐ©ÅäÖÃÖ´ÐÐ±ê×¼µÄÖð´Î¼õ°ëËã·¨¡£¹Û²ìÕâÐ©²ÎÊýÔÚ²»Í¬×ÊÔ´·ÖÅäÏÂµÄ±íÏÖ£¬ÔÚºóÐøµü´úÖÐÓÃ×÷±´Ò¶Ë¹ÓÅ»¯Ä£ÐÍÑ¡Ôñ²ÎÊýµÄ»ù×¼Êý¾Ý¡£ÎÞÂÛÊÇÖð´Î¼õ°ëËã·¨»¹ÊÇHyperBandËã·¨£¬¶¼ÊÇÔÚ¸ø¶¨ÓÐÏÞ×ÊÔ´µÄÌõ¼þÏÂ£¬¸üºÃµØÀûÓÃ×ÊÔ´ÕÒµ½×îÓÅ³¬²ÎÊý£¬²¢ÇÒ¿ÉÒÔºÍ±´Ò¶Ë¹ÓÅ»¯Ëã·¨½øÐÐÈÚºÏ¡£
6. Éñ¾­¼Ü¹¹ËÑË÷
Éñ¾­ÍøÂçÖÐµÄ³¬²ÎÊý¿ÉÒÔ¸ù¾ÝÆäÊôÐÔ·ÖÎªÁ½Àà¡£Ò»ÀàÊÇÓëÑµÁ·ÓÐ¹ØµÄ³¬²ÎÊý£¬ÀýÈçÑ§Ï°ÂÊ¡¢ÅúÁ¿´óÐ¡¡¢ÕýÔò»¯ÏµÊýÒÔ¼°Ñ§Ï°ÂÊË¥¼õÏµÊýµÈ¡£¶øÁíÒ»ÀàÔòÊÇÓëÍøÂç½á¹¹ÓÐ¹ØµÄ³¬²ÎÊý£¬ÀýÈçÍøÂçµÄÍØÆË½á¹¹£¬°üÀ¨ÍøÂç²ãÊýÒÔ¼°²ã¼äµÄÁ¬½Ó¹ØÏµ¡¢²ãµÄÀàÐÍÑ¡Ôñ¡¢²ãÖ®¼äµÄ×éÖ¯ÅÅ²¼µÈ£» ²ãÄÚ²¿Ò²°üÀ¨¸÷ÖÖ¸÷ÑùµÄ³¬²ÎÊý£¬ÀýÈç¾í»ý²ãÖÐ¾í»ýºËµÄ´óÐ¡¡¢ÊýÁ¿¡¢²½³¤ÒÔ¼°ÊÇ·ñÊ¹ÓÃÁãÌî³äµÈ£¬»¹ÓÐ³Ø»¯´óÐ¡¡¢²½³¤µÄÑ¡ÔñÒÔ¼°²ÉÓÃÄÄÖÖ³Ø»¯·½Ê½µÈ¡£²¿·ÖÎÄÕÂ½«Éî¶ÈÑ§Ï°ÖÐÖ»ÓëÑµÁ·ÓÐ¹ØµÄ³¬²ÎÊýÓÅ»¯³ÆÎª³¬²ÎÊýÓÅ»¯£» ¶ø½«µ÷½ÚÓëÍøÂç½á¹¹ÓÐ¹ØµÄ³¬²ÎÊý³ÆÎªÉñ¾­¼Ü¹¹ËÑË÷£¨Neural Architecture Search£¬NAS£©£¬¶Ô¸ÃÀà³¬²ÎÊý½øÐÐµ÷Õû»á¸Ä±äÉñ¾­ÍøÂçµÄ½á¹¹£¬ÆäÓÅ»¯±¾ÖÊ¼´Í¨¹ý´óÁ¿³¢ÊÔÀ´Ì½Ë÷Ò»ÖÖ¸üÎªºÏÀíµÄÍøÂç½á¹¹¡£ÒÑ¾­·¢ÏÖµÄ²¢ÇÒÖ¤Ã÷±íÏÖÁ¼ºÃµÄ¼¸ÖÖÉñ¾­ÍøÂç¼Ü¹¹Í¨³£¶¼ÊÇÓÉÓÐÊýÄê¾­ÑéµÄ×¨¼ÒÉè¼ÆµÄ£¬¶øNAS×÷ÎªÒ»ÖÖÐÂÐËÑÐ¾¿·½Ïò£¬Ö¼ÔÚ½«Éñ¾­ÍøÂç½á¹¹Éè¼ÆµÄ¹ý³Ì×Ô¶¯»¯£¬Ê¹µÃ·ÇÉñ¾­ÍøÂçÁìÓò×¨¼ÒÒ²ÄÜ¸ù¾Ý¾ßÌåÈÎÎñÊ¹ÓÃ×Ô¶¯Éè¼ÆµÄÄ£ÐÍÀ´½â¾öÎÊÌâ£¬ÓÐÐ§½µµÍÉñ¾­ÍøÂçµÄÊ¹ÓÃºÍÊµÏÖ³É±¾¡£ÂÛÎÄA Survey on Neural Architecture Search×Ü½áÁË½ØÖÁ2019ÄêËùÓÐÓëNASÏà¹ØµÄ¹¤×÷£¬NAS×÷Îª×Ô¶¯»úÆ÷Ñ§Ï°£¨Automatic Machine Learning£¬AutoML£©µÄ×ÓÁìÓòÖ®Ò»£¬Ö÷ÒªÓÃÀ´Ì½Ë÷Éî¶ÈÑ§Ï°ÖÐµÄÍøÂç½á¹¹¡£¸ÃÎÄÖÐ×÷ÕßÌá³öÁËÒ»ÖÖÐÎÊ½»¯µÄ·½·¨£¬ÓÃÓÚÍ³Ò»²¢·ÖÀàÏÖÓÐµÄ¹ØÓÚÉñ¾­¼Ü¹¹ËÑË÷µÄ·½·¨¡£ÈçÍ¼5ª²32ËùÊ¾£¬¹¹³ÉNASµÄÈýÒªËØÎªËÑË÷¿Õ¼ä¡¢ËÑË÷²ßÂÔºÍÐÔÄÜÆÀ¹À²ßÂÔ£¬ÆäËÑË÷Á÷³ÌÈçÍ¼5ª²32ËùÊ¾¡£¶ÔÓÚ¸ø¶¨µÄ¡°ËÑË÷¿Õ¼ä¡±£¨¼´ºòÑ¡Éñ¾­ÍøÂç¼Ü¹¹¼¯ºÏ£©£¬Ê¹ÓÃÄ³ÖÖËÑË÷²ßÂÔ´ÓÕâÐ©ºòÑ¡¼Ü¹¹ÖÐËÑË÷³ö×îÓÅµÄÉñ¾­ÍøÂç¼Ü¹¹£¬¶ÔÓÚËÑË÷³öµÄÓÅÐãÉñ¾­ÍøÂç¼Ü¹¹£¬Ê¹ÓÃÆÀ¹À²ßÂÔÆÀ¹À¸Ã¼Ü¹¹µÄÐÔÄÜ£¬³£ÓÃµÄÐÔÄÜÖ¸±êÓÐ¾«¶È¡¢ËÙ¶ÈµÈ¡£


Í¼5ª²32Éñ¾­¼Ü¹¹ËÑË÷¿ò¼ÜÍ¼



ËÑË÷¿Õ¼ä¶¨ÒåÁË¿ÉÒÔËÑË÷µÄ¼Ü¹¹ÀàÐÍÒÔ¼°ÐÎÊ½»¯ÃèÊö½á¹¹¡£´ÓÊýÑ§ÉÏ¿´£¬Éñ¾­ÍøÂçÊÇÒ»¸öº¯Êý£¬¶ÔÊäÈë±äÁ¿½øÐÐÒ»ÏµÁÐ²Ù×÷µÃµ½Êä³ö£¬Òò´ËÉñ¾­ÍøÂç¿ÉÒÔÓÃ¼ÆËãÍ¼ÓïÑÔÐÎÊ½»¯µØ±íÊ¾ÎªÎÞ¹ÂÁ¢½ÚµãµÄÓÐÏòÎÞ»·Í¼£¨DAG£©£¬ÓÉÓÚÉñ¾­ÍøÂçµÄ²ãÊý¡¢²ãÄÚ³¬²ÎÊýÊýÁ¿¶¼²»¹Ì¶¨£¬Òò´ËÓÃÓÚÃèÊöÍøÂç½á¹¹µÄ²ÎÊýÊÇ±ä³¤µÄ¡£ËÑË÷¿Õ¼äµÄÉè¼ÆÊÇÉñ¾­¼Ü¹¹ËÑË÷µÄÖØÒª×é³É²¿·Ö£¬ºÃµÄËÑË÷¿Õ¼ä²»½ö¿ÉÒÔ¼ÓËÙËÑË÷¹ý³Ì£¬»¹»áÓ°ÏìËÑË÷µÄ³ÖÐøÊ±¼äºÍ¼Ü¹¹µÄÖÊÁ¿¡£ÔçÆÚµÄNAS¹¤×÷ÖÐ£¬ÓÉÓÚµ±Ê±µÄÉñ¾­ÍøÂç¶¼ÊÇ»ùÓÚÁ´Ê½µÄÇ°À¡ÐÍÍøÂç£¬¿Õ¼äµÄÉè¼ÆÖ÷ÒªÊÇÓÃÓÚËÑË÷Á´Ê½½á¹¹¡£Ëæ×ÅResNet¡¢DenseNet¡¢Skip ConnectionµÈ½á¹¹µÄ³öÏÖ£¬·ÖÖ§¼Ü¹¹ÔÚÐÔÄÜÉÏ³¬Ô½ÁË´«Í³ÍøÂç£¬NASÒ²½«ÕâÖÖ·ÖÖ§¼Ü¹¹ÄÉÈë¿¼ÂÇ£¬Ìá³öÁËºÏÊÊµÄËÑË÷¿Õ¼ä£¬¿ÉÒÔ²úÉú¸ü¼Ó¶àÑùµÄ¼Ü¹¹¡£ÁíÍâ£¬NAS»¹¿¼ÂÇÁËº¬ÓÐºÜ¶àÖØ¸´Ä£¿éµÄ½á¹¹£¬ÀýÈçInception¡¢DenseNet¡¢ResNetµÈ¡£ÕâÐ©ÖØ¸´µÄÄ£¿é±»³ÆÎªcell»òÕßblock£¬ÏàÓ¦µØÌá³öÁË»ùÓÚcellµÄËÑË÷£¬Ì½Ë÷cellµÄÄÚ²¿½á¹û²¢°´Ò»¶¨µÄ·½Ê½½øÐÐ×éºÏ¡£ÎÄÖÐ½«ËÑË÷¿Õ¼ä·ÖÎªÈ«¾ÖËÑË÷¿Õ¼äºÍ»ùÓÚcellµÄËÑË÷¿Õ¼ä£¬Ç°ÕßÊÇÎª±íÊ¾Õû¸öÉñ¾­¼Ü¹¹µÄÍ¼¶¨ÒåµÄ£» ºóÕß¼Ù¶¨Éñ¾­¼Ü¹¹ÊÇÓÉÈô¸Écell×é³ÉµÄ£¬ÕâÐ©cell±»ÖØ¸´ÓÃÓÚ¹¹½¨ÍêÕûµÄÍøÂç£¬ÆäÍ¨¹ý¼õÉÙ×ÔÓÉ¶È´ïµ½¼õÐ¡ËÑË÷¿Õ¼äµÄÄ¿µÄ£¬²¢ÇÒÊ¹µÃËÑË÷µ½µÄ½á¹¹ÔÚÊý¾Ý¼¯Ö®¼ä¾ßÓÐ¸üºÃµÄÇ¨ÒÆÄÜÁ¦¡£×ÜÌåÀ´Ëµ£¬»ùÓÚcellµÄËÑË÷¿Õ¼ä£¨ÌØ±ðÊÇNASNetÒÑ³ÉÎªÁìÓò¹æ·¶£©ÊÇÌ½Ë÷ÐÂ¼Ü¹¹µÄÁ¼ºÃÑ¡Ôñ¡£
ËÑË÷²ßÂÔ¶¨ÒåÁËÈçºÎÔÚËÑË÷¿Õ¼äÖÐÕÒµ½×îÓÅµÄÍøÂç½á¹¹£¬Æä±¾ÖÊÊÇÒ»¸öÓÅ»¯ÎÊÌâ£¬Í¨¹ý×î´ó»¯ÑéÖ¤¼¯ÉÏµÄÄ¿±êº¯ÊýÀ´ÕÒµ½×îÓÅµÄ½á¹¹¦Á*£¬ÐÎÊ½»¯±íÊ¾Îª

¦Á*=argmax¦Á¡ÊAf¦Á£¨5ª²72£©

ÆäÖÐ£¬AÎªËÑË÷¿Õ¼ä£¬f(¡¤)Îª¸ø¶¨½á¹¹ÔÚÑéÖ¤¼¯ÉÏÊ¹ÓÃÑ¡ÔñµÄÐÔÄÜÆÀ¹À²ßÂÔ¸ø³öµÄÐÔÄÜ¶ÈÁ¿£¬ÒòÎªf(¡¤)ÊÇ²»¿ÉÖªµÄ£¬¹ÊÉñ¾­¼Ü¹¹ËÑË÷Êµ¼ÊÉÏÊÇÒ»¸öºÚºÐÓÅ»¯ÎÊÌâ¡£ÎÄÖÐ¸ø³öÁË4ÖÖµäÐÍµÄÓÅ»¯·½·¨£º Ç¿»¯Ñ§Ï°¡¢½ø»¯Ëã·¨¡¢»ùÓÚ´úÀíÄ£ÐÍµÄÓÅ»¯ºÍÒ»´ÎÐÔ¼Ü¹¹ËÑË÷¡£ÆäÖÐ£¬Ç¿»¯Ñ§Ï°ÏµÁÐºÍ½ø»¯Ëã·¨ÏµÁÐÓÐ×Å²»´íµÄ±íÏÖ¡£


Í¼5ª²33Ç¿»¯Ñ§Ï°ÓÃÓÚÉñ¾­¼Ü¹¹ËÑË÷

»ùÓÚÇ¿»¯Ñ§Ï°µÄNASËã·¨½«Éñ¾­ÍøÂç½á¹¹Éè¼ÆÊÓÎªÇ¿»¯Ñ§Ï°ÎÊÌâ£¬×îÖÕÏ°µÃÄÜ¹»²úÉúÍøÂç½á¹¹µÄ×îÓÅ²ßÂÔ¡£NASÈÎÎñÖÐ£¬¼Ü¹¹µÄÉú³É¿ÉÒÔ¿´×÷ÖÇÄÜÌå£¨agent£©Ñ¡ÔñÒ»ÏµÁÐ¶¯×÷£¨action£©£¬¶ø½±Àø£¨reward£©ÔòÊÇÉú³ÉµÄ¼Ü¹¹ÔÚÑéÖ¤¼¯ÉÏµÄÐÔÄÜ¶ÈÁ¿¡£Í¨¹ý½«½±Àø´«»ØÖÇÄÜÌå£¬Ê¹µÃÖÇÄÜÌå½øÐÐµ÷Õû´Ó¶ø×ö³ö¸üºÃµÄ¶¯×÷£¬Ñ§Ï°µ½Ô½À´Ô½ºÃµÄÍøÂç½á¹¹£¬ÈçÍ¼5ª²33ËùÊ¾¡£Ê¹ÓÃÇ¿»¯Ñ§Ï°½øÐÐÉñ¾­¼Ü¹¹ËÑË÷µÄÁ½Ïî¿ª´´ÐÔ¹¤×÷·Ö±ðÎªÂéÊ¡Àí¹¤Ñ§ÔºµÄDesigning Neural Network Architectures using Reinforcement LearningºÍGoogle¹«Ë¾µÄNeural Architecture Search with Reinforcement Learning¡£Ç°Õß½«ÍøÂç¼Ü¹¹ËÑË÷½¨Ä£³ÉÂí¶û¿É·ò¾ö²ß¹ý³Ì£¬Ê¹ÓÃQª²LearningËã·¨²úÉúCNN¼Ü¹¹£» ºóÕßÊ¹ÓÃ»ùÓÚ²ßÂÔÌÝ¶ÈÓÅ»¯µÄ·½·¨£¬Ê¹ÓÃRNNª²controller²ÉÑùÉú³ÉÃèÊöÍøÂç½á¹¹µÄ×Ö·û´®£¬¶ÔÉú³ÉµÄ½á¹¹½øÐÐÑµÁ·²¢ÆÀ¹À£¬È»ºóÊ¹ÓÃREINFORCEÑ§Ï°¿ØÖÆÆ÷µÄ²ÎÊý£¬Ê¹¿ØÖÆÆ÷²úÉú×¼È·ÂÊ¸ü¸ßµÄ½á¹¹¡£ºóÀ´Google¹«Ë¾Ìá³öÁËNASNet£¬Í¨¹ýÏÞ¶¨ÍøÂç½á¹¹µÄÀàÐÍ£¬¶ÔËÑË÷¿Õ¼ä½øÐÐ¼ò»¯£¬¼´Ê¹ÓÃ»ùÓÚcellµÄËÑË÷¿Õ¼ä£¬ÒÀ¾ÉÊ¹ÓÃ²ßÂÔÌÝ¶È·½·¨À´Ñ§Ï°¸Ã¿Õ¼äÏÂµÄ¿ØÖÆÆ÷²ÎÊý£¬¾ßÌåÊ¹ÓÃPPO£¨Proximal Policy Optimization£©Ëã·¨¶Ô¿ØÖÆÆ÷²ÎÊý½øÐÐ¸üÐÂ¡£ÎªÌáÉýËÑË÷Ð§ÂÊ£¬Google¹«Ë¾ÏÈºóÌá³öÁËPNAS£¨Progressive Neural Architecture Search£©·½·¨ºÍENAS£¨Efficient Neural Architecture Search£©·½·¨£¬Ç°ÕßÊ¹ÓÃ¡°»ùÓÚÐòÁÐÄ£ÐÍÓÅ»¯£¨SMBO£©¡±µÄ²ßÂÔÈ¡´úNASNetËùÓÃµÄÇ¿»¯Ñ§Ï°£» ºóÕßÍ¨¹ýÔÚ¸÷¸öÍøÂçÖ®¼ä¹²ÏíÈ¨ÖØÀ´¼õÉÙ¼ÆËãÁ¿¡£
½ø»¯Ëã·¨£¨Evolutionary Algorithm£¬EA£©ÊÇÒ»ÖÖÕë¶ÔºÚºÐÎÊÌâµÄ»ùÓÚÖÖÈºµÄÈ«¾ÖÓÅ»¯·½·¨£¬ÓÉÒÔÏÂ»ù±¾×é¼þ×é³É£º ³õÊ¼»¯¡¢¸¸´úÑ¡Ôñ¡¢ÖØ×éºÍ±äÒì¡¢ÐÒ´æÕßÑ¡Ôñ¡£³õÊ¼»¯¶¨ÒåÁËÈçºÎ²úÉúµÚÒ»´úÖÖÈº£¬Íê³É³õÊ¼»¯ºó£¬ÖØ¸´ÒÔÏÂ²½ÖèÖ±µ½Ëã·¨ÖÕÖ¹£¬ÈçÍ¼5ª²34ËùÊ¾¡£


Í¼5ª²34½ø»¯Ëã·¨ÓÃÓÚÉñ¾­¼Ü¹¹ËÑË÷


£¨1£© ´ÓÖÖÈºÖÐÑ¡Ôñ¸¸´ú¡£
£¨2£© ÖØ×éºÍ±àÒë²úÉúÐÂµÄ¸öÌå¡£
£¨3£© ÆÀ¹ÀÐÂ¸öÌåµÄÊÊÓ¦¶È¡£
£¨4£© Ñ¡ÔñÖÖÈºµÄÐÒ´æÕß¡£
ÔÚÉñ¾­¼Ü¹¹ËÑË÷ÈÎÎñÖÐ£¬ÖÖÈºÓÉÒ»×éÍøÂç½á¹¹×é³É¡£Ê×ÏÈ£¬Ëæ»ú³õÊ¼»¯Èô¸ÉÍøÂç½á¹¹×÷Îª³õÊ¼ÖÖÈº£¬ÔÚ²½Öè£¨1£©ÖÐÑ¡ÔñÒ»¸ö¸¸´ú½á¹¹»òÕß¶ÔÒ»¶Ô½á¹¹½øÐÐ±äÒì»òÖØ×é£¬¸Ã²Ù×÷Ê¹µÃËÑË÷¿Õ¼äÖÐ²úÉúÁËÐÂµÄÍøÂç½á¹¹¡£²½Öè£¨3£©¶ÔÕâÐ©½á¹¹¼ÆËãÊÊÓ¦¶ÈÖµ£¨¼´Éñ¾­ÍøÂçÔÚÑéÖ¤¼¯ÉÏµÄ¾«¶È£©£¬¾­¹ýÖØ×éºÍ±äÒì£¬ÖÖÈº¹æÄ£ËæÖ®Ôö³¤£¬¡°ÐÒ´æÕßÑ¡Ôñ¡±ÊÇÎªÁË¼õÐ¡ÖÖÈº¹æÄ££¬²¢Ê¹¸öÌåÖ®¼äµÄ¾ºÕù³ÉÎª¿ÉÄÜ¡£²»¶ÏÖØ¸´ÉÏÊö¹ý³Ì£¬Ö±µ½ÕÒµ½×îÓÅÍøÂç½á¹¹¡£ÒÅ´«Ëã·¨£¨Genetic Algorithms£¬GA£©ÊÇÒ»Àà¹ã·ºÓ¦ÓÃÓÚÉñ¾­½á¹¹ËÑË÷µÄ½ø»¯Ëã·¨¡£ÓÃ½ø»¯Ëã·¨½â¾ö NAS ÎÊÌâ£¬²»Í¬µÄ¹¤×÷¾Û½¹ÔÚ²»Í¬µÄ·½Ãæ£¬ÀýÈçÈçºÎÑ¡Ôñ¸¸´ú£¬ÈçºÎ¸üÐÂÖÖÈº£¬ÈçºÎÉú³É×Ó´úÖÖÈºµÈ¡£ÎÄÖÐ¸ø³öÁË6¸ö»ùÓÚEAµÄNASÏà¹Ø¹¤×÷µÄ±È½Ï£¬ÏêÇé¿É²Î¿¼ÂÛÎÄ¡£
³ýÁËÇ¿»¯Ñ§Ï°ºÍ½ø»¯Ëã·¨£¬ÁíÒ»Àà±È½ÏÐÂµÄ·½·¨Îª»ùÓÚÌÝ¶ÈµÄ·½·¨¡£Í¨¹ý½«ÀëÉ¢µÄËÑË÷¿Õ¼ä±ä³ÉÁ¬Ðø¿Õ¼ä£¬Ä¿±êº¯Êý±äÎª¿ÉÎ¢º¯Êý£¬È»ºóÊ¹ÓÃ»ùÓÚÌÝ¶ÈµÄÓÅ»¯·½·¨¸ßÐ§µØÑ°ÕÒ×îÓÅ½á¹¹£¬ÆäÖÐDARTS·½·¨ºÍNeural Architecture OptimizationÖÐÌá³öµÄ·½·¨¶¼ÊÇ»ùÓÚÌÝ¶ÈµÄ¡£
³ýÁËÉÏÊöÈýÖÖÖ÷Á÷·½·¨Íâ£¬Êµ¼ÊÉÏ»¹ÓÐºÜ¶àÆäËûËÑË÷²ßÂÔÓÃÓÚÉñ¾­¼Ü¹¹ËÑË÷£¬ÀýÈç»ùÓÚÄ£ÐÍµÄÐòÁÐÓÅ»¯£¨ÉÏÎÄÌáµ½µÄPNAS£©¡¢ÃÉÌØ¿¨ÂÞÊ÷ËÑË÷£¨MCTS£©¡¢±´Ò¶Ë¹ÓÅ»¯µÈ¡£ÓÉÓÚÉñ¾­½á¹¹ËÑË÷µÄµÍÐ§ÐÔ£¬ËÑË÷¿Õ¼ä¾Þ´óÒÔ¼°ÆÀ¹ÀÐÔÄÜÐèÒª¶ÔÄ£ÐÍ½øÐÐÑµÁ·µ¼ÖÂ¹ý´óµÄ¼ÆËãÁ¿£¬Ê¹µÃNASÎÞ·¨½øÐÐÍÆ¹ã£¬Òò´ËºóÐøºÜ¶à¹¤×÷¶¼ÊÇÕë¶ÔÐ§ÂÊÎÊÌâÕ¹¿ªµÄ¡£³£¼ûµÄ·½·¨ÓÐ²ã´Î»¯±íÊ¾£¨ÀýÈçNASNetÊ¹ÓÃ»ùÓÚcellµÄËÑË÷¿Õ¼ä¼õÉÙÁËËÑË÷¹æÄ££©¡¢È¨ÖØ¹²Ïí£¨ÀýÈçENASÁîËùÓÐµÄ×ÓÍøÂçÖØÓÃÈ¨ÖØ¶ø·Ç¶ÔÃ¿¸öºòÑ¡Ä£ÐÍ´ÓÍ·ÑµÁ·£©¡¢±íÏÖÔ¤²â£¨ÀýÈçPNASÖÐÊ¹ÓÃ´úÀíÄ£ÐÍÀ´ÆÀ¹ÀºòÑ¡Ä£ÐÍµÄÐÔÄÜ´Ó¶ø¼õÉÙ´óÁ¿ÑµÁ·Ê±¼äµÄºÄ·Ñ£©¡£Ëæ×ÅNASµÄ·¢Õ¹£¬×÷ÎªÐÂµÄÑÐ¾¿·½Ïò£¬Ìá³öÒ»ÏµÁÐ±äÖÖ¼°À©Õ¹¡£ÀýÈç¶àÄ¿±ê¼Ü¹¹ËÑË÷£¬Í¬Ê±¿¼ÂÇ¼Ü¹¹ÐÔÄÜ¡¢´æ´¢¿Õ¼ä¡¢Ä£ÐÍ´óÐ¡¡¢¼ÆËãÁ¿¡¢¹¦ºÄµÈ¶à¸öÄ¿±ê¡£ÁíÍâ£¬ÒÑ¿ª·¢µÄ½á¹¹ËÑË÷¼¼ÊõÒ²ÒÑ¾­À©Õ¹µ½Éî¶ÈÑ§Ï°µÄÏà¹Ø×é¼þµÄ¸ß¼¶×Ô¶¯»¯£¬ÀýÈçËÑË÷¼¤»îº¯Êý¡¢×Ô¶¯Êý¾ÝÔöÇ¿¡¢Ä£ÐÍÑ¹ËõµÈ¡£NAS×÷Îªµ±Ç°¸ßÈÈµÄÑÐ¾¿·½Ïò£¬Ö¼ÔÚ°ïÖúÈËÃÇ×Ô¶¯ËÑË÷ÊÊºÏµ±Ç°ÈÎÎñµÄÉî¶ÈÉñ¾­ÍøÂç£¬ÒÔÊ¹ÓÃ½ÏµÍ³É±¾»ñµÃ×îÓÅµÄÉî¶ÈÄ£ÐÍ¡£Ä¿Ç°£¬ÒÑ¾­²úÉúÁËÒ»Ð©×Ô¶¯»¯¹¤¾ß¿ÉÒÔÊ¹ÓÃ£¬ÀýÈçGoogle¹«Ë¾ÍÆ³öÏàÓ¦µÄÆ½Ì¨CLOUD AUTOML£¬Ê¹µÃÓÃ»§ÎÞÐë¾ß±¸Éî¶ÈÑ§Ï°»òÕßÈË¹¤ÖÇÄÜÏà¹ØÖªÊ¶±³¾°£¬Ö»Ðè¸ù¾Ý¸ø¶¨µÄÑµÁ·¼¯ºÍÈÎÎñ¾ÍÄÜÇáËÉµØÑµÁ·³ö¸ßÐÔÄÜµÄÉî¶ÈÍøÂç£¬µ«ÊÇ¸ÃÆ½Ì¨ÊÇÊÕ·ÑµÄ¡£ÁíÒ»¿îNAS¿ªÔ´¿ò¼ÜAUTO KERAS£¨GitHubµØÖ·Îªhttps://github.com/jhfjhfj1/autokeras£©ÒÔÂÛÎÄEfficient Neural Architecture Search with Network Morphism£¨¼´ENAS£©×öÖ¸µ¼£¬»ùÓÚ±´Ò¶Ë¹ÓÅ»¯À´ËÑË÷Éî¶ÈÄ£ÐÍ¡£¶ÁÕß¿É×ÔÐÐ°²×°Autoª²Keras£¬²¢³¢ÊÔ¸ø¶¨Êý¾Ý¼¯Ê¹ÓÃAUTO KERAS×Ô¶¯Ö´ÐÐ¼Ü¹¹ËÑË÷¡£
¶Ô³¬²ÎÊýÖ´ÐÐ½»²æÑéÖ¤£¬½»²æÑéÖ¤ÊÇÔÚÑµÁ·¼¯ÉÏ½øÐÐÑµÁ·£¬È»ºóÔÚÑéÖ¤¼¯ÉÏÑéÖ¤ÕâÐ©³¬²ÎÊýµÄÊÔÑéÐ§¹û¡£Ê×ÏÈ£¬ÐèÒªÑ¡ÔñÏàµ±·ÖÉ¢µÄÊýÖµ£¬ÔÚ¼¸¸öepochÖÐ½øÐÐµü´ú£¬¾­¹ýµü´ú¿ÉÒÔÅÐ¶ÏÊýÖµµÄºÃ»µ²¢×ö³öÏàÓ¦µÄµ÷Õû£¬ÕâÑù¾Í¿ÉÒÔ·¢ÏÖÒ»¸ö¸ü¾«È·µÄ²ÎÊýÇø¼ä£¬²¢½øÒ»²½ËÑË÷¸ü¾«È·µÄÖµ¡£ÓÉÓÚ²»¶Ï¼õÐ¡ËÑË÷Çø¼äµÄ¹ý³Ì·Ç³£ºÄ·ÑÊ±¼ä£¬¿ÉÒÔ²ÉÓÃÀàËÆNANS¼¤ÔöÕâÑùµÄ¼¼ÇÉ£¬ÑµÁ·²ÎÊýÊ±£¬ÔÚÃ¿Ò»¸öµü´ú»òÕßepoch¹Û²ì´ú¼Û£¬Èç¹û³öÏÖÒ»¸öÔ¶Ô¶´óÓÚ³õÊ¼´ú¼ÛµÄÖµ£¬ÀýÈç³¬¹ýÁË3±¶£¬¾ÍÈÏÎªÕâ²»ÊÇÒ»¸öÕýÈ·µÄ·½Ïò£¬ÔòÌø³öÑ­»·Í£Ö¹¶Ô¸Ã²ÎÊýµÄÑµÁ·¡£Óë¾ùÔÈ²ÉÑùÏà±È£¬ÔÚÇø¼äÄÚÊ¹ÓÃ10µÄÃÝÖ¸Êý½øÐÐ²ÉÑùÐ§¹û¸üºÃ¡£
Ñ§Ï°ÂÊ¡¢²»Í¬ÀàÐÍµÄË¥¼õ±í¡¢¸üÐÂÀàÐÍÕýÔò»¯ÒÔ¼°ÍøÂç½á¹¹Òþ²Ø²ãµÄÊýÁ¿ºÍÉî¶È£¬ÕâÐ©¶¼ÊÇ¿ÉÒÔÓÅ»¯µÄ³¬²ÎÊý¡£Êµ¼ÊÖÐ£¬ÓÐ´óÁ¿µÄ³¬²ÎÊýÓÅ»¯²ÉÓÃ½»²æÑéÖ¤·½Ê½¹Û²ìÄÄÐ©ÅäÖÃÐ§¹û¸üºÃ¡£Í¨¹ý¼à²âºÍ¿ÉÊÓ»¯ËðÊ§º¯ÊýÇúÏß¿ÉÒÔ¿´µ½ÄÄÐ©Ñ§Ï°ÂÊÖµÊÇºÃµÄ£¬ÄÄÐ©Ñ§Ï°ÂÊÖµÊÇ²»ºÃµÄ¡£
5.5.3¼¯³ÉÑ§Ï°
¼¯³ÉÑ§Ï°£¨Ensemble Learning£©×÷ÎªÒ»ÖÖÔÚ¸÷Àà»úÆ÷Ñ§Ï°±ÈÈüÖÐ¾­³£Ê¹ÓÃµÄ¼¼ÇÉ£¬Êµ¼ùÖÐ×ÜÄÜÎÈ¶¨ÌáÉýÄ£ÐÍµÄÐÔÄÜ¡£¼¯³ÉÑ§Ï°Í¨¹ýÑµÁ·¶à¸öÄ£ÐÍ²¢½«ÕâÐ©Ä£ÐÍ×éºÏÆðÀ´ÒÔÈ¡µÃ±Èµ¥¸öÄ£ÐÍ¸üºÃµÄÐÔÄÜ£¬ÆäÖÐ¶à¸öÄ£ÐÍ±»³ÆÎªÈõÑ§Ï°Æ÷£¬¿ÉÒÔ×÷ÎªÉú³É¸´ÔÓÄ£ÐÍµÄ¹¹¼þ¡£ÕâÐ©ÈõÑ§Ï°Æ÷»ùÓÚÍ¬Ò»ÈÎÎñ£¬Í¨¹ýÑù±¾ÈÅ¶¯¡¢ÊäÈëÌØÕ÷ÈÅ¶¯¡¢Êä³ö±íÊ¾ÈÅ¶¯¡¢Ëã·¨²ÎÊýÈÅ¶¯µÈ·½Ê½Éú³É£¬È»ºóÊ¹ÓÃÄ³ÖÖ½áºÏ²ßÂÔ½øÐÐ¼¯³É´Ó¶øÉú³ÉÇ¿Ñ§Ï°Æ÷¡£¼¯³ÉÑ§Ï°µÄÁ½¸öºËÐÄÎÊÌâÊÇÈçºÎÉú³ÉÈõÑ§Ï°Æ÷ºÍÈçºÎ×éºÏÈõÑ§Ï°Æ÷¡£¿ÉÒÔÍ¨¹ýÊ¹ÓÃ²»Í¬µÄÄ£ÐÍ¡¢²»Í¬µÄÑµÁ·Ëã·¨¡¢²»Í¬µÄÄ¿±êº¯ÊýµÈÉú³É²»Í¬µÄÈõÑ§Ï°Æ÷£¬²¢ÇÒÕâÐ©ÈõÑ§Ï°Æ÷ÐèÒªÂú×ã¡°ºÃ¶ø²»Í¬¡±£¬²ÅÄÜ³ä·Ö·¢»Ó¼¯³ÉÑ§Ï°µÄ×÷ÓÃ£¬¼´ÒªÇóÈõÑ§Ï°Æ÷¾¡Á¿Âú×ãÔ¤²â¾«×¼ÐÔºÍ¶àÑùÐÔ¡£³£¼ûµÄ×éºÏ²ßÂÔÓÐÆ½¾ù·¨£¨°üÀ¨ËãÊõÆ½¾ùºÍ¼ÓÈ¨Æ½¾ù£©¡¢Í¶Æ±·¨£¨Ö÷ÒªÓÐÏà¶Ô¶àÊýÍ¶Æ±·¨¡¢¾ø¶Ô¶àÊýÍ¶Æ±·¨¡¢¼ÓÈ¨Í¶Æ±·¨ÈýÖÖ£©ºÍStacking²ßÂÔ¡£ÆäÖÐ£¬Stacking²ßÂÔÊÇÔÚÈõÑ§Ï°Æ÷µÄ»ù´¡ÉÏÔÙÌí¼ÓÒ»²ãÈ¨ÖØÑ§Ï°Æ÷£¨Meta Learner£©£¬¸ÃÑ§Ï°Æ÷½«ÈõÑ§Ï°Æ÷µÄÔ¤²â½á¹û×÷ÎªÊäÈëµÃµ½×îÖÕµÄÔ¤²â½á¹û¡£
´«Í³¼¯³ÉÑ§Ï°ÖÐ£¬ËùÓÐÈõÑ§Ï°Æ÷¶¼ÊÇÍ¬ÖÊµÄ£¬¼´Èç¹ûÊ¹ÓÃ¾ö²ßÊ÷Ëã·¨£¬ÄÇÃ´¶ÔËùÓÐÈõÑ§Ï°Æ÷¶¼Ê¹ÓÃ¾ö²ßÊ÷¡£µ«ÊÇ£¬ÏÖÔÚ¼¯³ÉÑ§Ï°µÄ¶¨Òå¸ü¼Ó¹ã·º£¬ÓÃÓÚ¼¯³ÉµÄÄ£ÐÍÒ²¿ÉÒÔÊÇÒìÖÊµÄ¡£ÎªÇø·Ö£¬Ç°Õß³ÆÎªÍ¬ÖÊ¼¯³É£¬ºóÕß³ÆÎªÒìÖÊ¼¯³É¡£¾ßÓÐ´ú±íÐÔµÄ¼¯³ÉÑ§Ï°·½·¨Ö÷ÒªÓÐBaggingºÍBoosting¡£ 
1. Bagging
Bagging£¨Bootstrap Aggregating£©µÄÖ÷ÒªË¼ÏëÊÇ¶ÀÁ¢²¢ÐÐµØÑµÁ·¶à¸ö²»Í¬µÄÑ§Ï°Æ÷£¬ËùÓÐÑ§Ï°Æ÷¹²Í¬¾ö¶¨²âÊÔÑù±¾µÄÊä³ö¡£¸Ã·½·¨ÌåÏÖÁË×ÔÖú²ÉÑù·¨µÄË¼Ïë¡£Ê×ÏÈ£¬Í¨¹ýÓÐ·Å»ØµØ²ÉÑù¹¹ÔìN¸öÊý¾Ý¼¯ÓÃÓÚÑµÁ·N¸öÑ§Ï°Æ÷£¬Ã¿¸öÊý¾Ý¼¯µÄÑù±¾ÊýÁ¿ÓëÔ­Ê¼Êý¾Ý¼¯Ò»ÖÂ£¬Òò´Ë¿ÉÄÜÓÐÖØ¸´µÄÑù±¾£¬²¢ÇÒÈ±ÉÙ²¿·ÖÔ­Ê¼ÑµÁ·¼¯ÖÐµÄÑù±¾¡£Í¨¹ý×ÔÖú²ÉÑù·¨µÃµ½µÄÊý¾Ý¼¯ÖÐ´ó¸ÅÓÐ2/3µÄÊý¾ÝÓëÔ­Ê¼Êý¾Ý¼¯Ò»ÖÂ£¬²¢ÇÒ²»Í¬µÄÊý¾Ý¼¯È±Ê§ºÍÖØ¸´µÄ²¿·Ö¸÷²»ÏàÍ¬£¬ÑµÁ·¼¯Ö®¼äµÄ²îÒìÔì³ÉÑµÁ·³öµÄÑ§Ï°Æ÷Ö®¼äÒ²¾ßÓÐ²îÒìÐÔ¡£Í¼5ª²35ÎªBaggingÓÃÓÚ¼¯³ÉÑ§Ï°µÄÊ¾ÒâÍ¼¡£ÑµÁ·µÃµ½N¸öÈõÑ§Ï°Æ÷ºó£¬BaggingµÄ½áºÏ²ßÂÔ·Ç³£¼òµ¥£¬¶ÔÓÚ·ÖÀàÈÎÎñ£¬¿ÉÒÔ¸ù¾ÝN¸öÈõÑ§Ï°Æ÷µÄ½á¹ûÍ¶Æ±¾ö¶¨Êä³öÖµ£» ¶ÔÓÚ»Ø¹éÎÊÌâ£¬Ôò¿ÉÒÔÈ¡N¸öÑ§Ï°Æ÷Êä³ö½á¹ûµÄËãÊõÆ½¾ùÖµ¡£


Í¼5ª²35BaggingÊµÏÖ¼¯³ÉÑ§Ï°µÄÊ¾ÒâÍ¼



Ëæ»úÉ­ÁÖ£¨Random Forest£¬RF£©ÊÇ²ÉÓÃBaggingË¼ÏëµÄÒ»¸ö¾ßÌåÊµÀý£¬ÆäÒÔ¾ö²ßÊ÷×÷ÎªÈõÑ§Ï°Æ÷£¬È»ºó²ÉÓÃBagging¼¯³É¼¼ÊõÑµÁ·µÃµ½Ëæ»úÉ­ÁÖÄ£ÐÍ¡£Bagging×÷ÎªÒ»´óÀà¼¯³É·½·¨£¬ÄÜ¹»ÓÐÐ§½µµÍ·º»¯Îó²î£¬ÒÖÖÆÄ£ÐÍµÄ¹ýÄâºÏÎÊÌâ£¬Ê¹µÃ¼¯³ÉµÃµ½µÄÄ£ÐÍ±Èµ¥Ò»Ä£ÐÍ¸üÕýÔò»¯£¬Ê¹µÃ¼¯³ÉµÄÄ£ÐÍ·º»¯ÄÜÁ¦¸üÇ¿¡£
2. Boosting
Bagging·½·¨ÖÐ¸÷¸öÈõÑ§Ï°Æ÷Ö®¼ä»¥Ïà¶ÀÁ¢£¬Óë´Ë²»Í¬£¬BoostingÖÐÈõÑ§Ï°Æ÷Ö®¼ä´æÔÚÇ¿ÒÀÀµ¹ØÏµ£¬¸÷¸öÈõÑ§Ï°Æ÷±ØÐëË³ÐòÉú³É¡£BoostingµÄ¹¤×÷»úÖÆÎª£º Ê×ÏÈ£¬Ê¹ÓÃ³õÊ¼ÑµÁ·¼¯ÑµÁ·Ò»¸öÈõÑ§Ï°Æ÷£» È»ºó£¬¸ù¾ÝÕâ¸öÈõÑ§Ï°Æ÷µÄ±íÏÖ£¬»ùÓÚÏÈÇ°µÄÄ£ÐÍ½øÐÐµ÷Õû£» ÕâÑùÖØ¸´N´Î¾Í¿ÉÒÔÉú³ÉN¸öÈõÑ§Ï°Æ÷£¬Ã¿Ò»¸öÈõÑ§Ï°Æ÷¶¼±ÈÇ°Ò»¸öÈõÑ§Ï°Æ÷ÓÐÐÔÄÜÉÏµÄÌáÉý¡£°´ÕÕÕâÖÖ·½·¨£¬ÕâÐ©ÈõÑ§Ï°Æ÷±ØÐëË³ÐòÉú³É£¬ÎÞ·¨²¢ÐÐ»¯¡£Boosting¿ò¼Ü½«ÕâÐ©Ä£ÐÍ½øÐÐ¼ÓÈ¨×éºÏÉú³ÉÇ¿Ñ§Ï°Æ÷£¬ÕâÀïÈõÑ§Ï°Æ÷¼È¿ÉÒÔÊ¹ÓÃÍ¬ÖÊÄ£ÐÍÒ²¿ÉÒÔÊ¹ÓÃÒìÖÊÄ£ÐÍ£¬³£ÓÃ×÷ÈõÑ§Ï°Æ÷µÄËã·¨ÓÐÉñ¾­ÍøÂçºÍ¾ö²ßÊ÷µÈ¡£
BoostingÏµÁÐËã·¨±È½ÏÖøÃûµÄÓÐAdaBoost£¨Adaptive Boosting£©Ëã·¨ºÍGBDT£¨Gradient Boosting Decision Tree£©Ëã·¨¡£AdaBoostËã·¨ÔÚÃ¿´ÎÉú³ÉÐÂµÄÈõÑ§Ï°Æ÷Ê±£¬½«ÉÏÒ»ÈõÑ§Ï°Æ÷·¢Éú´íÎóµÄÑµÁ·Ñù±¾µÄÈ¨ÖØÔö´ó£¬Ê¹µÃÕâÐ©´íÎóÑù±¾ÔÚºóÐøÊÜµ½¸ü¶àµÄ¹Ø×¢£¬×îºó½«ÕâÐ©ÈõÑ§Ï°Æ÷½øÐÐ¼ÓÈ¨×éºÏ£¬²¢ÇÒ¸ù¾ÝÈõÑ§Ï°Æ÷µÄ×¼È·ÂÊ¸³ÓèÏàÓ¦µÄÈ¨ÖØ£¬Ê¹×¼È·ÂÊ½Ï¸ßµÄÈõÑ§Ï°Æ÷È¨ÖØ¸ü¸ß£¬Ã¿Ò»ÂÖÑµÁ·ÖÐÐèÒª¹Ø×¢Ñù±¾È¨ÖØºÍÈõÑ§Ï°Æ÷È¨ÖØµÄ¸üÐÂ¡£GBDTËã·¨Í¨¹ý¼ÆËã¸ºÌÝ¶ÈÀ´¸Ä½øÄ£ÐÍ£¬Ã¿Ò»ÂÖÑµÁ·¹Ø×¢µÄÖØµãÊÇÔ¤²âµÄ²Ð²î£¨¼´¸ºÌÝ¶È£©£¬½«Ç°Ò»´ÎÑù±¾µÄ²Ð²î×÷ÎªÊäÈëÊý¾Ý½øÐÐÑµÁ·£¬¾¡Á¿ÄâºÏ¸Ã²ÎÊý£¬Ê¹µÃÏÂÒ»ÂÖÊä³öµÄ²Ð²î²»¶Ï¼õÐ¡£¬Òò´ËGBDTËã·¨¿ÉÒÔ×öµ½Ã¿Ò»ÂÖÑµÁ·Ò»¶¨»áÏòËðÊ§º¯Êý¼õÐ¡µÄÌÝ¶È·½Ïò±ä»¯¡£GBDTËã·¨½öÀûÓÃÁËÒ»½×µÄµ¼ÊýÐÅÏ¢£¬¸Ä½øËã·¨XGBoost£¨EXtreme Gradient Boosting£©¶ÔËðÊ§º¯Êý½øÐÐ¶þ½×Ì©ÀÕ¹«Ê½Õ¹¿ª£¬²¢Ìí¼ÓÕýÔòÏîÒÔ±ÜÃâ¹ýÄâºÏ¡£
ÓëBaggingËã·¨²»Í¬£¬BoostingËã·¨Ö¼ÔÚÌáÉýÈõÑ§Ï°Æ÷µÄÐÔÄÜ£¬Ëæ×Å¼¯³ÉµÄÄ£ÐÍÊýÁ¿Ôö¼Ó£¬Ëã·¨ÐÔÄÜ»áÎÈ½¡ÌáÉý£¬µ«Ð§¹ûµÄÌáÉýËÙ¶È»áÔ½À´Ô½Âý¡£
3. Éñ¾­ÍøÂçÖÐµÄ¼¯³É
Éñ¾­ÍøÂçÖÐÊ¹ÓÃ¼¯³É¼¼ÊõÖ÷ÒªÊÇÎªÁË¼õÐ¡Ä£ÐÍµÄ·º»¯£¬±ÜÃâ¹ýÄâºÏ¡£Òò´Ë£¬²¿·ÖÄ£ÐÍ¼¯³É·½·¨¿ÉÒÔ¿´×÷ÕýÔò»¯·½·¨¡£Í¨¹ýÑµÁ·¶à¸ö¶ÀÁ¢µÄÄ£ÐÍ£¬È»ºóÔÚ²âÊÔÊ±¶Ô¶à¸öÄ£ÐÍµÄÔ¤²â½á¹ûÈ¡¾ùÖµ£¬Ê¹ÓÃ¸Ã·½·¨×ÜÄÜÌáÉýÉñ¾­ÍøÂçµÄ×¼È·ÂÊ¡£ÓÐ¶àÖÖ¼¯³É·½·¨¿ÉÒÔ°ïÖúÊµÏÖÕýÔò»¯£¬ÀýÈçÊ¹ÓÃÍ¬Ò»Éñ¾­ÍøÂç½øÐÐ²»Í¬µÄ³õÊ¼»¯£¬Ä£ÐÍµÄ¶àÑù»¯À´×Ô²»Í¬µÄ³õÊ¼Ìõ¼þ£» »òÕßÓ¦ÓÃ²»Í¬µÄ³¬²ÎÊýÅäÖÃ£¬µ±Ê¹ÓÃ½»²æÑéÖ¤Ñ°ÕÒ×îÓÅ³¬²ÎÊýÅäÖÃÊ±£¬È¡ÐÔÄÜ½ÏºÃµÄ¼¸×éÅäÖÃÑµÁ·Ä£ÐÍÒÔÊµÏÖ¼¯³É£¬¸Ã·½·¨ÌáÉýÁËÓÃÓÚ¼¯³ÉµÄ×ÓÄ£ÐÍµÄ¶àÑùÐÔ£¬µ«È±µãÊÇ¿ÉÄÜ°üº¬ÐÔÄÜ²»ÀíÏëµÄÄ£ÐÍ¡£Ò²¿ÉÒÔ²»¶ÀÁ¢µØÑµÁ·²»Í¬µÄÄ£ÐÍ£¬½öÔÚµ¥Ò»Ä£ÐÍÖÐ½øÐÐ¼¯³É£¬ÀýÈç¿ÉÒÔÔÚÑµÁ·¹ý³ÌµÄ²»Í¬Ê±¿Ì±£ÁôÄ£ÐÍµÄ¿ìÕÕ£¬È»ºóÊ¹ÓÃÕâÐ©Ä£ÐÍ¿ìÕÕ½øÐÐ¼¯³É£¬ÔÚ²âÊÔ½×¶Î°Ñ¶à¸ö¿ìÕÕµÄÔ¤²â½á¹û½øÐÐÆ½¾ù¡£ÁíÒ»¸ö¼¼ÇÉÊÇ£¬ÑµÁ·Ä£ÐÍÊ±£¬¶Ô²»Í¬Ê±¿ÌµÄÃ¿¸öÄ£ÐÍ²ÎÊý¼ÆËãÖ¸ÊýË¥¼õÆ½¾ùÖµ£¬´Ó¶øµÃµ½ÍøÂçÑµÁ·¹ý³ÌÖÐÒ»¸ö±È½ÏÆ½»¬µÄ¼¯³ÉÄ£ÐÍ£¬È»ºóÊ¹ÓÃ¸Ã¼¯³ÉÄ£ÐÍµÄ²ÎÊý£¬ÕâÖÖ·½·¨½Ð×÷PolyakÆ½¾ù¡£
Ò²¿ÉÒÔÊ¹ÓÃ¼¯³É¼¼Êõ¹¹½¨±Èµ¥¸öÄ£ÐÍ±íÊ¾ÄÜÁ¦¸üÇ¿µÄ¼¯³ÉÄ£ÐÍ£¬ÀýÈçÏò¼¯³ÉÄ£ÐÍÖð²½ÒýÈëÉñ¾­ÍøÂç¡£
5.5.4¼àÊÓÑµÁ·¹ý³Ì
Ä¿Ç°ÎªÖ¹ÒÑ¾­½éÉÜÁË¹¹½¨Éñ¾­ÍøÂçÐèÒª×¢ÒâµÄ¸÷·½ÃæÎÊÌâ£¬ÄÇÃ´ÈçºÎ»ùÓÚÌØ¶¨ÈÎÎñ´ÓÎÞµ½ÓÐµØÖð²½½¨Á¢Ò»¸ö¶Ëµ½¶ËµÄÄ£ÐÍÄØ£¿ÑµÁ·¹ý³ÌÖÐÓÖ¸ÃÈçºÎ½øÐÐÈËÎª°Ñ¿ØÒÔ»ñµÃ×îºÃµÄÐ§¹ûÄØ£¿±¾½ÚÖ÷ÒªÕë¶ÔÒÔÉÏÁ½¸öÎÊÌâ½øÐÐÕ¹¿ª£¬½éÉÜÒ»¸öÉî¶ÈÑ§Ï°Ä£ÐÍµÄÍêÕû¹¹½¨Á÷³ÌÒÔ¼°¼àÊÓÑµÁ·¹ý³Ì¡£
Éè¼ÆÁ÷³Ì¿ÉÒÔ·ÖÎªÊý¾ÝºÍÄ£ÐÍÁ½´ó²¿·Ö£¬Êý¾Ý²¿·Ö°üÀ¨´óÁ¿µÄÊý¾Ý´¦Àí¹¤×÷£¬ÀýÈçÊý¾Ý²É¼¯¡£Èç¹ûÊÇ¼à¶½Ñ§Ï°£¬»¹ÐèÒªÎªÑù±¾Êý¾Ý´ò±êÇ©£¬»¹Òª½øÐÐÊý¾ÝÇåÏ´µÈ»ù´¡Êý¾Ý²Ù×÷¡£×ÜÖ®£¬Êý¾Ý´¦ÀíÖ¼ÔÚ»ñÈ¡¸ßÖÊÁ¿µÄÊý¾Ý¼¯£¬Õâ¶ÔÄ£ÐÍÐÔÄÜµÄ±íÏÖÓÐºÜ´óµÄÓ°Ïì¡£¼ÙÉèÒÑ¾­»ñµÃÁËÖÊÁ¿Á¼ºÃµÄÊý¾Ý¼¯£¬±¾½Ú½«ÖØµã¹Ø×¢Ä£ÐÍ¹¹½¨ÓëÑµÁ·¡£
Õë¶Ô¾ßÌåÓ¦ÓÃ£¬Êµ¼ÊÖÐÍ¨³£½«Éè¼ÆÁ÷³Ì·ÖÎªÒÔÏÂ°å¿é¡£
£¨1£© È·¶¨Ä¿±ê£¬¸ù¾Ý¾ßÌåÈÎÎñÑ¡ÔñºÏÊÊµÄÐÔÄÜ¶ÈÁ¿£¬²¢È·¶¨ºÏÀíµÄÐÔÄÜÆÚÍû×÷ÎªÄ¿±ê¡£
£¨2£© È·¶¨ºÏÊÊµÄ´úÀíËðÊ§º¯Êý£¬½¨Á¢Ò»¸ö¾¡Á¿¼òµ¥µÄ¶Ëµ½¶ËµÄ¹¤×÷Á÷³Ì¡£
£¨3£© ´î½¨ÏµÍ³£¬¼àÊÓÕû¸öÑµÁ·¹ý³Ì£¬È·¶¨ÐÔÄÜÆ¿¾±¡£
£¨4£© ²éÕÒ²úÉúÐÔÄÜÆ¿¾±µÄÔ­Òò£¬²¢½øÐÐ¸ÄÉÆ£¬½øÒ»²½ÌáÉýÄ£ÐÍÐÔÄÜ¡£
ÔÚÈ·¶¨ÁËÈÎÎñÒÔºó£¬¾ÍÒªÈ·¶¨ºÏÊÊµÄÐÔÄÜ¶ÈÁ¿£¬ÕâÐ©ÐÔÄÜ¶ÈÁ¿Í¨³£²»ÄÜÓÃ×÷ÑµÁ·Ä£ÐÍµÄÄ¿±êº¯Êý£¬¶øÊÇ´ÓÈÎÎñ²ãÃæºâÁ¿Ëù¹¹½¨ÏµÍ³µÄÓÐÐ§ÐÔ¡£ÀýÈç£¬ÔÚÍ¼ÏñÊ¶±ðÈÎÎñÖÐ£¬Ò»°ãÊ¹ÓÃ×¼È·ÂÊ»òÕßµÈ¼ÛµÄ´íÎóÂÊºâÁ¿¹¹½¨µÄÏµÍ³µÄÐÔÄÜ£¬¶ø²»ÊÇ½«Æä×÷ÎªÓÅ»¯Ä¿±êµÄ½»²æìØËðÊ§º¯Êý£¨²»¿¼ÂÇÕýÔò»¯£©¡£ÁíÍâ£¬Ðí¶àÈÎÎñÐèÒª¸ü¸ß¼¶µÄÐÔÄÜ¶ÈÁ¿¡£ÀýÈç£¬ÔÚ¡°°©Ö¢¼ì²â¡±µÄÈÎÎñÖÐ£¬ÏµÍ³½«¡°½¡¿µ¡±ÎóÅÐÎª¡°»¼°©Ö¢¡±ºÍ½«¡°»¼°©Ö¢¡±ÎóÅÐÎª¡°Õý³£¡±ÕâÁ½ÖÖ´íÎó´øÀ´µÄºó¹ûÊÇ²»Í¬µÄ£¬µÚ¶þÖÖ´íÎóÊÇÐèÒª¼õÉÙÉõÖÁ±ÜÃâµÄ£¬Îª´ïµ½Õâ¸öÒªÇóÉõÖÁ¿ÉÒÔÔö´óµÚÒ»ÖÖ´íÎóµÄ¸ÅÂÊ¡£¿ÉÒÔ¿¼ÂÇÊ¹ÓÃ´ú¼Ûº¯ÊýÀ´½â¾öÕâ¸öÎÊÌâ£¬¶ÔÓÚ²»Í¬µÄ´íÎó¸³Óè²»Í¬µÄ´ú¼Û£¬¿ÉÒÔ¸øÓèµÚÒ»ÖÖ´íÎó½ÏÐ¡´ú¼Û£¬¶ø¸øÓèµÚ¶þÖÖ´íÎó½Ï¸ß´ú¼Û£¬¹¹½¨µÄÏµÍ³Ó¦Ê¹ÕûÌå´ú¼Û¾¡¿ÉÄÜÐ¡¡£ÆäËû¿ÉÒÔÓÃÓÚÃèÊöÏµÍ³µÄÐÔÄÜ¶ÈÁ¿ÓÐ¾«¶È¡¢ÕÙ»ØÂÊ¡¢PÈ¨ÏÞ¡¢F·ÖÊý/¸²¸ÇµÈ£¬Ä³Ð©×¨ÒµÁìÓòÒ²ÓÐÏàÓ¦µÄ±ê×¼¡£ÔÚÈ·¶¨ÁËÐÔÄÜ¶ÈÁ¿ºó£¬Ó¦µ±ÉèÁ¢Ò»¸ö¿ÉÊµÏÖµÄÄ¿±ê£¬¼´Ï£ÍûÏµÍ³¿ÉÒÔ´ïµ½µÄÐÔÄÜÆÚÍû£¬¿ÉÒÔ¸ù¾ÝÀàËÆÈÎÎñµÄ±íÏÖÀ´´óÖÂÈ·¶¨Õâ¸öÄ¿±ê£¬µ±ÏµÍ³±íÏÖ²»¼ÑÊ±Ö¸µ¼ÏµÍ³¸Ä½ø£¬½øÒ»²½ÊµÏÖÐÔÄÜµÄÌáÉý¡£
È·¶¨ºÃÐÔÄÜ¶ÈÁ¿ºó£¬ÏÂÒ»²½ÐèÒªÈ·¶¨ºÏÊÊµÄ´úÀíËðÊ§º¯Êý£¬²¢½¨Á¢Ò»¸ö¶Ëµ½¶ËµÄÏµÍ³¡£ÓÉÓÚÄ³Ð©ÐÔÄÜÖ¸±êÄÑÒÔÓÃÊýÑ§²ÎÊýÐÎÊ½»¯±í´ï²¢ÇÒ²»ÄÜÖ±½Ó×÷ÎªÓÅ»¯µÄÄ¿±ê£¬Òò´Ë´úÀíÄ¿±êº¯Êý½«×÷ÎªÊµ¼ÊµÄÓÅ»¯Ä¿±ê£¬Ó¦µ±ÔÚ¹¹½¨ÍêÕûµÄÏµÍ³Ö®Ç°¾ÍÈ·¶¨Æä¾ßÌåÐÎÊ½¡£ÕâÀïÓ¦µ±×¢Òâ£¬¹¹½¨ÏµÍ³µÄ³õÆÚÓ¦µ±¾¡Á¿¼òµ¥£¬¿ÉÒÔÊ¹ÓÃÐ¡Êý¾Ý¼¯½øÐÐÄâºÏ£¬Ê¹ÓÃ½ÏÎª¼òµ¥µÄÄ£ÐÍºÍ¼òµ¥µÄÓÅ»¯Ëã·¨£¬²¢ÇÒ²»Ê¹ÓÃ¸÷ÖÖÕýÔò»¯²ßÂÔ¡£µ±³öÏÖÎÊÌâÊ±ÔÙ¸ù¾ÝÊµÑé·´À¡¸ÄÉÆÏµÍ³£¬¿ÉÒÔ¿¼ÂÇÊÕ¼¯¸ü¶àµÄÊý¾Ý£¬Ê¹ÓÃÊý¾ÝÔöÇ¿²ßÂÔ£¬Ôö¼ÓÄ£ÐÍ¸´ÔÓ¶È£¬ÒÔÌáÉýÄ£ÐÍµÄ±íÊ¾ÄÜÁ¦£¬¿¼ÂÇÒýÈëÕýÔò»¯¡¢Ê¹ÓÃ¸ü¸´ÔÓµÄÓÅ»¯²ßÂÔµÈ´ëÊ©Öð²½¸ÄÉÆÏµÍ³µÄÐÔÄÜ¡£²»ÒªÒ»¿ªÊ¼¾ÍÊ¹ÓÃ¸´ÔÓµÄÏµÍ³£¬ÒòÎªÄÑÒÔ¼à¿ØºÍµ÷ÊÔ£¬Êµ¼ùÖÐ³É¹¦µÄ¾­Ñé±íÃ÷¸üÖØÒªµÄÊÇÕýÈ·µØ¹¹½¨ÍêÕûµÄ²Ù×÷Á÷³Ì¶ø·ÇÊ¹ÓÃ¸´ÔÓµÄÏµÍ³¡£
¹¹½¨Ò»¸ö¶Ëµ½¶ËµÄÏµÍ³£¬Ê×ÏÈÐèÒª¸ù¾ÝÊý¾Ý½á¹¹Ñ¡ÔñÒ»ÀàºÏÊÊµÄÄ£ÐÍ¡£Èç¹ûÊý¾ÝÊÇÎ¬¶È¹Ì¶¨µÄÏòÁ¿£¬¿ÉÒÔÊ¹ÓÃÆÕÍ¨µÄÈ«Á¬½ÓÍøÂç£» Èç¹ûÊÇÀàËÆÍ¼ÏñÊý¾ÝÕâÑù¾ßÓÐÍØÆË½á¹¹µÄÊý¾Ý£¬Ôò¿ÉÒÔ¿¼ÂÇ¾í»ýÉñ¾­ÍøÂçÄ£ÐÍ£» Èç¹ûÊý¾ÝÊÇÀàËÆÓïÒôÊý¾ÝÕâÖÖÐòÁÐÊý¾Ý£¬¿ÉÒÔÊ¹ÓÃÑ­»·Éñ¾­ÍøÂçÀ´½¨Ä£¡£È·¶¨ÍøÂçÀàÐÍºó£¬ÐèÒª¸ù¾ÝÈÎÎñ¹¹½¨¾ßÌåµÄÍøÂç½á¹¹£¬°üÀ¨ÍøÂçÉî¶È¡¢Ã¿²ãÉñ¾­Ôª¸öÊý¡¢²»Í¬ÀàÐÍµÄ²ãµÄÅÅ²¼¡¢¼¤»îº¯ÊýµÄÈ·¶¨µÈ¡£¾í»ýÍøÂç»¹ÐèÒªÈ·¶¨¾í»ýºË¡¢³Ø»¯ºËµÄ´óÐ¡¼°ÊýÁ¿ÒÔ¼°³Ø»¯·½·¨µÈ¡£×ÔÖ÷Éè¼ÆÍøÂç¼Ü¹¹¿ÉÄÜ»á±È½ÏÀ§ÄÑ£¬µ«¿ÉÒÔÊ¹Éè¼ÆµÄÍøÂç¸üÌù½ü¾ßÌåÈÎÎñ£¬Ò²¿ÉÒÔÖ±½ÓÑ¡ÔñÔÚÀàËÆÈÎÎñÉÏ±íÏÖÓÅÁ¼µÄÄ£ÐÍ¼Ü¹¹¡£ÍøÂç¿ò¼Ü´î½¨Íê³Éºó£¬ÐèÒªÈ·¶¨¸÷ÖÖ³¬²ÎÊýµÄÖµ£¬ÀýÈçÐ¡ÅúÁ¿µÄ´óÐ¡¡¢ÓÅ»¯·½·¨µÄÈ·¶¨ÒÔ¼°ÏàÓ¦µÄ³¬²ÎÊýÉèÖÃ¡¢È¨ÖØË¥¼õÏµÊýµÈ£¬ÕâÀïµÄ³¬²ÎÊý²»°üÀ¨ÓëÍøÂç½á¹¹ÓÐ¹ØµÄ³¬²ÎÊý£¬³¬²ÎÊýÓÅ»¯ÓëÅäÖÃµÄÄÚÈÝ¼û5.5.2½Ú¡£È»ºó¶ÔÍøÂç½øÐÐ³õÊ¼»¯£¬³õÊ¼»¯²ßÂÔ¿É¼û5.3½ÚµÄ½éÉÜ¡£Èç¹ûÊ¹ÓÃsigmoidº¯Êý»òÕßtanhº¯Êý×÷Îª¼¤»îº¯Êý£¬¿ÉÑ¡ÔñXavier³õÊ¼»¯£» Èç¹ûÊ¹ÓÃReLUº¯ÊýÔò¿ÉÒÔÊ¹ÓÃHe³õÊ¼»¯»òÕßÊ¹ÓÃ¼òµ¥µÄÐ¡Ëæ»úÊý³õÊ¼»¯£¬µ«ÊÇÒªÅäºÏÊ¹ÓÃÅúÁ¿¹éÒ»»¯²ßÂÔ¡£³õÊ¼ºóµÄÍøÂç½ÓÊÜÔ¤´¦Àí¹ýµÄÊý¾Ý×÷ÎªÊäÈë£¬ÏÈ¼ÆËã¸÷²ã¼¤»îÖµºÍ×îÖÕÊä³öÖµ½øÐÐÇ°Ïò´«²¥£¬ÔÙÀûÓÃ·´Ïò´«²¥¼ÆËã²ÎÊýÌÝ¶È£¬²¢¸ù¾ÝÈ·¶¨µÄÓÅ»¯²ßÂÔ¶Ô²ÎÊýÖ´ÐÐ¸üÐÂ£¬²»¶Ïµü´úÖ±ÖÁÄ¿±êº¯ÊýÊÕÁ²»òÕß´ïµ½Ô¤ÆÚÖµ£¬³£¼ûµÄÓÅ»¯²ßÂÔ¼û5.1½ÚºÍ5.2½Ú¡£ÔÚÕû¸ö¹ý³ÌÖÐ£¬¿ÉÒÔ½øÐÐ¼à¿Ø£¬·¢ÏÖ´íÎóÊÊÊ±Í£Ö¹ÒÔ±ÜÃâ×ÊÔ´µÄÀË·Ñ¡£µ±Ä£ÐÍÑµÁ·Íê³Éºó£¬¸ù¾ÝÄ£ÐÍµÄÐÔÄÜ¶ÈÁ¿ÆÀ¹ÀÄ£ÐÍµÄ±íÏÖ£¬ÕâÀï×¢ÒâÓ¦µ±¹Ø×¢Ä£ÐÍµÄ·º»¯ÄÜÁ¦£¬¶ø²»Ó¦¸ÃÒ»Î¶×·ÇóÄ£ÐÍÔÚÑµÁ·¼¯ÉÏµÄ±íÏÖ¡£¸ù¾ÝÄ£ÐÍµÄ±íÏÖÒÔ¼°ÑµÁ·¹ý³ÌÖÐ·¢ÏÖµÄÎÊÌâ£¬¶ÔÄ£ÐÍ½øÐÐ¸Ä½ø£¬ÀýÈç¼ÓÈë¸÷ÖÖÕýÔò»¯²ßÂÔ£¬Ê¹ÓÃ¼¯³ÉÑ§Ï°»òÕß¶ÔÄ£ÐÍµÄÄ³Ð©·½Ãæ×ö³ö¸Ä½ø£¬Ê¹µÃÄ£ÐÍÐÔÄÜ»ñµÃ½øÒ»²½ÌáÉý¡£Í¼5ª²36Õ¹Ê¾ÁËÉî¶ÈÄ£ÐÍ¹¹½¨Á÷³Ì£¬´Ë´¦²»°üÀ¨ÒÀÀµÓÚ¾ßÌåÈÎÎñµÄÐÔÄÜ¶ÈÁ¿ºÍ´úÀíËðÊ§º¯ÊýµÄÈ·¶¨£¬½ö½«ÊÊÓÃÓÚËùÓÐÈÎÎñµÄÍ¨ÓÃ²½ÖèÌáÈ¡³öÀ´¡£


Í¼5ª²36Éî¶ÈÄ£ÐÍ¹¹½¨Á÷³ÌÍ¼


Í¨¹ýÒÔÉÏ½éÉÜ£¬ÒÑ¾­´ó¸ÅÁË½âÁË»ùÓÚÌØ¶¨ÈÎÎñ¹¹½¨Éî¶ÈÑ§Ï°Ä£ÐÍµÄÁ÷³Ì¡£ÔÚÕû¸ö¹ý³ÌÖÐ½øÐÐÈËÎª¿ØÖÆ¿ÉÒÔ°ïÖúÄ£ÐÍÈ¡µÃ¸üºÃµÄÐ§¹û£¬ÄÇÃ´ÈçºÎ¼àÊÓÑµÁ·¹ý³Ì²¢¸ù¾Ý¼àÊÓ½á¹û¸ÄÉÆÄ£ÐÍµÄ±íÏÖÄØ£¿ÏÂÃæ½«¸ù¾ÝÁ÷³ÌÍ¼µÄË³Ðò½éÉÜ¡°¼àÊÓ¡±ÊÇÈçºÎÔÚ²»Í¬²¿·Ö·¢»Ó×÷ÓÃµÄ¡£Ê×ÏÈÊÇ³¬²ÎÊýµÄÈ·¶¨£¬ÕâÀïµÄ³¬²ÎÊýÖ¸¹ãÒåµÄ³¬²ÎÊý£¬°üÀ¨Ä£ÐÍ½á¹¹ÀàÐÍÏà¹ØµÄ³¬²ÎÊýºÍÓëÄ£ÐÍÑµÁ·ÓÐ¹ØµÄ³¬²ÎÊý£¬º­¸ÇÁ÷³ÌÍ¼ÖÐÈ·¶¨ÍøÂç½á¹¹ºÍÈ·¶¨³¬²ÎÊýÁ½²¿·Ö¡£ÓÉÉÏÎÄ¿ÉÖª£¬ÐèÒªÆÀ¹À²»Í¬³¬²ÎÊýÅäÖÃÔÚÑéÖ¤¼¯ÉÏµÄ±íÏÖÀ´Ñ¡Ôñ³¬²ÎÊý£¬ÐèÒª¶Ô´ýÆÀ¹ÀµÄÃ¿Ò»×é³¬²ÎÊýÅäÖÃÍêÕûÔËÐÐÑµÁ·¹ý³Ì£¬Õâµ¼ÖÂ¼ÆËã´ú¼Û¾Þ´ó£¬²¢ÇÒËÑË÷ËÙ¶ÈºÜÂý¡£Òò´Ë£¬¿ÉÒÔÍ¨¹ý¼àÊÓÑµÁ·¹ý³ÌµÄÑ§Ï°ÇúÏß½øÐÐÑ¡Ôñ¡£Í¼5ª²37Õ¹Ê¾ÁË¼¸ÖÖ¿ÉÄÜµÄÑ§Ï°ÇúÏß£¬Ò»µ©Ä£ÐÍ±íÏÖµÃºÜ²îµ¼ÖÂÑ§Ï°ÇúÏß²»ÄÜÊÕÁ²»òÕßÊÕÁ²µ½Ò»¸ö½Ï²îµÄÎ»ÖÃ£¬¶ÔÓ¦Í¼ÖÐµÚÒ»ÖÖºÍµÚ¶þÖÖÇé¿ö£¬¿ÉÒÔÔÚÔçÆÚ×ö³öÅÐ¶Ï²¢Í£Ö¹ÑµÁ·£¬¼´Ê¹ÓÃ¡°ÌáÇ°Í£Ö¹¡±²ßÂÔÖÕÖ¹Ä£ÐÍµÄÑµÁ·£¬¼õÉÙÔÚ²»¿ÉÄÜÓÐÁ¼ºÃ±íÏÖµÄÅäÖÃÉÏÀË·Ñ¹ý¶àÊ±¼äºÍ×ÊÔ´£¬¶ø½«×ÊÔ´Áô¸øÄÇÐ©¸üÓÐ¿ÉÄÜ±íÏÖÁ¼ºÃµÄ³¬²ÎÊýÅäÖÃ¡£¡°ÌáÇ°ÖÕÖ¹¡±²»½ö¿ÉÒÔ×÷ÎªÒ»ÖÖÕýÔò»¯²ßÂÔ£¬»¹¿ÉÒÔÔÚÑµÁ··¢Éú´íÎóÊ±£¬ÓÐÐ§·ÀÖ¹×ÊÔ´µÄÀË·Ñ¡£Ñ§Ï°ÇúÏßºáÖáÍ¨³£³öÏÖµÄÁ½¸öÁ¿£º µü´ú´ÎÊý£¨Iterations£©ºÍ±éÀú´ÎÊý£¨Epochs£©¡£ÆäÖÐ£¬Ã¿Ò»´Îµü´ú±íÊ¾Ö´ÐÐÒ»´Î²ÎÊý¸üÐÂ£¬¶ø±éÀú´ÎÊýÖ¸±éÀúÔ­Ê¼ÑµÁ·¼¯µÄ´ÎÊý¡£¼ÙÉèÑµÁ·¼¯ÓÐ100¸öÑù±¾£¬Ê¹ÓÃÐ¡ÅúÁ¿ÌÝ¶ÈÏÂ½µËã·¨½øÐÐ²ÎÊý¸üÐÂ£¬Ð¡ÅúÁ¿µÄÊýÄ¿Îª10£¬ÄÇÃ´Ã¿´Îµü´úÊ¹ÓÃ10¸öÑù±¾½øÐÐÒ»´Î¸üÐÂ¡£µ±±éÀúÍêÑµÁ·¼¯µÄÈ«²¿Ñù±¾Ê±£¬½øÐÐÁË10´Îµü´ú£¬1´Î±éÀú¡£Êµ¼ÊÉÏ£¬ÓÉÓÚÑµÁ·Êý¾ÝÓÐÏÞ£¬¿ÉÄÜÐèÒª¶à´Î±éÀúÑµÁ·¼¯£¬ÀýÈçÉèÖÃ±éÀú´ÎÊýÎª5£¬ÄÇÃ´µ±ÑµÁ·½áÊøÊ±£¬¾Í½øÐÐÁË50´Îµü´ú¡£ÁíÍâ£¬ÓÐÐ©ÎÄÏ×ÖÐÑ§Ï°ÇúÏßµÄºáÖá±äÁ¿±íÊ¾Ê±¼ä£¬ÕâÒ²ÊÇ¿ÉÒÔµÄ¡£


Í¼5ª²37¼¸ÖÖ¿ÉÄÜµÄÑ§Ï°ÇúÏß




Í¼5ª²38²»Í¬Ñ§Ï°ÂÊµÄÐ§¹û

¶ÔÓÚ×îÖØÒªµÄÒ»¸ö³¬²ÎÊý¡ª¡ªÑ§Ï°ÂÊ£¬µ±Ê±¼äºÍÆäËû×ÊÔ´ÓÐÏÞÊ±£¬Ó¦µ±Ê×ÏÈ¿¼ÂÇ¶ÔÑ§Ï°ÂÊ½øÐÐµ÷Õû¡£Í¼5ª²38¸ø³öÁË²»Í¬Ñ§Ï°ÂÊµÄ±íÏÖÐ§¹û£¬¿ÉÒÔ¿´µ½£¬ÉèÖÃºÏÀíµÄÑ§Ï°ÂÊ¿É´ïµ½Í¼ÖÐºÏÊÊÑ§Ï°ÂÊÇúÏßµÄÐ§¹û£¬Ñ§Ï°ÂÊ¹ý¸ß»òÕß¹ýµÍ¶¼»áµ¼ÖÂÑ§Ï°ÇúÏß±íÏÖ³ö²»Õý³£µÄÇ÷ÊÆ¡£
È·¶¨ÍøÂçµÄ³¬²ÎÊýºó£¬ÐèÒª¶ÔÍøÂç½øÐÐ³õÊ¼»¯¡£ÈçºÎ±£Ö¤³õÊ¼»¯ÊÇºÏÀíµÄ£¬²»ÖÁÓÚ³öÏÖÌÝ¶ÈÏûÊ§»òÕßÉñ¾­Ôª±¥ºÍµÄÎÊÌâÄØ£¿¿ÉÒÔÍ¨¹ý¼à¿ØÍøÂçËùÓÐ²ã¼¤»îÖµºÍÌÝ¶È·Ö²¼µÄÖ±·½Í¼À´·¢ÏÖÑµÁ·¹ý³ÌÖÐÉñ¾­ÔªµÄ±¥ºÍÇé¿ö£¬Ò»µ©³öÏÖ²»ºÃµÄ·Ö²¼£¬ËµÃ÷³õÊ¼»¯²»Ç¡µ±£¬Ê¹µÃÑ§Ï°¹ý³ÌÌ«Âý»òÕßÍ£Ö¹ÁË¡£´«²¥ÌÝ¶ÈµÄ¿ìËÙÔö³¤»òÕß¿ìËÙÏûÊ§£¬¶¼»á×è°­ÓÅ»¯¹ý³Ì¡£
¶ÔÍøÂç½øÐÐºÏÀíµÄ³õÊ¼»¯ºó£¬±ã¿ÉÒÔ¿ªÊ¼ÑµÁ·Ä£ÐÍÁË¡£ÔÚ¶ÔÕû¸öÑµÁ·¼¯½øÐÐÕýÊ½ÑµÁ·Ö®Ç°£¬¿ÉÒÔÏÈ³¢ÊÔÔÚÒ»¸ö±È½ÏÐ¡µÄÑµÁ·¼¯ÉÏ½øÐÐÑµÁ·£¬È·±£ËðÊ§ÖµÄÜ¹»´ïµ½0¡£ÑµÁ·¹ý³ÌÖÐÓ¦¸ú×ÙÈ¨ÖØ¸üÐÂ±ÈÀý£¬¼´Ã¿´Îµü´úµÄËùÓÐ²ÎÊýµÄ¸üÐÂÁ¿ÓëÎ´¸üÐÂÇ°²ÎÊýÁ¿Ö®¼äµÄ±ÈÀý£¬Ò²¾ÍÊÇÔÚÒ»¸öÐ¡ÅúÁ¿¸üÐÂÖÐ²ÎÊýµÄ±ä»¯·ù¶È¡£¾­ÑéÐÔµÄ½áÂÛÊÇÕâ¸ö±ÈÀýÓ¦¸ÃÎª10-3×óÓÒ£¬Èç¹û±ÈÀýÌ«µÍËµÃ÷Ñ§Ï°ÂÊ¿ÉÄÜÌ«Ð¡£¬Èç¹û±ÈÀýÌ«¸ßÔòËµÃ÷Ñ§Ï°ÂÊ¿ÉÄÜÌ«´ó¡£Ò²¿ÉÒÔ¸ú×ÙÌÝ¶ÈµÄ·¶Ê½¼°Æä¸üÐÂ£¬Í¨³£¿ÉÒÔµÃµ½ÏàËÆµÄ½á¹û¡£ÁíÍâ£¬ÔÚÑµÁ·¹ý³ÌÖÐÐèÒªÖØµã¹Ø×¢Ä£ÐÍÔÚÑéÖ¤¼¯ÉÏµÄ±íÏÖ£¬Í¨¹ý¶¨ÆÚ¶ÔÑµÁ·µÄÄ£ÐÍÔÚÑéÖ¤¼¯ÉÏ½øÐÐÆÀ¹À²¢»æ³ö¶ÔÓ¦ÐÔÄÜÇúÏß£¬¿ÉÒÔÅÐ¶ÏÄ£ÐÍÊÇ·ñ·¢Éú¹ýÄâºÏ£¬²¢ÇÒ¿ÉÒÔ¸ù¾ÝÁ½ÌõÇúÏßÖ®¼äµÄ¾àÀëÅÐ¶Ï¹ýÄâºÏµÄ³Ì¶È¡£ÈçÍ¼5ª²39ËùÊ¾£¬ÓëÏß¢ÚÏà±È£¬Ïß¢ÛËµÃ÷Ä£ÐÍ·¢Éú¸üÑÏÖØµÄ¹ýÄâºÏÏÖÏó¡£µ±Ä£ÐÍ·¢Éú¹ýÄâºÏÊ±£¬¾ÍÓ¦µ±¿¼ÂÇ¼ÓÈëÕýÔò»¯²ßÂÔ»òÕßÔö´óÕýÔò»¯µÄÇ¿¶È£¬»òÕßÊ¹ÓÃ¼¯³ÉÑ§Ï°£¬»òÕßÊÕ¼¯¸ü¶àµÄÑµÁ·Êý¾Ý£¬»òÕßÊ¹ÓÃÊý¾ÝÔöÇ¿²ßÂÔµÈ¡£Èç¹ûÑµÁ·ºÍ²âÊÔÎó²î¶¼±È½Ï¸ß£¬¿ÉÄÜµÄÔ­ÒòÊÇÄ£ÐÍÇ·ÄâºÏ£¬Òò´ËÓ¦µ±Ôö¼ÓÄ£ÐÍ¸´ÔÓ¶ÈÒÔÌáÉýÄ£ÐÍÈÝÁ¿¡£ÁíÍâÒ»¸öÐèÒª¼ìÑéµÄÊÇÍ¨¹ý·´Ïò´«²¥¼ÆËãµÃµ½µÄÌÝ¶È£¬ÕâÔÚÇ°ÎÄÌá¼°¹ý£¬¿ÉÒÔÍ¨¹ý½«²¿·Ö²ÎÊýµÄ½âÎöÌÝ¶ÈºÍÊýÖµÌÝ¶È½øÐÐ±È½ÏÑéÖ¤¼ÆËãµÄÕýÈ·ÐÔ¡£ 


Í¼5ª²39Ä£ÐÍÔÚÑéÖ¤¼¯ÉÏµÄ±íÏÖÓë¹ýÄâºÏÏÖÏó



»¹ÓÐºÜ¶à²ßÂÔ¿ÉÒÔ°ïÖú¼àÊÓÑµÁ·¹ý³ÌÖÐµÄÐÐÎª£¬ÀýÈçÍ¼ÏñÊý¾Ý£¬¿ÉÒÔÍ¨¹ýÌØÕ÷¿ÉÊÓ»¯À´ÅÐ¶ÏÄ£ÐÍµÄÐÐÎª¡£ÔÚÊµ¼ùÖÐ×ñÑ­ÒÔÉÏÉè¼ÆÁ÷³Ì£¬²¢Í¨¹ý¼àÊÓÑµÁ·¶¯Ì¬£¬¿ÉÒÔ°ïÖú¿ìËÙ¶¨Î»´æÔÚµÄÎÊÌâ£¬´øÀ´ÑµÁ·ÉÏµÄ³É¹¦£¬»ñµÃ¸ßÐÔÄÜµÄÄ£ÐÍ¡£
±¾ÕÂÐ¡½á
±¾ÕÂ°´ÕÕÉñ¾­ÍøÂçÑµÁ·µÄÁ÷³Ì£¬ÏêÏ¸½éÉÜÁËÑµÁ·¹ý³ÌÖÐµÄ¸÷ÖÖÏ¸½Ú¡£¶ÔÓÚÉñ¾­ÍøÂçµÄÁ½¸öÖØÒª·½Ãæ¡°ÓÅ»¯¡±ºÍ¡°ÕýÔò»¯¡±½øÐÐÁËÖØµã½éÉÜ¡£ÆäÖÐ£¬ÓÅ»¯Ö¼ÔÚ¾¡¿ÉÄÜµØ½µµÍÑµÁ·Îó²î£¬ÒªÇó×îÖÕÑµÁ·µÄÄ£ÐÍÔÚÑµÁ·¼¯ÉÏ±íÏÖÁ¼ºÃ¡£5.1½ÚºÍ5.2½ÚËùÃèÊöµÄÓÅ»¯Ëã·¨£¬¶¼ÊÇÔÚ×îÐ¡»¯Ä¿±êº¯ÊýµÄ¹ý³ÌÖÐ²»¶Ï½µµÍÑµÁ·Îó²î¡£¶øÕýÔò»¯ÔòÒªÇóÄ£ÐÍÔÚ²âÊÔ¼¯ÉÏ±íÏÖÁ¼ºÃ£¬Ä£ÐÍÒª¾ß±¸Á¼ºÃµÄ·º»¯ÄÜÁ¦£¬¼´ÒªÔÚÎ´ÖªµÄÊý¾ÝÉÏ¾ßÓÐÁ¼ºÃµÄÔ¤²âÄÜÁ¦£¬5.4½Ú½éÉÜÁËÏà¹ØµÄÕýÔò»¯²ßÂÔ¡£ÁíÍâ£¬ÍøÂç²ÎÊýµÄºÏÀí³õÊ¼»¯¶ÔÑµÁ·¹ý³ÌÒ²ÖÁ¹ØÖØÒª£¬Òò´Ë5.3½Ú½éÉÜÁË¼¸ÖÖÊµ¼ùÖ¤Ã÷±È½ÏÓÐÐ§µÄ³õÊ¼»¯·½·¨¡£×îºó£¬¶ÔÓÚÊµ¼ÊÑµÁ·ÖÐ³£ÓÃµÄÐ¡¼¼ÇÉÒ²×öÁË¼òÒª½éÉÜ¡£ÔÄ¶ÁÍê±¾ÕÂ£¬¶ÁÕß¿É×ÔÐÐÉè¼ÆÒ»¸ö¼òµ¥µÄÄ£ÐÍ£¬³¢ÊÔ²»Í¬µÄÓÅ»¯²ßÂÔ¡¢ÕýÔò»¯²ßÂÔ¡¢³õÊ¼»¯·½·¨µÈ£¬¸ÐÊÜ²»Í¬·½·¨µÄÐ§¹û£¬Êµ¼ù¿É°ïÖú¶ÁÕß½øÒ»²½ÌáÉý¶ÔÏà¹ØÖªÊ¶µÄÀí½â¡£