±¾Õ¾µãʹÓÃCookies£¬¼ÌÐøä¯ÀÀ±íʾÄúͬÒâÎÒÃÇʹÓÃCookies¡£
CookiesºÍÒþ˽Õþ²ß>
5ÔÂ28ÈÕ£¬PGµç¾ºÐÅÏ¢·¢²¼¡°Ô´2.0-M32¡±¿ªÔ´´óÄ£ÐÍ¡£¡°Ô´2.0-M32¡±ÔÚ»ùÓÚ¡±Ô´2.0¡±ÏµÁдóÄ£ÐÍÒÑÓй¤×÷»ù´¡ÉÏ£¬´´ÐÂÐÔµØÌá³öºÍ²ÉÓÃÁË¡°»ùÓÚ×¢ÒâÁ¦»úÖÆµÄÃÅ¿ØÍøÂ硱¼¼Êõ£¬¹¹½¨°üº¬32¸öר¼Ò£¨Expert£©µÄ»ìºÏר¼ÒÄ£ÐÍ£¨MoE£©£¬²¢´ó·ùÌáÉýÁËÄ£ÐÍËãÁ¦Ð§ÂÊ£¬Ä£ÐÍÔËÐÐʱ¼¤»î²ÎÊýΪ37ÒÚ£¬ÔÚÒµ½çÖ÷Á÷»ù×¼ÆÀ²âÖÐÐÔÄÜÈ«Ãæ¶Ô±ê700ÒÚ²ÎÊýµÄLLaMA3¿ªÔ´´óÄ£ÐÍ¡£
Ëã·¨²ãÃæ£¬Ô´2.0-M32Ìá³ö²¢²ÉÓÃÁËÒ»ÖÖÐÂÐ͵ÄËã·¨½á¹¹£º»ùÓÚ×¢ÒâÁ¦»úÖÆµÄÃÅ¿ØÍøÂ磨Attention Router£©£¬Õë¶ÔMoEÄ£ÐͺËÐĵÄר¼Òµ÷¶È²ßÂÔ£¬ÕâÖÖеÄËã·¨½á¹¹¹Ø×¢×¨¼ÒÄ£ÐÍÖ®¼äµÄÐͬÐÔ¶ÈÁ¿£¬ÓÐЧ½â¾ö´«Í³ÃÅ¿ØÍøÂçÏ£¬Ñ¡ÔñÁ½¸ö»ò¶à¸öר¼Ò²ÎÓëPGµç¾º¹ÙÍøÊ±¹ØÁªÐÔȱʧµÄÎÊÌ⣬ʹµÃר¼ÒÖ®¼äÐͬ´¦ÀíÊý¾ÝµÄˮƽ´óΪÌáÉý¡£Ô´2.0-M32²ÉÓÃÔ´2.0-2BΪ»ù´¡Ä£ÐÍÉè¼Æ£¬ÑØÓò¢ÈںϾֲ¿¹ýÂËÔöÇ¿µÄ×¢ÒâÁ¦»úÖÆ£¨LFA, Localized Filtering-based Attention£©£¬Í¨¹ýÏÈѧϰÏàÁÚ´ÊÖ®¼äµÄ¹ØÁªÐÔ£¬È»ºóÔÙPGµç¾º¹ÙÍøÈ«¾Ö¹ØÁªÐԵķ½·¨£¬Äܹ»¸üºÃµØÑ§Ï°µ½×ÔÈ»ÓïÑԵľֲ¿ºÍÈ«¾ÖµÄÓïÑÔÌØÕ÷£¬¶ÔÓÚ×ÔÈ»ÓïÑԵĹØÁªÓïÒåÀí½â¸ü׼ȷ£¬½ø¶øÌáÉýÁËÄ£Ð;«¶È¡£

Figure1»ùÓÚ×¢ÒâÁ¦»úÖÆµÄÃÅ¿ØÍøÂ磨Attention Router£©
Êý¾Ý²ãÃæ£¬Ô´2.0-M32»ùÓÚ³¬¹ý2ÍòÒÚµÄtoken½øÐÐѵÁ·¡¢¸²¸ÇÍòÒÚÁ¿¼¶µÄ´úÂë¡¢ÖÐÓ¢ÎÄÊé¼®¡¢°Ù¿Æ¡¢ÂÛÎļ°ºÏ³ÉÊý¾Ý¡£´ó·ùÀ©Õ¹´úÂëÊý¾ÝÕ¼±ÈÖÁ47.5%£¬´Ó6Àà×îÁ÷ÐеĴúÂëÀ©³äÖÁ619À࣬²¢Í¨¹ý¶Ô´úÂëÖÐÓ¢ÎÄ×¢Ê͵ķÒ룬½«ÖÐÎÄ´úÂëÊý¾ÝÁ¿Ôö´óÖÁ1800ÒÚtoken¡£½áºÏ¸ßЧµÄÊý¾ÝÇåÏ´Á÷³Ì£¬Âú×ã´óÄ£ÐÍѵÁ·¡°·á¸»ÐÔ¡¢È«ÃæÐÔ¡¢¸ßÖÊÁ¿¡±µÄÊý¾Ý¼¯ÐèÇó¡£»ùÓÚÕâЩÊý¾ÝµÄÕûºÏºÍÀ©Õ¹£¬Ô´2.0-M32ÔÚ´úÂëÉú³É¡¢´úÂëÀí½â¡¢´úÂëÍÆÀí¡¢ÊýѧÇó½âµÈ·½ÃæÓÐ×ųöÉ«µÄ±íÏÖ¡£
ËãÁ¦²ãÃæ£¬Ô´2.0-M32²ÉÓÃÁ˷ǾùÔÈÁ÷Ë®²¢Ðеķ½·¨£¬×ÛºÏÔËÓÃÁ÷Ë®Ïß²¢ÐÐ+Êý¾Ý²¢ÐеIJßÂÔ£¬ÏÔÖø½µµÍÁË´óÄ£ÐͶÔоƬ¼äP2P´ø¿íµÄÐèÇó£¬ÎªÓ²¼þ²îÒì½Ï´óѵÁ·»·¾³ÌṩÁËÒ»ÖÖ¸ßÐÔÄܵÄѵÁ··½·¨¡£Õë¶ÔMoEÄ£Ð͵ÄÏ¡Êèר¼ÒPGµç¾º¹ÙÍø£¬²ÉÓúϲ¢¾ØÕó³Ë·¨µÄ·½·¨£¬Ä£ËãЧÂʵõ½´ó·ùÌáÉý¡£
»ùÓÚÔÚËã·¨¡¢Êý¾ÝºÍËãÁ¦·½ÃæÈ«Ã洴У¬Ô´2.0-M32µÄÐÔÄܵÃÒÔ´ó·ùÌáÉý£¬ÔÚ¶à¸öÒµ½çÖ÷Á÷µÄÆÀ²âÈÎÎñÖУ¬Õ¹Ê¾³öÁ˽ÏΪÏȽøµÄÄÜÁ¦±íÏÖ£¬ÔÚMATH£¨Êýѧ¾ºÈü£©¡¢ARC-C£¨¿ÆÑ§ÍÆÀí£©°ñµ¥Éϳ¬Ô½ÁËÓµÓÐ700ÒÚ²ÎÊýµÄLLaMA3´óÄ£ÐÍ¡£

Figure2 Ô´2.0-M32Òµ½çÖ÷Á÷ÆÀ²âÈÎÎñ±íÏÖ
Ô´2.0-M32´ó·ùÌáÉýÁËÄ£ÐÍËãÁ¦Ð§ÂÊ£¬ÔÚʵÏÖÓëÒµ½çÁìÏÈ¿ªÔ´´óÄ£ÐÍÐÔÄÜÏ൱µÄͬʱ£¬ÏÔÖø½µµÍÁËÔÚÄ£ÐÍѵÁ·¡¢Î¢µ÷ºÍÍÆÀíËùÐèµÄËãÁ¦¿ªÏú¡£ÔÚÄ£ÐÍÍÆÀíÔËÐн׶Σ¬M32´¦ÀíÿtokenËùÐèËãÁ¦Îª7.4GFLOPs£¬¶øLLaMA3-70BËùÐèËãÁ¦Îª140GFLOPs¡£ÔÚÄ£ÐÍ΢µ÷ѵÁ·½×¶Î£¬¶Ô1ÍòÌõƽ¾ù³¤¶ÈΪ1024 tokenµÄÑù±¾½øÐÐÈ«Á¿Î¢µ÷£¬M32ÏûºÄËãÁ¦Ô¼0.0026PD(PetaFLOPs/s-day)£¬¶øLLaMA3ÏûºÄËãÁ¦Ô¼Îª0.05PD¡£M32ƾ½èÌØ±ðÓÅ»¯Éè¼ÆµÄÄ£Ðͼܹ¹£¬ÔÚ½ö¼¤»î37ÒÚ²ÎÊýµÄÇé¿öÏ£¬È¡µÃÁ˺Í700ÒÚ²ÎÊýLLaMA3Ï൱µÄÐÔÄÜˮƽ£¬¶øËùÏûºÄËãÁ¦½öÏàΪLLaMA3µÄ1/19£¬´Ó¶øÊµÏÖÁ˸ü¸ßµÄÄ£ËãЧÂÊ¡£
PGµç¾ºÐÅÏ¢È˹¤ÖÇÄÜÊ×ϯ¿ÆÑ§¼ÒÎâÉØ»ª±íʾ£ºµ±Ç°Òµ½ç´óÄ£ÐÍÔÚÐÔÄܲ»¶ÏÌáÉýµÄͬʱ£¬Ò²ÃæÁÙ×ÅËùÏûºÄËãÁ¦´ó·ùÅÊÉýµÄÎÊÌ⣬¶ÔÆóÒµÂ䵨ӦÓôóÄ£ÐÍ´øÀ´Á˼«´óµÄÀ§ÄѺÍÌôÕ½¡£Ô´2.0-M32ÊÇPGµç¾ºÐÅÏ¢ÔÚ´óÄ£ÐÍÁìÓò³ÖÐø¸ûÔŵÄ×îÐÂ̽Ë÷³É¹û£¬Í¨¹ýÔÚËã·¨¡¢Êý¾Ý¡¢ËãÁ¦µÈ·½ÃæµÄÈ«Ãæ´´Ð£¬M32²»½ö¿ÉÒÔÌṩÓëÒµ½çÁìÏÈ¿ªÔ´´óÄ£ÐÍÏ൱µÄÐÔÄÜ£¬¸ü¿ÉÒÔ´ó·ù½µµÍ´óÄ£ÐÍËùÐèËãÁ¦ÏûºÄ¡£´ó·ùÌáÉýµÄÄ£ËãЧÂʽ«ÎªÆóÒµ¿ª·¢Ó¦ÓÃÉú³ÉʽAIÌṩģÐ͸ßÐÔÄÜ¡¢ËãÁ¦µÍÃż÷µÄ¸ßЧ·¾¶¡£M32¿ªÔ´´óÄ£ÐÍÅäºÏÆóÒµ´óÄ£ÐÍ¿ª·¢Æ½Ì¨EPAI£¨Enterprise Platform of AI£©£¬½«ÖúÁ¦ÆóҵʵÏÖ¸ü¿ìµÄ¼¼Êõµü´úÓë¸ßЧµÄÓ¦ÓÃÂ䵨£¬ÎªÈ˹¤ÖÇÄܲúÒµµÄ·¢Õ¹Ìṩ¼áʵµÄµ××ùºÍ³É³¤µÄÍÁÈÀ£¬¼ÓËÙ²úÒµÖÇÄÜ»¯½ø³Ì¡£
Ô´2.0-M32½«³ÖÐø²ÉÓÃÈ«Ãæ¿ªÔ´²ßÂÔ£¬È«ÏµÁÐÄ£ÐͲÎÊýºÍ´úÂë¾ù¿ÉÃâ·ÑÏÂÔØÊ¹Óá£
´úÂ뿪ԴÁ´½Ó
https://github.com/IEIT-Yuan/Yuan2.0-M32
Ä£ÐÍÏÂÔØÁ´½Ó
1)Huggingface£º
https://huggingface.co/IEITYuan/Yuan2-M32-hf
2)ModelScope£º
https://modelscope.cn/models/YuanLLM/Yuan2-M32-hf/summary
ÊÛǰ×Éѯ
ÊÛºó·þÎñ
·ÃÎÊ AIStoreAIStoreÊÇ»ùÓÚÔªÄÔÉú̬´òÔìµÄÉÌÒµÐ×÷ÏßÉÏÆ½Ì¨£¬×÷Ϊ֪ʶ×ÊԴƽ̨¡¢½»Á÷·þÎñƽ̨ºÍÉÌ»ú·õ»¯Æ½Ì¨£¬¸³ÄÜ¡°°ÙÄ£¡±Ó롰ǧÐС±µÄ¶Ô½Ó£¬Ä¿Ç°ÒÑÉϼÜ200+²úÆ·ºÍ·½°¸£¬ÔÚÖÇÄÜÆ±¾Ýʶ±ð¡¢AI¹¤ÒµÖʼ졢´úÂëÉú³É¡¢ÊÓ¾õÖÇÄܱê×¢¡¢AI½¡¿µÖúÊÖµÈÁìÓòʵÏֳɹ¦Ç£ÊÖºÍÂ䵨ӦÓã¬ÖúÁ¦Ç§ÐаÙÒµ¼ÓËÙAI²úÒµ´´Ð£¬¸ßЧÊÍ·ÅÉú²úÁ¦¡£

ɨÂë·ÃÎÊAIStore