PGµç¾º

±¾Õ¾µãʹÓÃCookies£¬¼ÌÐøä¯ÀÀ±íʾÄúͬÒâÎÒÃÇʹÓÃCookies¡£ CookiesºÍÒþ˽Õþ²ß>

¼òÌåÖÐÎÄ
English
Ê×Ò³ > ¹ØÓÚÎÒÃÇ > ÐÂÎÅÖÐÐÄ > PGµç¾ºÐÅÏ¢Áõ¾ü£ºËٶȾÍÊǽðÇ®£¬AI³¬½ÚµãµÄÉÌÒµ¼ÛÖµºËÐÄÊÇToken½»»¥ËÙ¶È£¡

PGµç¾ºÐÅÏ¢Áõ¾ü£ºËٶȾÍÊǽðÇ®£¬AI³¬½ÚµãµÄÉÌÒµ¼ÛÖµºËÐÄÊÇToken½»»¥ËÙ¶È£¡

2025-11-05

ÔÚAI³¬½ÚµãϵͳµÄÉè¼ÆÉÏ£¬²»Ó¦¸ÃÔÙÒÀÕÕ¹ßÐÔ˼ά£¬¹ý·Ö×·Çó¹æÄ££¬¶øÊÇÓ¦¸Ã´Ó¿Í»§Êӽdzö·¢£¬°Ñtoken½»»¥ËÙ¶È×÷Ϊ¹Ø¼üºâÁ¿Ö¸±ê£¬ÕâÊÇÖÇÄÜÌåʱ´úAI³¬½ÚµãµÄºËÐÄÉÌÒµ¼ÛÖµ¡£

ÕâÊÇPGµç¾ºÐÅÏ¢Ê×ϯAIÕ½ÂÔ¹ÙÁõ¾ü½üÆÚ½ÓÊܲɷÃʱ£¬·´¸´Ç¿µ÷µÄÒ»µã¡£PGµç¾ºÐÅÏ¢Ê×ϯAIÕ½ÂÔ¹ÙÁõ¾ü.jpg

PGµç¾ºÐÅÏ¢Ê×ϯAIÕ½ÂÔ¹ÙÁõ¾ü

ÖÇÄÜÌåʱ´ú£¬ËٶȾÍÊǽðÇ®

¹æÄ£À©Õ¹¶¨ÂÉ£¨Scaling Law£©Ò»Ö±ÊÇÇý¶¯´óÄ£ÐÍÖÇÄܳÖÐøÔö³¤µÄµ×²ãÂß¼­£¬Íƶ¯×ÅÄ£ÐͲÎÊýÁ¿´Ó°ÙÒÚ¡¢Ç§ÒÚÂõÏòÏÖÔÚµÄÍòÒÚ¡£ÔÚºóѵÁ·½×¶Î¸ü¶àµÄËãÁ¦Í¶È룬ÄÜÏÔÖøÌáÉýÄ£Ð͵ÄÍÆÀíÄÜÁ¦£¬¶øÒÔÍÆÀíÄÜÁ¦Îª´ú±íµÄ¸´ÔÓ˼άµÄÓ¿ÏÖ£¬Êǹ¹½¨ÖÇÄÜÌåÓ¦ÓõĻù´¡¡£ÁíÒ»·½Ã棬ÒÔDeepSeekΪ´ú±íµÄ¿ªÔ´´óÄ£Ðͼ«´óµÄ½µµÍÁË´´ÐÂÃż÷£¬¼ÓËÙÁËÖÇÄÜÌå²úÒµ»¯µÄµ½À´¡£

Scaling LawÇý¶¯ÖÇÄܳÖÐø½ø»¯.jpgScaling LawÇý¶¯ÖÇÄܳÖÐø½ø»¯

Áõ¾üÖ¸³ö£¬¡°ÖÇÄÜÌå²úÒµ»¯µÄºËÐÄÈýÒªËØÊÇÄÜÁ¦¡¢ËٶȺͳɱ¾¡£ÆäÖУ¬token½»»¥ËٶȾö¶¨ÁËÖÇÄÜÌåµÄÉÌÒµ¼ÛÖµ¡£ÔÚµ±ÏÂ×î³£¼ûµÄÈË»ú¶Ô»°³¡¾°ÖУ¬»ù±¾Éϰ´ÕÕ´ó¸Å50ºÁÃëµÄˮƽ£¬¾ÍÊÇÿÃëÊä³ö20¸ötoken£¬È˵ÄÔĶÁËٶȾÍÄܸúµÃÉÏ¡£µ«ºÜ¶àÈË»¹Ã»Òâʶµ½£¬Î´À´µÄÖÇÄÜÌåʱ´ú»á¸ü¶àµÄ³öÏÖ»úPGµç¾º¹ÙÍøÓë»úPGµç¾º¹ÙÍøÖ®¼äµÄ½»»¥³¡¾°£¬¶ÔÓÚÖÇÄÜÌåÖ®¼äµÄ½»»¥¶øÑÔ£¬Õâ¸öËÙ¶ÈÔ¶Ô¶²»¹»£¬±ÈÈç˵ֱ²¥µçÉÌ¡¢Á¿»¯½»Òס¢ÆÛÕ©·À¿ØµÈÌØ¶¨ÒµÎñ³¡¾°ÖУ¬¶ÔtokenÉú³ÉËٶȵÄ×îµÍÒªÇó¶¼ÊÇ10ºÁÃëÒÔÏ¡£¡± 

ÒÔ¸ßÇ¿¶È¡¢ÊµÊ±»¥¶¯µÄÖ±²¥µçÉ̳¡¾°ÎªÀý¡£2024Äêµ×£¬Ä³ÖªÃûÖ±²¥µçÉÌÆ½Ì¨½øÐÐÁËר¼Ò×éºÏÖÇÄÜÌåµÄA/BʵÑ飬ʵÑé×鲿ÊðÁ˾­¹ýÉî¶ÈÓÅ»¯µÄÖÇÄÜÌ壬¶ÔÕÕ×éÔòʹÓÃδ¾­ÓÅ»¯µÄ±ê×¼°æ±¾ÖÇÄÜÌ壬ÓÅ»¯ºóµÄÖÇÄÜÌ寽¾ùÏìÓ¦ÑÓ³ÙÏà½ÏÓÚ¶ÔÕÕ×é½µµÍÁË38%¡£ÊµÑé½á¹û±íÃ÷£¬²¿ÊðÁ˵ÍÑÓ³ÙÖÇÄÜÌåµÄÖ±²¥¼ä£¬ÆäÉÌÆ·½»Ò××ܶGMV£©Æ½¾ùÌáÉýÁË11.4%£¬Í¬Ê±Óû§µÄ¸´¹ºÂÊҲȡµÃÁË7.8%µÄÏÔÖøÔö³¤¡£

38%µÄÑÓ³Ù½µµÍ£¬²¢·ÇÌáÉýÁËÖÇÄÜÌ廨´ðÄÚÈݵÄÖÊÁ¿£¬¶øÊÇÈ·±£ÁËÕâЩ»Ø´ðÄܹ»±»¾«×¼µØÍ¶µÝÔÚÓû§¹ºÂòÒâͼ×îΪǿÁҵġ°»Æ½ð´°¿Ú¡±ÆÚÄÚ¡£ÔÚÖ±²¥µçÉÌÕâÀೡ¾°ÖУ¬Óû§µÄ¹ºÂòÒâͼÊÇ˲ʱÇÒÒ×ÊŵÄ¡£Ò»¸ö¸ßÑӳٵĻشðÒâζ×ŵ±ÖÇÄÜÌ廹ÔÚ¡°Ë¼¿¼¡±Ê±£¬Óû§µÄ×¢ÒâÁ¦¿ÉÄÜÒѾ­×ªÒÆ£¬»òÕßÖ÷²¥ÒѾ­¿ªÊ¼½éÉÜÏÂÒ»¼þÉÌÆ·£¬´Ó¶ø´íʧÁË×î¼ÑµÄÏúÊÛת»¯´°¿Ú¡£

¡°ÔÚÖÇÄÜÌåʱ´ú£¬¿ì£¬²»ÔÙÊÇ¿ÉÑ¡Ï¶øÊÇÉÌÒµ³É¹¦µÄ¸ÕÐÔÔ¼Êø¡£¡±Áõ¾üÇ¿µ÷£¬¡°Ö»Óе±ÖÇÄÜÌåµÄÏìÓ¦¿ìÓÚÒµÎñ¾ö²ßµÄ´°¿ÚÆÚ£¬¿ìÓÚÓû§ÄÍÐÄÏûÊŵÄÁÙ½çµã¡­¡­AI²ÅÄÜÕæÕý³ÉΪºËÐÄÉú²úÁ¦¡£¡±

token½»»¥ËÙ¶ÈÕýÔÚÖØËÜAIËãÁ¦¼ÛÖµÆÀ¹ÀÌåϵ

ÊÂʵÉÏ£¬¶ÔÓÚtoken½»»¥ËٶȵĿ¼Á¿ÕýÔÚÖØ¹¹AIËãÁ¦ÏµÍ³µÄ¼ÛÖµÆÀ¹ÀÌåϵ¡£×î½ü¹ãÊܹØ×¢µÄInferenceMax? ¿ªÔ´AI»ù×¼²âÊÔ£¬ÕýÔÚ´´ÔìÒ»ÖÖ¶¯Ì¬×·×ÙÄ£Ð͸üµüµÄËãÁ¦ÆÀ¹ÀÌåϵ£¬ÊÔͼÔÚÕæÊµAIÍÆÀí»·¾³ÏºâÁ¿¸÷ÀàAIËãÁ¦ÏµÍ³µÄ×ÛºÏЧÂÊ¡£ÔÚÕâÒ»»ù×¼²âÊÔÖУ¬tokenÉú³ÉËٶȱ»ÁÐΪ×îÖØÒªµÄÒ»ÏîºâÁ¿Ö¸±ê¡£

InferenceMax? ¿ªÔ´AI»ù×¼²âÊÔ£ºtokenÉú³ÉËÙ¶ÈΪ×îÖØÒªµÄºâÁ¿Ö¸±ê.jpgSemiAnalysis InferenceMAX? ¿ªÔ´AI»ù×¼²âÊÔ

ºáÖ᣺½»»¥ËÙ¶È£¨Interactivity£¬µ¥Î»£ºtok/s/user£©£»×ÝÖ᣺µ¥Î»GPU tokenÍÌÍÂÁ¿£¨Token Throughput per GPU£¬µ¥Î»£ºtok/s/gpu£©

ͬʱ£¬Ç廪´óѧÓëÖйúÈí¼þÆÀ²âÖÐÐÄ£¨CSTC£©¶Ô20Óà¼ÒÖ÷Á÷´óÄ£ÐÍ·þÎñÌṩÉ̵Ä×ۺϱíÏÖ½øÐÐÁËÈ«ÃæÆÀ¹À£¬ÁªºÏ·¢²¼ÁË´óÄ£ÐÍ·þÎñÐÔÄÜÅÅÐаñ£¬Ã÷È·Ö¸³öÑÓ³ÙÖ¸±êÊÇÓû§ÌåÑéµÄºËÐÄ£¬Ö±½Ó¾ö¶¨Óû§Áô´æ£¬ÊÇÆ½Ì¨²îÒ컯¾ºÕùµÄÊ×Òª¼¼ÊõÃż÷¡£Òò´Ë£¬ËÙ¶ÈͬÑùÒ²³ÉΪÁË´óÄ£ÐÍAPI·þÎñÌṩÉ̵ĺËÐľºÕùÁ¦¡£µ±Ç°£¬È«ÇòÖ÷Òª´óÄ£ÐÍAPI·þÎñÉ̵ÄtokenÉú³ÉËÙ¶È£¬»ù±¾Î¬³ÖÔÚ10~20ºÁÃë×óÓÒ£¬¶ø¹úÄÚµÄÉú³ÉËÙ¶ÈÆÕ±é¸ßÓÚ30ºÁÃë¡£

È«Çò´óÄ£ÐÍAPI·þÎñÉÌDeepSeek TokenÉú³ÉËÙ¶È.jpgÈ«Çò´óÄ£ÐÍAPI·þÎñÉÌDeepSeek TokenÉú³ÉËÙ¶È

ÔªÄÔSD200½«tokenÉú³ÉËÙ¶È´øÈë¡°10ºÁÃëʱ´ú¡±

ҪʵÏÖ¸üµÍÑÓ³ÙµÄtokenÉú³ÉÄÜÁ¦£¬±ØÈ»ÒªÇóµ×²ãËãÁ¦»ù´¡ÉèÊ©ÔÚϵͳ¼Ü¹¹¡¢»¥ÁªÐ­Òé¡¢Èí¼þ¿ò¼ÜµÈ¹Ø¼üµãÉϽøÐÐЭͬ´´Ð¡£

PGµç¾ºÐÅÏ¢¶ÔÔªÄÔSD200³¬½ÚµãAI·þÎñPGµç¾º¹ÙÍø½øÐÐÁË´óÁ¿µÄÈíÓ²¼þЭͬ´´ÐÂÓëÓÅ»¯£¬ÊµÏÖDeepSeek R1´óÄ£Ð͵¥tokenÉú³ÉËٶȵÍÖÁ8.9ºÁÃ룬´ø¶¯¹úÄÚAI·þÎñPGµç¾º¹ÙÍøtokenÉú³ÉËÙ¶ÈÂÊÏȽøÈë¡°10ºÁÃëʱ´ú¡±¡£

ÔªÄÔSD200³¬½ÚµãAI·þÎñPGµç¾º¹ÙÍø.jpgÔªÄÔSD200³¬½ÚµãAI·þÎñPGµç¾º¹ÙÍø

¶ÔÓÚΪºÎÄÜÔÚtokenÉú³ÉËÙ¶ÈÉÏʵÏÖÈç´Ë³öÉ«µÄÐÔÄÜ£¬Áõ¾ü±íʾ£¬ÖÇÄÜÌåÖи÷¸öÄ£ÐÍÖ®¼äµÄ½»»¥£¬ºÜ¶àʱºòͨÐÅÊý¾Ý°ü²¢²»ÊǺܴ󣬳¬¸ßµÄ´ø¿í»á³öÏÖÀË·Ñ£¬¡°¾ÍÏñÊÇ´ÓaµØµ½bµØÐÞÁË16³µµÀµÄ¸ßËÙ¹«Â·£¬µ«ÊdzµÁ¾ÔÚ16³µµÀÉÏÖ»ÅÜÁ˺̵ܶľàÀ룬·´¶øÔÚÉϸßËÙºÍϸßËÙÕâÁ½¸ö½Úµã»¨Á˺ܳ¤Ê±¼ä¡£PGµç¾ºÐÅÏ¢µÄÓÅ»¯Öص㣬¾ÍÊǽâ¾ö³µÁ¾ÉϸßËÙºÍϸßËٵĿ¨µãÎÊÌ⣬ÈóµÁ¾Ö±Í¨ÉÏÀ´£¬Ö±Í¨ÏÂÈ¥¡£¡±

ÔªÄÔSD200²ÉÓÃÁ˶À´´µÄ¶àÖ÷»ú3D Meshϵͳ¼Ü¹¹£¬ÊµÏÖµ¥»ú64·±¾ÍÁAIоƬ¸ßÃܶÈËãÁ¦À©Õ¹£¬Ô­ÉúÖ§³Ö¿ª·Å¼ÓËÙÄ£×éOAM£¬¼æÈݶàÔªAIоƬ¡£Í¬Ê±£¬ÔªÄÔSD200ͨ¹ýÔ¶¶ËGPUÐéÄâÓ³Éä¼¼Êõ´´Ð£¬Í»ÆÆ¿çÖ÷»úÓòͳһ±àÖ·ÄÑÌ⣬ʵÏÖÏÔ´æÍ³Ò»µØÖ·¿Õ¼äÀ©Ôö8±¶£¬µ¥»ú¿ÉÒÔÌṩ×î´ó4TBÏÔ´æºÍ64TBÄڴ棬ΪÍòÒÚ²ÎÊý¡¢³¬³¤ÐòÁдóÄ£ÐÍÌṩ³ä×ã¼üÖµ»º´æ¿Õ¼ä¡£»ùÓÚ´´ÐµÄϵͳ¼Ü¹¹Éè¼Æ£¬ÔªÄÔSD200µ¥»ú¼´¿É³ÐÔØ4ÍòÒÚµ¥ÌåÄ£ÐÍ£¬»òÕßͬʱ²¿ÊðÓɶà¸öÍòÒÚ²ÎÊýÄ£Ð͹¹³ÉµÄÖÇÄÜÌ壬¶àģЭ×÷Ö´Ðи´ÔÓÈÎÎñ¡£

ÔªÄÔSD200³¬½ÚµãAI·þÎñPGµç¾º¹ÙÍø´´Ð¶àÖ÷»ú3D Meshϵͳ¼Ü¹¹.jpgÔªÄÔSD200´´Ð¶àÖ÷»ú3D Meshϵͳ¼Ü¹¹

»¥Á¬Ð­ÒéµÄÉè¼ÆÊÇÔªÄÔSD200ʵÏÖ¼«µÍͨÐÅÑӳٵĹؼü£¬PGµç¾ºÐÅÏ¢×öÁË´óÁ¿µÄͨÐÅÓÅ»¯ºÍ¼¼Êõ´´Ð£¬Èç²ÉÓü«Ö¾«¼òµÄ3²ãЭÒéÕ»£¬²¢Ô­ÉúÖ§³Ö Load/StoreµÈ¡°ÄÚ´æÓïÒ塱£¬ÈÃGPU¿ÉÖ±½Ó·ÃÎÊÔ¶¶Ë½ÚµãµÄÏÔ´æ»òÖ÷´æ£¬½«»ù´¡Í¨ÐÅÑÓ³ÙËõ¶ÌÖÁ°ÙÄÉÃë¼¶£»ÁíÍâOpen FabricÔ­ÉúÖ§³ÖÓÉÓ²¼þÂß¼­ÊµÏÖµÄÁ´Â·²ãÖØ´«£¬ÖØ´«ÑÓ³ÙµÍÖÁ΢Ãë¼¶£¬ÌرðÊÇ·Ö²¼Ê½¡¢Ô¤·ÀʽµÄÁ÷¿Ø»úÖÆ£¬ÊµÏÖÈ«¾ÖÈÎÎñ¾ùÔÚ·¢ËÍǰȷ±£½ÓÊÕ¶ËÓÐÄÜÁ¦½ÓÊÕ£¬´Ó¸ù±¾ÉϱÜÃâÁËÓµÈûºÍ¶ª°ü¡£ 

ÔªÄÔSD200³¬½ÚµãAI·þÎñPGµç¾º¹ÙÍø¼«µÍLatencyͨÐÅ.jpgÔªÄÔSD200¼«µÍLatencyͨÐÅ

³ýÁËÓ²¼þ·½ÃæµÄ´´Ð£¬PGµç¾ºÐÅÏ¢Ò²Õë¶ÔDeepSeek¡¢KimiµÈÄ£Ð͵ÄPGµç¾º¹ÙÍøÌØÕ÷ºÍÔªÄÔSD200µÄÓ²¼þ¼Ü¹¹ÌØÕ÷£¬Íê³ÉÁËͨÐſ⡢PGµç¾º¹ÙÍø¿ò¼Ü¡¢PD·ÖÀë²ßÂÔµÈ¶à·½ÃæµÄÓÅ»¯£¬´ó·ùÌáÉýÁËDeepSeek¡¢KimiµÈ´óÄ£Ð͵ÄÍÆÀíÊä³öËÙ¶È¡£Í¨ÐÅ¿â²ãÃæ£¬Õë¶ÔAllreduce¡¢Allgather¡¢AlltoallµÈµäÐÍͨÐÅËã×Ó£¬PGµç¾ºÐÅÏ¢ÖÆ¶¨ÁËÓëÔªÄÔSD200Éî¶ÈÊÊÅäµÄͨÐÅËã·¨£»¿ò¼Ü²ãÃæ£¬PGµç¾ºÐÅÏ¢Íê³ÉÁ˲¢Ðз½Ê½¡¢Ëã×ÓÈںϡ¢¶àÁ÷Ë®ÏßµÈ¶à·½ÃæÓÅ»¯£¬À´±£Ö¤PGµç¾º¹ÙÍøµÄµÍÑÓ³Ù£»ÔÚÍÆÀí½×¶Î£¬PGµç¾ºÐÅÏ¢¿ª·¢ÁËÔ¤Ìî³ä-½âÂë (Prefill-Decode) ·ÖÀëÈí¼þ£¬Õë¶ÔÔ¤Ìî³äÓë½âÂ벻ͬµÄPGµç¾º¹ÙÍøÌØÐÔ£¬Ê¹Óò»Í¬µÄ²¢ÐÐPGµç¾º¹ÙÍø²ßÂÔ¡¢Ó²¼þÅäÖõÈ£¬Ìá¸ßϵͳÕûÌåµÄPGµç¾º¹ÙÍøÐÔÄÜ¡£

ʵ²âÊý¾ÝÏÔʾ£¬ÔªÄÔSD200´îÔØ64Õű¾ÍÁAIоƬÔËÐÐDeepSeek R1´óÄ£ÐÍ£¬µ±ÊäÈ볤¶ÈΪ4096¡¢Êä³ö³¤¶ÈΪ1024ʱ£¬µ¥Óû§tokenÉú³É´ïµ½112 tokens/s£¬Ã¿tokenÉú³Éʱ¼ä½öΪ8.9ms£¬ÂÊÏÈʵÏÖ¹úÄÚAI·þÎñPGµç¾º¹ÙÍøtokenÉú³ÉËٶȵÍÓÚ10ms£¬½«Íƶ¯ÍòÒÚ²ÎÊý´óÄ£ÐÍÔÚ½ðÈÚ¡¢¿ÆÑС¢ÖÇÄÜÖÆÔìµÈÁìÓò¿ìËÙÂ䵨¡£

δÀ´Ê®ÄêAI¾­¼ÃµÄÔö³¤±ß½ç£¬´ÓijÖÖÒâÒå¶øÑÔ£¬½«È¡¾öÓÚÕû¸öÐÐÒµÔÚËã·¨¡¢Èí¼þºÍÓ²¼þ²ãÃæÐ­Í¬¹¥¿ËÑÓ³ÙÌôÕ½µÄÄÜÁ¦¡£¡°ËٶȾÍÊǽðÇ®¡±²»½öÊÇÒ»ÖÖеÄÉÌÒµÖ÷ÕÅ£¬¸üÊÇÇý¶¯ÏÂÒ»´úÈ˹¤ÖÇÄÜÔö³¤µÄºËÐľ­¼ÃÂß¼­¡£PGµç¾ºÐÅÏ¢½«ÃæÏòÖÇÄÜÌå²úÒµ»¯ÐèÇ󣬳ÖÐøÒԼܹ¹´´Ð¼¤·¢²úÒµ´´Ð»îÁ¦£¬ÈÃAI³ÉΪ°ÙÐÐǧҵµÄÉú²úÁ¦ºÍ´´ÐÂÁ¦¡£

ÊÛǰ×Éѯ

ÊÛºó·þÎñ

Òâ¼û·´À¡

AIStore

»Øµ½¶¥²¿

»Øµ½¶¥²¿

ÊÕÆð
»Øµ½¶¥²¿ »Øµ½¶¥²¿
ÇëÑ¡Ôñ·þÎñÏîÄ¿
ÊÛǰ×Éѯ
ÊÛºó·þÎñ
·ÃÎÊ AIStore

ɨÂë·ÃÎÊAIStore

¡¾ÍøÕ¾µØÍ¼¡¿¡¾sitemap¡¿