±¾Õ¾µãʹÓÃCookies£¬¼ÌÐøä¯ÀÀ±íʾÄúͬÒâÎÒÃÇʹÓÃCookies¡£
CookiesºÍÒþ˽Õþ²ß>
ÔÚAI³¬½ÚµãϵͳµÄÉè¼ÆÉÏ£¬²»Ó¦¸ÃÔÙÒÀÕÕ¹ßÐÔ˼ά£¬¹ý·Ö×·Çó¹æÄ££¬¶øÊÇÓ¦¸Ã´Ó¿Í»§Êӽdzö·¢£¬°Ñtoken½»»¥ËÙ¶È×÷Ϊ¹Ø¼üºâÁ¿Ö¸±ê£¬ÕâÊÇÖÇÄÜÌåʱ´úAI³¬½ÚµãµÄºËÐÄÉÌÒµ¼ÛÖµ¡£
ÕâÊÇPGµç¾ºÐÅÏ¢Ê×ϯAIÕ½ÂÔ¹ÙÁõ¾ü½üÆÚ½ÓÊܲɷÃʱ£¬·´¸´Ç¿µ÷µÄÒ»µã¡£
PGµç¾ºÐÅÏ¢Ê×ϯAIÕ½ÂÔ¹ÙÁõ¾ü
¹æÄ£À©Õ¹¶¨ÂÉ£¨Scaling Law£©Ò»Ö±ÊÇÇý¶¯´óÄ£ÐÍÖÇÄܳÖÐøÔö³¤µÄµ×²ãÂß¼£¬Íƶ¯×ÅÄ£ÐͲÎÊýÁ¿´Ó°ÙÒÚ¡¢Ç§ÒÚÂõÏòÏÖÔÚµÄÍòÒÚ¡£ÔÚºóѵÁ·½×¶Î¸ü¶àµÄËãÁ¦Í¶È룬ÄÜÏÔÖøÌáÉýÄ£Ð͵ÄÍÆÀíÄÜÁ¦£¬¶øÒÔÍÆÀíÄÜÁ¦Îª´ú±íµÄ¸´ÔÓ˼άµÄÓ¿ÏÖ£¬Êǹ¹½¨ÖÇÄÜÌåÓ¦ÓõĻù´¡¡£ÁíÒ»·½Ã棬ÒÔDeepSeekΪ´ú±íµÄ¿ªÔ´´óÄ£Ðͼ«´óµÄ½µµÍÁË´´ÐÂÃż÷£¬¼ÓËÙÁËÖÇÄÜÌå²úÒµ»¯µÄµ½À´¡£
Scaling LawÇý¶¯ÖÇÄܳÖÐø½ø»¯
Áõ¾üÖ¸³ö£¬¡°ÖÇÄÜÌå²úÒµ»¯µÄºËÐÄÈýÒªËØÊÇÄÜÁ¦¡¢ËٶȺͳɱ¾¡£ÆäÖУ¬token½»»¥ËٶȾö¶¨ÁËÖÇÄÜÌåµÄÉÌÒµ¼ÛÖµ¡£ÔÚµ±ÏÂ×î³£¼ûµÄÈË»ú¶Ô»°³¡¾°ÖУ¬»ù±¾Éϰ´ÕÕ´ó¸Å50ºÁÃëµÄˮƽ£¬¾ÍÊÇÿÃëÊä³ö20¸ötoken£¬È˵ÄÔĶÁËٶȾÍÄܸúµÃÉÏ¡£µ«ºÜ¶àÈË»¹Ã»Òâʶµ½£¬Î´À´µÄÖÇÄÜÌåʱ´ú»á¸ü¶àµÄ³öÏÖ»úPGµç¾º¹ÙÍøÓë»úPGµç¾º¹ÙÍøÖ®¼äµÄ½»»¥³¡¾°£¬¶ÔÓÚÖÇÄÜÌåÖ®¼äµÄ½»»¥¶øÑÔ£¬Õâ¸öËÙ¶ÈÔ¶Ô¶²»¹»£¬±ÈÈç˵ֱ²¥µçÉÌ¡¢Á¿»¯½»Òס¢ÆÛÕ©·À¿ØµÈÌØ¶¨ÒµÎñ³¡¾°ÖУ¬¶ÔtokenÉú³ÉËٶȵÄ×îµÍÒªÇó¶¼ÊÇ10ºÁÃëÒÔÏ¡£¡±
ÒÔ¸ßÇ¿¶È¡¢ÊµÊ±»¥¶¯µÄÖ±²¥µçÉ̳¡¾°ÎªÀý¡£2024Äêµ×£¬Ä³ÖªÃûÖ±²¥µçÉÌÆ½Ì¨½øÐÐÁËר¼Ò×éºÏÖÇÄÜÌåµÄA/BʵÑ飬ʵÑé×鲿ÊðÁ˾¹ýÉî¶ÈÓÅ»¯µÄÖÇÄÜÌ壬¶ÔÕÕ×éÔòʹÓÃδ¾ÓÅ»¯µÄ±ê×¼°æ±¾ÖÇÄÜÌ壬ÓÅ»¯ºóµÄÖÇÄÜÌ寽¾ùÏìÓ¦ÑÓ³ÙÏà½ÏÓÚ¶ÔÕÕ×é½µµÍÁË38%¡£ÊµÑé½á¹û±íÃ÷£¬²¿ÊðÁ˵ÍÑÓ³ÙÖÇÄÜÌåµÄÖ±²¥¼ä£¬ÆäÉÌÆ·½»Ò××ܶGMV£©Æ½¾ùÌáÉýÁË11.4%£¬Í¬Ê±Óû§µÄ¸´¹ºÂÊҲȡµÃÁË7.8%µÄÏÔÖøÔö³¤¡£
38%µÄÑÓ³Ù½µµÍ£¬²¢·ÇÌáÉýÁËÖÇÄÜÌ廨´ðÄÚÈݵÄÖÊÁ¿£¬¶øÊÇÈ·±£ÁËÕâЩ»Ø´ðÄܹ»±»¾«×¼µØÍ¶µÝÔÚÓû§¹ºÂòÒâͼ×îΪǿÁҵġ°»Æ½ð´°¿Ú¡±ÆÚÄÚ¡£ÔÚÖ±²¥µçÉÌÕâÀೡ¾°ÖУ¬Óû§µÄ¹ºÂòÒâͼÊÇ˲ʱÇÒÒ×Êŵġ£Ò»¸ö¸ßÑӳٵĻشðÒâζ×ŵ±ÖÇÄÜÌ廹ÔÚ¡°Ë¼¿¼¡±Ê±£¬Óû§µÄ×¢ÒâÁ¦¿ÉÄÜÒÑ¾×ªÒÆ£¬»òÕßÖ÷²¥ÒѾ¿ªÊ¼½éÉÜÏÂÒ»¼þÉÌÆ·£¬´Ó¶ø´íʧÁË×î¼ÑµÄÏúÊÛת»¯´°¿Ú¡£
¡°ÔÚÖÇÄÜÌåʱ´ú£¬¿ì£¬²»ÔÙÊÇ¿ÉÑ¡Ï¶øÊÇÉÌÒµ³É¹¦µÄ¸ÕÐÔÔ¼Êø¡£¡±Áõ¾üÇ¿µ÷£¬¡°Ö»Óе±ÖÇÄÜÌåµÄÏìÓ¦¿ìÓÚÒµÎñ¾ö²ßµÄ´°¿ÚÆÚ£¬¿ìÓÚÓû§ÄÍÐÄÏûÊŵÄÁÙ½çµã¡¡AI²ÅÄÜÕæÕý³ÉΪºËÐÄÉú²úÁ¦¡£¡±
ÊÂʵÉÏ£¬¶ÔÓÚtoken½»»¥ËٶȵĿ¼Á¿ÕýÔÚÖØ¹¹AIËãÁ¦ÏµÍ³µÄ¼ÛÖµÆÀ¹ÀÌåϵ¡£×î½ü¹ãÊܹØ×¢µÄInferenceMax? ¿ªÔ´AI»ù×¼²âÊÔ£¬ÕýÔÚ´´ÔìÒ»ÖÖ¶¯Ì¬×·×ÙÄ£Ð͸üµüµÄËãÁ¦ÆÀ¹ÀÌåϵ£¬ÊÔͼÔÚÕæÊµAIÍÆÀí»·¾³ÏºâÁ¿¸÷ÀàAIËãÁ¦ÏµÍ³µÄ×ÛºÏЧÂÊ¡£ÔÚÕâÒ»»ù×¼²âÊÔÖУ¬tokenÉú³ÉËٶȱ»ÁÐΪ×îÖØÒªµÄÒ»ÏîºâÁ¿Ö¸±ê¡£
SemiAnalysis InferenceMAX? ¿ªÔ´AI»ù×¼²âÊÔ
ºáÖ᣺½»»¥ËÙ¶È£¨Interactivity£¬µ¥Î»£ºtok/s/user£©£»×ÝÖ᣺µ¥Î»GPU tokenÍÌÍÂÁ¿£¨Token Throughput per GPU£¬µ¥Î»£ºtok/s/gpu£©
ͬʱ£¬Ç廪´óѧÓëÖйúÈí¼þÆÀ²âÖÐÐÄ£¨CSTC£©¶Ô20Óà¼ÒÖ÷Á÷´óÄ£ÐÍ·þÎñÌṩÉ̵Ä×ۺϱíÏÖ½øÐÐÁËÈ«ÃæÆÀ¹À£¬ÁªºÏ·¢²¼ÁË´óÄ£ÐÍ·þÎñÐÔÄÜÅÅÐаñ£¬Ã÷È·Ö¸³öÑÓ³ÙÖ¸±êÊÇÓû§ÌåÑéµÄºËÐÄ£¬Ö±½Ó¾ö¶¨Óû§Áô´æ£¬ÊÇÆ½Ì¨²îÒ컯¾ºÕùµÄÊ×Òª¼¼ÊõÃż÷¡£Òò´Ë£¬ËÙ¶ÈͬÑùÒ²³ÉΪÁË´óÄ£ÐÍAPI·þÎñÌṩÉ̵ĺËÐľºÕùÁ¦¡£µ±Ç°£¬È«ÇòÖ÷Òª´óÄ£ÐÍAPI·þÎñÉ̵ÄtokenÉú³ÉËÙ¶È£¬»ù±¾Î¬³ÖÔÚ10~20ºÁÃë×óÓÒ£¬¶ø¹úÄÚµÄÉú³ÉËÙ¶ÈÆÕ±é¸ßÓÚ30ºÁÃë¡£
È«Çò´óÄ£ÐÍAPI·þÎñÉÌDeepSeek TokenÉú³ÉËÙ¶È
ҪʵÏÖ¸üµÍÑÓ³ÙµÄtokenÉú³ÉÄÜÁ¦£¬±ØÈ»ÒªÇóµ×²ãËãÁ¦»ù´¡ÉèÊ©ÔÚϵͳ¼Ü¹¹¡¢»¥ÁªÐÒé¡¢Èí¼þ¿ò¼ÜµÈ¹Ø¼üµãÉϽøÐÐÐͬ´´Ð¡£
PGµç¾ºÐÅÏ¢¶ÔÔªÄÔSD200³¬½ÚµãAI·þÎñPGµç¾º¹ÙÍø½øÐÐÁË´óÁ¿µÄÈíÓ²¼þÐͬ´´ÐÂÓëÓÅ»¯£¬ÊµÏÖDeepSeek R1´óÄ£Ð͵¥tokenÉú³ÉËٶȵÍÖÁ8.9ºÁÃ룬´ø¶¯¹úÄÚAI·þÎñPGµç¾º¹ÙÍøtokenÉú³ÉËÙ¶ÈÂÊÏȽøÈë¡°10ºÁÃëʱ´ú¡±¡£
ÔªÄÔSD200³¬½ÚµãAI·þÎñPGµç¾º¹ÙÍø
¶ÔÓÚΪºÎÄÜÔÚtokenÉú³ÉËÙ¶ÈÉÏʵÏÖÈç´Ë³öÉ«µÄÐÔÄÜ£¬Áõ¾ü±íʾ£¬ÖÇÄÜÌåÖи÷¸öÄ£ÐÍÖ®¼äµÄ½»»¥£¬ºÜ¶àʱºòͨÐÅÊý¾Ý°ü²¢²»ÊǺܴ󣬳¬¸ßµÄ´ø¿í»á³öÏÖÀË·Ñ£¬¡°¾ÍÏñÊÇ´ÓaµØµ½bµØÐÞÁË16³µµÀµÄ¸ßËÙ¹«Â·£¬µ«ÊdzµÁ¾ÔÚ16³µµÀÉÏÖ»ÅÜÁ˺̵ܶľàÀ룬·´¶øÔÚÉϸßËÙºÍϸßËÙÕâÁ½¸ö½Úµã»¨Á˺ܳ¤Ê±¼ä¡£PGµç¾ºÐÅÏ¢µÄÓÅ»¯Öص㣬¾ÍÊǽâ¾ö³µÁ¾ÉϸßËÙºÍϸßËٵĿ¨µãÎÊÌ⣬ÈóµÁ¾Ö±Í¨ÉÏÀ´£¬Ö±Í¨ÏÂÈ¥¡£¡±
ÔªÄÔSD200²ÉÓÃÁ˶À´´µÄ¶àÖ÷»ú3D Meshϵͳ¼Ü¹¹£¬ÊµÏÖµ¥»ú64·±¾ÍÁAIоƬ¸ßÃܶÈËãÁ¦À©Õ¹£¬ÔÉúÖ§³Ö¿ª·Å¼ÓËÙÄ£×éOAM£¬¼æÈݶàÔªAIоƬ¡£Í¬Ê±£¬ÔªÄÔSD200ͨ¹ýÔ¶¶ËGPUÐéÄâÓ³Éä¼¼Êõ´´Ð£¬Í»ÆÆ¿çÖ÷»úÓòͳһ±àÖ·ÄÑÌ⣬ʵÏÖÏÔ´æÍ³Ò»µØÖ·¿Õ¼äÀ©Ôö8±¶£¬µ¥»ú¿ÉÒÔÌṩ×î´ó4TBÏÔ´æºÍ64TBÄڴ棬ΪÍòÒÚ²ÎÊý¡¢³¬³¤ÐòÁдóÄ£ÐÍÌṩ³ä×ã¼üÖµ»º´æ¿Õ¼ä¡£»ùÓÚ´´ÐµÄϵͳ¼Ü¹¹Éè¼Æ£¬ÔªÄÔSD200µ¥»ú¼´¿É³ÐÔØ4ÍòÒÚµ¥ÌåÄ£ÐÍ£¬»òÕßͬʱ²¿ÊðÓɶà¸öÍòÒÚ²ÎÊýÄ£Ð͹¹³ÉµÄÖÇÄÜÌ壬¶àÄ£Ð×÷Ö´Ðи´ÔÓÈÎÎñ¡£
ÔªÄÔSD200´´Ð¶àÖ÷»ú3D Meshϵͳ¼Ü¹¹
»¥Á¬ÐÒéµÄÉè¼ÆÊÇÔªÄÔSD200ʵÏÖ¼«µÍͨÐÅÑӳٵĹؼü£¬PGµç¾ºÐÅÏ¢×öÁË´óÁ¿µÄͨÐÅÓÅ»¯ºÍ¼¼Êõ´´Ð£¬Èç²ÉÓü«Ö¾«¼òµÄ3²ãÐÒéÕ»£¬²¢ÔÉúÖ§³Ö Load/StoreµÈ¡°ÄÚ´æÓïÒ塱£¬ÈÃGPU¿ÉÖ±½Ó·ÃÎÊÔ¶¶Ë½ÚµãµÄÏÔ´æ»òÖ÷´æ£¬½«»ù´¡Í¨ÐÅÑÓ³ÙËõ¶ÌÖÁ°ÙÄÉÃë¼¶£»ÁíÍâOpen FabricÔÉúÖ§³ÖÓÉÓ²¼þÂ߼ʵÏÖµÄÁ´Â·²ãÖØ´«£¬ÖØ´«ÑÓ³ÙµÍÖÁ΢Ãë¼¶£¬ÌرðÊÇ·Ö²¼Ê½¡¢Ô¤·ÀʽµÄÁ÷¿Ø»úÖÆ£¬ÊµÏÖÈ«¾ÖÈÎÎñ¾ùÔÚ·¢ËÍǰȷ±£½ÓÊÕ¶ËÓÐÄÜÁ¦½ÓÊÕ£¬´Ó¸ù±¾ÉϱÜÃâÁËÓµÈûºÍ¶ª°ü¡£
ÔªÄÔSD200¼«µÍLatencyͨÐÅ
³ýÁËÓ²¼þ·½ÃæµÄ´´Ð£¬PGµç¾ºÐÅÏ¢Ò²Õë¶ÔDeepSeek¡¢KimiµÈÄ£Ð͵ÄPGµç¾º¹ÙÍøÌØÕ÷ºÍÔªÄÔSD200µÄÓ²¼þ¼Ü¹¹ÌØÕ÷£¬Íê³ÉÁËͨÐſ⡢PGµç¾º¹ÙÍø¿ò¼Ü¡¢PD·ÖÀë²ßÂÔµÈ¶à·½ÃæµÄÓÅ»¯£¬´ó·ùÌáÉýÁËDeepSeek¡¢KimiµÈ´óÄ£Ð͵ÄÍÆÀíÊä³öËÙ¶È¡£Í¨ÐÅ¿â²ãÃæ£¬Õë¶ÔAllreduce¡¢Allgather¡¢AlltoallµÈµäÐÍͨÐÅËã×Ó£¬PGµç¾ºÐÅÏ¢ÖÆ¶¨ÁËÓëÔªÄÔSD200Éî¶ÈÊÊÅäµÄͨÐÅËã·¨£»¿ò¼Ü²ãÃæ£¬PGµç¾ºÐÅÏ¢Íê³ÉÁ˲¢Ðз½Ê½¡¢Ëã×ÓÈںϡ¢¶àÁ÷Ë®ÏßµÈ¶à·½ÃæÓÅ»¯£¬À´±£Ö¤PGµç¾º¹ÙÍøµÄµÍÑÓ³Ù£»ÔÚÍÆÀí½×¶Î£¬PGµç¾ºÐÅÏ¢¿ª·¢ÁËÔ¤Ìî³ä-½âÂë (Prefill-Decode) ·ÖÀëÈí¼þ£¬Õë¶ÔÔ¤Ìî³äÓë½âÂ벻ͬµÄPGµç¾º¹ÙÍøÌØÐÔ£¬Ê¹Óò»Í¬µÄ²¢ÐÐPGµç¾º¹ÙÍø²ßÂÔ¡¢Ó²¼þÅäÖõȣ¬Ìá¸ßϵͳÕûÌåµÄPGµç¾º¹ÙÍøÐÔÄÜ¡£
ʵ²âÊý¾ÝÏÔʾ£¬ÔªÄÔSD200´îÔØ64Õű¾ÍÁAIоƬÔËÐÐDeepSeek R1´óÄ£ÐÍ£¬µ±ÊäÈ볤¶ÈΪ4096¡¢Êä³ö³¤¶ÈΪ1024ʱ£¬µ¥Óû§tokenÉú³É´ïµ½112 tokens/s£¬Ã¿tokenÉú³Éʱ¼ä½öΪ8.9ms£¬ÂÊÏÈʵÏÖ¹úÄÚAI·þÎñPGµç¾º¹ÙÍøtokenÉú³ÉËٶȵÍÓÚ10ms£¬½«Íƶ¯ÍòÒÚ²ÎÊý´óÄ£ÐÍÔÚ½ðÈÚ¡¢¿ÆÑС¢ÖÇÄÜÖÆÔìµÈÁìÓò¿ìËÙÂ䵨¡£
δÀ´Ê®ÄêAI¾¼ÃµÄÔö³¤±ß½ç£¬´ÓijÖÖÒâÒå¶øÑÔ£¬½«È¡¾öÓÚÕû¸öÐÐÒµÔÚËã·¨¡¢Èí¼þºÍÓ²¼þ²ãÃæÐͬ¹¥¿ËÑÓ³ÙÌôÕ½µÄÄÜÁ¦¡£¡°ËٶȾÍÊǽðÇ®¡±²»½öÊÇÒ»ÖÖеÄÉÌÒµÖ÷ÕÅ£¬¸üÊÇÇý¶¯ÏÂÒ»´úÈ˹¤ÖÇÄÜÔö³¤µÄºËÐľ¼ÃÂß¼¡£PGµç¾ºÐÅÏ¢½«ÃæÏòÖÇÄÜÌå²úÒµ»¯ÐèÇ󣬳ÖÐøÒԼܹ¹´´Ð¼¤·¢²úÒµ´´Ð»îÁ¦£¬ÈÃAI³ÉΪ°ÙÐÐǧҵµÄÉú²úÁ¦ºÍ´´ÐÂÁ¦¡£
ÊÛǰ×Éѯ
ÊÛºó·þÎñ
·ÃÎÊ AIStoreAIStoreÊÇ»ùÓÚÔªÄÔÉú̬´òÔìµÄÉÌÒµÐ×÷ÏßÉÏÆ½Ì¨£¬×÷Ϊ֪ʶ×ÊԴƽ̨¡¢½»Á÷·þÎñƽ̨ºÍÉÌ»ú·õ»¯Æ½Ì¨£¬¸³ÄÜ¡°°ÙÄ£¡±Ó롰ǧÐС±µÄ¶Ô½Ó£¬Ä¿Ç°ÒÑÉϼÜ200+²úÆ·ºÍ·½°¸£¬ÔÚÖÇÄÜÆ±¾Ýʶ±ð¡¢AI¹¤ÒµÖʼ졢´úÂëÉú³É¡¢ÊÓ¾õÖÇÄܱê×¢¡¢AI½¡¿µÖúÊÖµÈÁìÓòʵÏֳɹ¦Ç£ÊÖºÍÂ䵨ӦÓã¬ÖúÁ¦Ç§ÐаÙÒµ¼ÓËÙAI²úÒµ´´Ð£¬¸ßЧÊÍ·ÅÉú²úÁ¦¡£

ɨÂë·ÃÎÊAIStore