Subscribe Us

header ads

AMD မှ Data Center များအတွက် APU၊ CPU နှင့် GPU အသစ်များကိုကြေညာ


Image: AMD

AMD ဟာ မနေ့က ဆန်ဖရန်စ္စကိုမှာကျင်းပတဲ့ သူတို့ရဲ့ Data Center ‌and AI Technology Premiere ပွဲမှာ ထုတ်ကုန်အသစ်အများအပြားကို ကြေညာခဲ့ပါတယ်။ ဒီအထဲမှာ cloud native application တွေအတွက် Zen 4c cores ၁၂၈ခုပါဝင်တဲ့ EPYC Bergamo၊ 3D-stacked လုပ်ထားတဲ့ CPU နဲ့ GPU cores တွေကို HBM နဲ့ package တစ်ခုတည်းမှာပေါင်းစပ်ထားတဲ့ Instinct MI300 ပရိုဆက်ဆာတွေနဲ့ L3 cache 1.1GB အထိရှိတဲ့ EPYC Genoa-X ပရိုဆက်ဆာတွေပါဝင်ပါတယ်။ အသေးစိတ်ကိုအောက်မှာတစ်ခုခြင်းကြည့်နိုင်ပါတယ်။

Image: Forbes

EPYC Bergamo: The Cloud Native Beast

EPYC Bergamo CPU တွေဟာ သိပ်သည်းဆမြင့်မားတဲ့ VM ဖြန့်ကျက်မှု၊ ဒေတာခွဲခြမ်းစိတ်ဖြာမှုနဲ့ front-end ဝဘ်ဝန်ဆောင်မှုတွေအတွက် ဒီဇိုင်းထုတ်ထားတာပါ။ ဒီ CPU တွေဟာ လက်ရှိစံပြုထားတဲ့ဒေတာစင်တာ solutionတွေထက် ပိုမိုမြင့်မားတဲ့ core အရေအတွက်တွေကို ပေးအပ်ထားပေမယ့် ပိုနိမ့်တဲ့ frequencyနဲ့ power envelopeတွေဖြင့် ပါတယ်။ ၎င်းတို့ဟာ 12-channel DDR5-4800 memory ကိုလည်း အထောက်အပံ့ပေးထားပြီး EPYC Genoa CPU တွေလို တူညီတဲ့ SP5 socket နဲ့ အသုံးပြုနိုင်ပါတယ်။

Image: AMD

Image: AMD

EPYC Bergamo CPU တွေဟာ စွမ်းဆောင်ရည်နဲ့ ပါဝါထိရောက်မှုအတွက် အကောင်းဆုံးဖြစ်တဲ့ Zen 4cလို့ ခေါ်တဲ့ core ဒီဇိုင်းအသစ်ကို အခြေခံထားတာပါ။ Zen 4c cores တွေဟာ ပုံမှန် Zen 4 cores တွေထက် ၃၅% ပိုသေးငယ်ပြီး performance per watt မှာသိသိသာသာ ပိုမိုကောင်းမွန်ပါပါတယ်။ EPYC Bergamo CPU တွေမှာ socket တစ်ခုကို 128 cores နဲ့ 256 threads အထိပါရှိပြီး core-complex dies (CCDs) ရှစ်ခုပါဝင်ပါတယ်။ CCD တစ်ခုစီမှာ 16 cores ရှိလို့ EPYC Genoa CPU တွေထက် core နှစ်ဆပိုများပါတယ်။

Image: AMD

Image: AMD

Image: AMD

Intel ရဲ့နောက်ဆုံးထွက် Sapphire Rapids 4th Gen Xeon CPUs တွေနဲ့နှိုင်းယှဉ်မယ်ဆိုရင် EPYC Bergamo CPU တွေဟာ ဆာဗာတစ်ခုလျှင် application containers ၂ဆကျော်ကို ထုတ်ပေးနိုင်တယ်လို့ AMD က ဆိုထားပါတယ်။ AMD မှလည်း EPYC Bergamo CPU တွေဟာ containerized workload တွေအတွင်း သိပ်သည်းဆ၃ဆကျော်ကို ထောက်ပံ့ပေးနိုင်တယ်၊ Ampere Computing ရဲ့ Arm-compatible data center chips တွေနဲ့ နှိုင်းယှဉ်မယ်ဆိုရင် cloud နဲ့ hyperscalers တွေကြားမှာ ကျယ်ကျယ် အသုံးပြုလာကြသည်ကိုတွေ့မြင်နေရပါတယ်။

EPYC Bergamo CPU တွေကို မော်ဒယ်နှစ်မျိုးနဲ့ ရရှိနိုင်ပါတယ်၊ EPYC 9754 မှာ 128-cores/256-threads နဲ့ EPYC 9734 မှာ 112-cores/224-threads ပါရှိပါတယ်။ EPYC 9734 မှာတော့ CCD တစ်ခုမှာ core နှစ်ခုကို disable လုပ်ထားတာပါ။ AMD အနေနဲ့ ဒီချစ်ပ်တွေရဲ့ clock speed (သို့မဟုတ်) cacheဖွဲ့စည်းပုံတွေကို မဖော်ပြခဲ့ခြင်းမရှိပါဘူး။

Instinct MI300: The Data Center APU

Instinct MI300 ပရိုဆက်ဆာတွေဟာ ဒေတာစင်တာ APU တွေဖြစ်ပြီး chiplets 13 ခုကို ပေါင်းစပ်ပါဝင်ကာ အများစုက 3D-stacked လုပ်ထားတာပါ။ chip package တစ်ခုကို ဖန်တီးဖို့အတွက် Zen 4 CPU core ၂၄ခုကို CDNA 3 ဂရပ်ဖစ်အင်ဂျင်နဲ့ စုစုပေါင်း 128GB ရှိတဲ့ HBM3 မမ်မိုရီ ရှစ်ခုကို ပေါင်းစပ်ထားတာပါ။ ဒီချစ်ပ်မှာ ထရန်စစ္စတာ ပေါင်း ၁၄၆ ဘီလီယံရှိလို့ AMD က ထုတ်လုပ်ဖူးတဲ့ အကြီးဆုံးချစ်ပ်ဖြစ်လာခဲ့ပါတယ်။

Image: AMD

Instinct MI300 ပရိုဆက်ဆာတွေဟာ natural language processing၊ computer vision နဲ့ recommender systemတွေလို AI workloadတွေအတွက် ဒီဇိုင်းထုတ်ထားတာပါ။ အဆိုပါပရိုဆက်ဆာတွေဟာ ယခုနှစ်နှောင်းပိုင်းမှာ စတင်လည်ပတ်ချိန်ကမ္ဘာ့အမြန်ဆုံးဖြစ်လာမယ့် 2 exaflop မြန်နှုန်းရှိတဲ့ El Capitan စူပါကွန်ပြူတာနှစ်လုံးကို စွမ်းအားပေးသွားမှာပဲဖြစ်ပါတယ်။

Instinct MI300 ပရိုဆက်ဆာတွေဟာ Memory၊ I/O နဲ့ အခြား functionတွေကို ကိုင်တွယ်မယ့် active interposer ၄ခုကို အသုံးပြုထားပါတယ်။ အဆိုပါ interposers တွေဟာ compute die 9ခု နဲ့ ချိတ်ဆက်ထားကာ ၎င်းတို့မှာ CDNA3 GPU compute tile ၆ခုနဲ့ Zen 4 CPU tiles ၃ခုပါ၀င်ပါတယ်။ GPU tiles တစ်ခုစီမှာ compute unit ၈ခုရှိပြီး CPU tiles တစ်ခုစီမှာ core ၈ခုရှိပါတယ်။ compute die တွေဟာ through-silicon vias (TSVs) နဲ့ microbumpတွေကို အသုံးပြုကာ interposers ပေါ်မှာ 3D-stack လုပ်ထားပါတယ်။
Image: AMD

Instinct MI300 ပရိုဆက်ဆာတွေဟာ Chip အချင်းချင်းဆက်သွယ်ဖို့အတွက် Infinity Fabric အပြင် Chip တွေစွာကို ပလပ်ဖောင်းတစ်ခုတည်းမှာ အတူတကွချိတ်ဆက်ဖို့အတွက် Infinity Architecture ကိုလည်း အထောက်အပံ့ပေးပါတယ်။ ချစ်ပ်သည် channelရှစ်ခုမှာ memory bandwidth ကို 5 TB/s အထိပေးစွမ်းနိုင်ပြီး Infinity Fabric Bandwidth ကတော့ 896 GB/s အထိပေးစွမ်းနိင်ပါတယ်။

Image: AMD

Image: AMD

Image: AMD

AMD ဟာ large language models (LLMs) အတွက် ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ထားတဲ့ Instinct MI300 ရဲ့ GPU သာပါဝင်တဲ့ MI300X ကိုလည်း ကြေညာခဲ့ပြီး 192GB HBM3 memory ကို CDNA3 GPU tile တွေနဲ့ တွဲဖက်ထားပါပါတယ်။ ဒီချစ်ပ်ဟာ LLMs တွေကို 80 billion parameters တွေအထိ လုပ်ဆောင်နိုင်ပြီး AMD က GPU တစ်ခုအတွက်ဆိုပါက စံချိန်သစ်လို့ ဆိုထားပါတယ်။

EPYC Genoa-X: The Cache Monster

EPYC Genoa-X ပရိုဆက်ဆာတွေဟာ socket တစ်ခုမှာ L3 cache 1.1GBအထိပါဝင်တဲ့ EPYC Genoa ချစ်ပ်မိသားစုဝင်အသစ်တစ်ခုဖြစ်ပါတယ်။ ဒီချစ်ပ်တွေဟာ memory-bound အလုပ်တွေဖြစ်တဲ့ ခွဲခြမ်းစိတ်ဖြာချက်တွေနဲ့ HPC အပလီကေးရှင်းတွေ စတဲ့အလုပ်တွေမှာ စွမ်းဆောင်ရည်မြှင့်တင်ဖို့ရာ ဒီဇိုင်းထုတ်ထားပါတယ်။ ချစ်ပ်တွေဟာ DDR5-5600 memory နဲ့ PCIe Gen5 ကိုလည်း အထောက်အပံ့ပေးပါသေးတယ်။

Image: AMD

EPYC Genoa-X ပရိုဆက်ဆာတွေဟာ EPYC Genoa ပရိုဆက်ဆာတွေလိုမျိုး တူညီတဲ့ Zen 4 core ဒီဇိုင်းကို အခြေခံထားတယ်ဆိုပေမယ့် မတူညီတဲ့ cache ဖွဲ့စည်းပုံနဲ့ဖြစ်ပါတယ်။ EPYC Genoa-X ပရိုဆက်ဆာတွေဟာ socket တစ်ခုမှာ 96 cores နဲ့ 192 threads အထိပါရှိပြီး CCD ရှစ်ခုမှာ ဖြန့်ကျက်ထားပါတယ်။ CCD တစ်ခုခြင်းစီမှာ EPYC Genoa ပရိုဆက်ဆာတွေလို core 12 ခုရှိပါတယ်။ သို့သော်ငြား EPYC Genoa-X ပရိုဆက်ဆာတွေဟာ CCD တစ်ခုမှာ L3 cache 144MB အထိရှိပြီး EPYC Genoa ပရိုဆက်ဆာတွေထက် သုံးဆပိုမိုများပြားပါတယ်။

Image: AMD


Image: AMD

EPYC Genoa-X ပရိုဆက်ဆာတွေဟာ EPYC Genoa ပရိုဆက်ဆာတွေနဲ့ နှိုင်းယှဉ်ပါက Memory-bound workloads မှာ စွမ်းဆောင်ရည် ၂ဆကျော်အထိ စွမ်းဆောင်နိုင်တယ်လို့ AMD က အခိုင်အမာဆိုပါတယ်။EPYC Genoa-X ပရိုဆက်ဆာတွေဟာ Intel ရဲ့ Sapphire Rapids Xeon CPU တွေထက် ၁.၅ဆ ပိုမိုတဲ့စွမ်းဆောင်ရည်ကို ပေးစွမ်းနိုင်တယ်လို့လည်း AMD က ဆိုပါတယ်။

EPYC Genoa-X ပရိုဆက်ဆာတွေကို ယခု မော်ဒယ်နှစ်မျိုးနဲ့ ရနိုင်ပါတယ်- EPYC 9764X မှာ 96-cores/192-threads နဲ့ 1.1GB L3 cache ပါဝင်ကာ EPYC 9744X မှာတော့ 80-cores/160-threads နဲ့ 960MB L3 cache ပါဝင်ပါတယ်။

AMD ဟာ သူရဲ့ အောင်မြင်မှုအပေါ်မှာ သာယာမနေဘူးဆိုတာကို ထပ်မံပြသခဲ့ပြီး သူတို့ ထုတ်ကုန်အသစ်တွေနဲ့ data center ဆန်းသစ်တီထွင်မှု၏ နယ်နိမိတ်တွေကိုပါရောက်ရှိလာခဲ့ပါတယ်။ EPYC Bergamo၊ Genoa-X နှင့် Instinct MI300 ပရိုဆက်ဆာတွေဟာ cloud၊ HPC နဲ့ AI workloadတွေအတွက် စွဲမက်ဖွယ်ကောင်းတဲ့စွမ်းဆောင်ရည်၊ scalable ဖြစ်မှုနဲ့ ထိရောက်မှုတို့ကို ပေးအပ်ထားပါတယ်။ AMD အနေနဲ့ သူတို့ရဲ့ Infinity Architecture နဲ့ Alveo/Pensando networking နှင့် DPUs များကို လွှမ်းခြုံထားကာ ပြည့်စုံတဲ့ပလက်ဖောင်းဗျူဟာတစ်ခုအဖြစ်လည်း အုတ်မြစ်ချထားပါတယ်။ AMD ဟာ ဒေတာစင်တာစျေးကွက်မှာ Intel နဲ့ Nvidia ကို ပြတ်ပြတ်သားသားစိန်ခေါ်နေပြီး အနာဂတ်မှာ ပိ့မိုပြင်းထန်တဲ့ ပြိုင်ဆိုင်မှုနဲ့ ဆန်းသစ်တီထွင်မှုတွေရှိလာဖို့ ကျွန်တော်တို့ မျှော်လင့်နေပါတယ်။

Source: Forbes, Guru3d and Tom's Hardware

#EnThueTech
#News
#HPC
#AI

Post a Comment

0 Comments