GPU အသစ်များ
RTX 5090 အမြင့်ဆုံး မော်ဒယ်အသစ်က သူ့ရဲ့ အရင်မျိုးဆက်ထက် Hardware ပိုင်းမှာ သိသိသာသာ ပိုကောင်းလာပါတယ်။ ဒီ GPU က Nvidia ရဲ့ Blackwell architecture အသစ်ကို သုံးထားရုံသာမက CUDA core တွေ၊ Memory Bandwidth နဲ့ VRAM ပမာဏလည်း ပိုမိုများပြားလာပါတယ်။ Streaming Multiprocessor (SM) အရေအတွက်က လည်း RTX 4090 မှာ ၁၂၈ ခုရှိရာကနေ RTX 5090 မှာ ၁၇၀ အထိ တိုးလာသလို Core အရွယ်အစားလည်း ၃၃% တိုးလာပါတယ်။ ဒါပေမဲ့ GPU boost clock ကတော့ 2.5 GHz ကနေ 2.4 GHz ကို အနည်းငယ် လျော့ကျသွားပါတယ်။
Memory စနစ်ကို ပြန်လည်မွန်းမံထားပြီး အခု GDDR7 နည်းပညာကို ကြီးမားတဲ့ 512-bit bus နဲ့ သုံးလာပါတယ်။ memory clock 28 Gbps ရှိတဲ့ GDDR7 memory ကြောင့် Memory Bandwidth က 1,792 GB/s အထိ ရောက်ရှိသွားပြီး RTX 4090 ရဲ့ Bandwidth ထက် ၈၀% နီးပါး တိုးတက်လာပါတယ်။ ဒါတင်မက Nvidia က consumer GPU တစ်ခုမှာ အများဆုံးပေးအပ်လာတဲ့ 32GB VRAM လည်း ပါဝင်ပါတယ်။
Blackwell ကို TSMC 4nm နည်းပညာနဲ့ တည်ဆောက်ထားပြီး ဒီ core တွေနဲ့ memory တွေကြောင့် Board power rating က 575W အထိ တိုးလာပြီး RTX 4090 ထက် ၂၈% ပိုမိုမြင့်တက်လာပါတယ်။
RTX 5080 ကတော့ လုံးဝကွဲပြားတဲ့ GPU die ကို အခြေခံထားတဲ့ သေးငယ်တဲ့ GPU configuration ကို သုံးထားပြီး SM ၈၄ ခုပဲ ပါဝင်ပါတယ်။ ဒါက အရင်မျိုးဆက် RTX 4080 Super ထက် ၄ ခုသာ ပိုမိုများပြားတာဖြစ်ပါတယ်။ ဒီမော်ဒယ်ရဲ့ အရာအားလုံးနီးပါးက RTX 5090 ရဲ့ တစ်ဝက်နီးပါးပဲ ရှိပါတယ်။ CUDA core အရေအတွက်က တစ်ဝက်နီးပါး၊ Memory bus width ဟာလည်း 256-bit မို့တစ်ဝက်သာရှိသလို VRAM ပမာဏကလည်း 16GB မို့ တစ်ဝက်သာရှိပါတယ်။ တစ်ဝက်ကျော်တာဆိုလို့ 30 Gbps မှာ clock speed ရှိတဲ့ GDDR7 ကို သုံးထားတာကြောင့် Memory Bandwidth 960 GB/s ရှိတာဖြစ်ပါတယ်။ သမိုင်းကြောင်းအရဆိုရင် ဒီ configuration က RTX 5070 အဆင့် GPU နဲ့သာ ကိုက်ညီတာကြောင့် 5080 အဖြစ် သတ်မှတ်လိုက်ခြင်းဟာ ဂိမ်းကစားသူတွေအတွက် စိတ်ပျက်စေနိုင်ပါတယ်။
RTX 5070 Ti ကတော့ SM ၇၀ နဲ့ ထပ်မံလျှော့ချထားပြီး အရင်မျိုးဆက် RTX 4070 Ti Super ထက် ၄ ခုသာ ပိုမိုများပြားပါတယ်။ သို့ပင်သော်ငြား boost clock က 2.61 GHz ကနေ 2.45 GHz ကို ကျဆင်းသွားပေမယ့် Memory bus width က RTX 5080 ရဲ့ 256-bit configuration နဲ့ အတူတူပဲဖြစ်တာကြောင့် 16GB GDDR7 memory လည်း ပါဝင်ပါတယ်။ ဒီတစ်ခါမှာတော့ 28 Gbps ရှိတဲ့ memory clock ကြောင့် bandwidth အနေနဲ့ 896 GB/s ရရှိမှာဖြစ်ပါတယ်။ RTX 5070 Ti ကို 300W သတ်မှတ်ထားပြီး RTX 5080 ကိုတော့ 360W သတ်မှတ်ထားပါတယ်။
နောက်ဆုံးတစ်ခုကတော့ RTX 5070 ဖြစ်ပါတယ်။ ဒီမော်ဒယ်မှာ SM ၄၈ ခု ပါဝင်ပြီး အရင်မျိုးဆက် RTX 4070 ထက် ၂ ခုပဲ ပိုများပါတယ်။ 192-bit memory bus နဲ့ 12GB VRAM ပါဝင်တာကြောင့် xx70အဆင့် ထုတ်ကုန်အတွက် နိမ့်ပါးတယ်လို့ ခံစားရပါတယ်။ Boost clock တွေက RTX 4070 ထက် အနည်းငယ်ပဲ မြင့်တက်လာပြီး 2.48 GHz ကနေ 2.51 GHz ကို တိုးလာကာ total power rating က 250W ဖြစ်ပါတယ်။
GeForce 50 စီးရီး GPU အသစ်အားလုံးမှာ ကြေညာထားတဲ့ မော်ဒယ်တွေအတွက် PCIe 5.0 x16 နဲ့ active cable တွေကို အထောက်အပံ့ပေးတဲ့ DisplayPort 2.1b UHBR20 လိုမျိုး ချိတ်ဆက်မှုအသစ်တွေ ပါဝင်ပါတယ်။ ဒါ့အပြင် HDMI 2.1 နဲ့ မော်ဒယ်တစ်ခုစီမှာ 16-pin power connector တစ်ခုစီ ပါဝင်ပါတယ်။
GeForce 50 စီးရီး GPUများ၏ စွမ်းဆောင်ရည်နှင့် ဈေးနှုန်း
GeForce 50 စီးရီး Blackwell GPU တွေမှာ ကောင်းတာရော ဆိုးတာရော ရှိနေပါတယ်။ GeForce RTX 5090 က မျှော်လင့်ထားသလိုပဲ အရမ်းဈေးကြီးပြီး ဒေါ်လာ ၂၀၀၀ နဲ့ ဈေးနှုန်း သတ်မှတ်ထားပါတယ်။ တစ်ချိန်တည်းမှာပဲ GPU hardware တစ်ဝက်ပဲ ပါဝင်တဲ့ RTX 5080 ကို ဒေါ်လာ ၁၀၀၀ နဲ့ ဈေးနှုန်း သတ်မှတ်ထားတာက ကောလဟာလတွေထက် သိပ်မဆိုးပေမဲ့ တော်တော်လေး ဈေးကြီးနေပါသေးတယ်။
ကျွန်တော်တို့အတွက် အံ့အားသင့်စရာက RTX 5070 Ti ကို ဒေါ်လာ ၇၅၀ နဲ့ RTX 5070 ကို ဒေါ်လာ ၅၅၀ နဲ့ ဈေးနှုန်း သတ်မှတ်ထားတာပါပဲ။ နှစ်ခုစလုံးက အရင်မျိုးဆက်ရဲ့ ဈေးနှုန်းထက် ဒေါ်လာ ၅၀ စီ လျှော့ချထားတာဖြစ်ပါတယ်။
စွမ်းဆောင်ရည်ပိုင်းနဲ့ ပတ်သက်ပြီး Nvidia က အမြဲတမ်းလိုပဲ သူ့ရဲ့ မားကတ်တင်းတွေနဲ့ ဂိမ်းစွမ်းဆောင်ရည်အစစ်အမှန်ကို ဖုံးကွယ်ထားပါတယ်။ RTX 50 GPU တွေက အရင်မျိုးဆက် GPU တွေမှာ မပါဝင်တဲ့ DLSS 4 multi-frame generation ကို အထောက်အပံ့ပေးပါတယ်။ ဆိုလိုတာက RTX 50 စီးရီး GPU တွေဟာ DLSS အထောက်အပံ့ပေးတဲ့ ဂိမ်းတွေမှာ အရင်မျိုးဆက် မော်ဒယ်တွေထက် နှစ်ဆ ပိုများတဲ့ frame တွေကို ထုတ်ပေးနိုင်တာကြောင့် RTX 40 စီးရီး GPU တွေထက် နှစ်ဆအထိ "မြန်" တယ်လို့ ထင်ရစေပါတယ်။ ဒါပေမဲ့ တကယ်တမ်းမှာ DLSS 4 နဲ့ FPS အရေအတွက်တွေ တိုးလာပေမဲ့ latency နဲ့ ဂိမ်းကစားတဲ့ ခံစားချက်က အဲဒီလောက်ထိ သိသိသာသာ တိုးတက်လာချင်မှ တိုးတက်လာမှာပါ။
သူတို့ပြသသွားတဲ့ ဇယားတွေမှာ Nvidia က DLSS 4 ကို အထောက်အပံ့ပေးတဲ့ ဂိမ်းနဲ့ အက်ပ် လေးခုကို အဓိကထား ဖော်ပြခဲ့ပါတယ်- Cyberpunk 2077၊ Alan Wake 2၊ Black Myth Wukong နဲ့ D5 Render တို့ဖြစ်ပါတယ်။ ဒါပေမဲ့ အဲဒီဂိမ်းတွေအတွက် သင့်လျော်တဲ့ စွမ်းဆောင်ရည် အချက်အလက်တွေ မရှိသေးတာကြောင့် အခုလောလောဆယ်တော့ ဖယ်ထားလိုက်ပါမယ်။ ကျန်တဲ့ ဂိမ်းတွေအတွက် စွမ်းဆောင်ရည် ပြောဆိုချက်တွေက ပိုအရေးကြီးပါတယ်။
RTX 5070 က RTX 4090 ရဲ့ စွမ်းဆောင်ရည်နဲ့ တူညီတယ်ဆိုတဲ့ ပြောဆိုချက်က သံသယဝင်စရာကောင်းပါတယ်။ DLSS 4 နဲ့ frame rate မှာ တူညီနိုင်ပေမဲ့ DLSS မပါတဲ့ စွမ်းဆောင်ရည်မှာတော့ လုံးဝ မတူညီနိုင်ပါဘူး။ Nvidia ရဲ့ ပြသထားတဲ့ဇယားတွေအရ RTX 5070 ဟာ 1440p မှာ RTX 4070 ထက် ၂၀-၃၀% ပိုမြန်ပုံရပါတယ်။
ဒါက RTX 5070 ကို RTX 4070 Super ထက် ဒေါ်လာ ၅၀ လောက် သက်သာတဲ့ ဈေးနှုန်းနဲ့ စွမ်းဆောင်ရည်အနည်းငယ် ပိုမိုသာလွန်စေမှာဖြစ်ပြီး တနည်းအားဖြင့်ဆိုရရင် RTX 4070 ထက် ဈေးနှုန်းတူမယ်ဆိုရင် ၂၀-၃၀% ပိုမြန်ဆန်စေမှာပါ။ RTX 4070 Super နဲ့ ဆက်စပ်ပြီး ဘယ်လို စွမ်းဆောင်ရည် ရှိမလဲပေါ် မူတည်ပြီး ဒါက သင့်လျော်တဲ့ တန်ဖိုးကို ပေးစွမ်းနိုင်ပေမဲ့ အနည်းငယ် အားမရစရာတော့ ဖြစ်နိုင်ပါတယ်။
RTX 5070 Ti အတွက်လည်း Nvidia က အလားတူ ပြောဆိုမှုတွေ ပြုလုပ်ခဲ့ပြီး 1440p မှာ 4070 Ti ထက် ၂၀-၃၀% စွမ်းဆောင်ရည် တိုးတက်လာမယ်လို့ ခန့်မှန်းထားပါတယ် (မှားယွင်းစေနိုင်တဲ့ DLSS 4 အရေအတွက်တွေကို ဖယ်ထားပြီး ပြောတာပါ)။ ဒါက RTX 4070 Ti နဲ့ နှိုင်းယှဉ်ရင် cost-per-frame တိုးတက်မှုကို ပိုကောင်းစေမှာဖြစ်ပြီး ၃၀% ထက် ပိုများနိုင်ပေမဲ့ 4070 Ti Super နဲ့ နှိုင်းယှဉ်မယ်ဆိုရင်တော့ ၂၀% နီးပါးကို လျော့နည်းသွားမှာပါ။
RTX 5080 ကလည်း အလားတူ အခြေအနေကို ပြသပါတယ်- RTX 4080 ထက် ၂၀-၃၀% စွမ်းဆောင်ရည် တိုးတက်မှုပါ။ RTX 4080 Super က RTX 4080 ထက် ၅% လောက်ပဲ ပိုမြန်တာကို ထည့်သွင်းစဉ်းစားရင် ဒါက cost-per-frame efficiency မှာ ၂၀% လောက်သာ တိုးတက်မှု ဖြစ်စေပါတယ်။
RTX 5090 အနေနဲ့ကတော့ DLSS 4 မပါတဲ့ အရေအတွက်တွေက RTX 4090 ထက် ၂၀-၄၀% စွမ်းဆောင်ရည်တိုးတက်မှုကို ညွှန်ပြပါတယ်။ ဒါပေမဲ့ RTX 5090 က ၂၅% ပိုဈေးကြီးတာကြောင့် ဂိမ်းအများစုက cost-per-frame မှာ ၂၀% တိုးတက်မှု ရရှိဖို့ ၅၀% နီးပါး စွမ်းဆောင်ရည်တိုးတက်ဖို့ လိုအပ်ပါတယ်။
Nvidia အနေနဲ့ သူတို့ရဲ့ စမ်းသပ်မှုတွေကို 4K resolution 1080p မှာသာ အမှန်တကယ် render လုပ်တဲ့ DLSS Performance mode ကို အသုံးပြုပြီး စမ်းသပ်ခဲ့ပါတယ်။ ဒါက CPU bottleneck တွေနဲ့ ကြီးမားတဲ့ RTX 5090 ရဲ့စွမ်းရည်ကို အပြည့်အဝ အသုံးမချနိုင်တာတွေ ဖြစ်ပေါ်စေနိုင်ပါတယ်။ ရိုးရိုးဂိမ်းတွေနဲ့ နှိုင်းယှဉ်ရင် path-traced ပါရတဲ့ DLSS 4 ဂိမ်းတွေမှာ ပိုမိုအားကောင်းတဲ့ စွမ်းဆောင်ရည် တိုးတက်မှုတွေရှိနေတာလို့ ထင်ပါတယ်။ တကယ်ဟုတ်မဟုတ်ကတော့ review တွေထွက်လာချိန်ကို စောင့်ဆိုင်းရမှာပါ။
Architecture ပိုင်းဆိုင်ရာပြောင်းလဲမှုများ
ဒီမျိုးဆက်နဲ့ပတ်သက်ပြီး ပူပန်မိတာကတော့ Nvidia က အမြင့်ဆုံးအဆင့် မော်ဒယ်နဲ့ သူ့ရဲ့အောက်တစ်ဆင့် မော်ဒယ်ကြားမှာ ကြီးမားတဲ့ ကွာဟချက်တစ်ခုကို ဖန်တီးထားတာပါပဲ။ RTX 5090 က RTX 5080 ရဲ့ Hardware နှစ်ဆနီးပါးနေရှိတာက တော်တော်လေး ဆိုးဝါးပြီး အရင် Dual GPU တွေခေတ်ကို ပြန်ရောက်သွားသလိုခံစားရပါတယ်။ ဒါပေမယ့် ဒီတစ်ခါမှာတော့ ကြီးမားတဲ့ GPU die တစ်ခုတည်း ဖြစ်နေတာကလွဲရင်ပေါ့လေ။ ဒါက RTX 5080 ကို နှိုင်းယှဉ်ကြည့်ရင် တော်တော်လေး အားနည်းတဲ့ ထုတ်ကုန်တစ်ခုလို ခံစားရစေပါတယ်၊ ဈေးနှုန်း ကွာခြားမှု အတော်ကြီးမားတာကို ထည့်တွက်ရင်တောင်ပေါ့လေ။
အခုဆို xx80 အဆင့် GPU က အကောင်းဆုံး မော်ဒယ်ထက်စွမ်းဆောင်ရည် အနည်းငယ်ပဲ လျှော့ချထားတဲ့ ခေတ်ကုန်ဆုံးသွားပြီလို့ဆိုနိုင်ပါတယ်။ ဒီလိုကွာခြားချက် ပိုကြီးလာတာကြောင့် ဂိမ်းကစားသူတွေဟာ 40 စီးရီးရဲ့ အကောင်းဆုံး GPU ထက် သိသိသာသာ ပိုကောင်းတဲ့ စွမ်းဆောင်ရည်ကို ရယူဖို့ မယုံနိုင်လောက်အောင် များပြားတဲ့ ငွေကြေးကို အသုံးပြုရမယ့် အခြေအနေဖြစ်စေပါတယ်။
ဒါက အကောင်းဆုံး GPU နဲ့ နှိုင်းယှဉ်ရင် အတော်လေး အားနည်းသွားတဲ့ အခြားထုတ်ကုန်တွေအတွက်လည်း သက်ရောက်မှုတွေ ရှိလာပါတယ်။ ဒါပေမဲ့ အနည်းဆုံးတော့ ဒီမှာ ကောင်းတဲ့ သတင်းအချို့ ရှိပါတယ်၊ ဘာလို့လဲဆိုတော့ အရင်မျိုးဆက်မှာ RTX 4080 မှာ RTX 4070 Ti ထက် ၂၆% ပိုများတဲ့ CUDA core တွေ ရှိခဲ့ပါတယ်။ ဒီမျိုးဆက်မှာတော့ RTX 5080 မှာ RTX 5070 Ti ထက် ၂၀% ပိုများတဲ့ CUDA core တွေအပြင် ပိုမိုနီးကပ်တဲ့ memory specifications တွေလည်း ရှိပါတယ်။ ဒါကြောင့် RTX 40 စီးရီး စတင်ချိန်မှာ Nvidia လုပ်ခဲ့တာနဲ့ နှိုင်းယှဉ်ရင် 5070 Ti ကို 5080 နဲ့ ဆက်စပ်ပြီး အဲဒီလောက်ထိ လျှော့ချထားတာမတွေ့ရပါဘူး။
Nvidia ရဲ့ Blackwell architecture က အရင် architectureတွေကို ပြန်လည်ပြင်ဆင်ထားတာကြောင့် ray tracing units နဲ့ Tensor core တွေလို အရင်က ရှိခဲ့တဲ့ ကဏ္ဍတွေမှာ တိုးတက်မှုရှိစေပါတယ်။ Jensen က AI အကြောင်းကို သီးသန့် ပြောဆိုဖို့ အချိန်အများကြီး ပေးခဲ့ပါတယ် - ကျွန်တော်တို့ အဲဒါနဲ့ ပတ်သက်ပြီး ငြီးငွေ့အောင် မလုပ်ပါဘူး - ဒါပေမဲ့ အခြေခံအားဖြင့် Blackwell ဟာ သာမန် processing အပြင် AI အတွက်လည်း အတေည်အားကောင်းပါတယ်။
Blackwell မှာ မျိုးဆက်သစ် hardware engine ကြောင့် video encoding နဲ့ decoding ပိုင်းတိုးတက်လာပါတယ်။ ဒါက RTX 20 ကနေ 30 စီးရီး အဆင့်မြှင့်တင်မှု နောက်ပိုင်း ပထမဆုံးအကြိမ် video decoding engine တိုးတက်မှု ဖြစ်ပါတယ်။ Display engine အသစ်ကလည်း multi-monitor configuration အသစ်တွေကို ခွင့်ပြုပေးပါတယ်- DSC မပါဘဲ 4K 165Hz monitor လေးလုံးအထိ ဒါမှမဟုတ် DSC နဲ့ 4K 360Hz monitor နှစ်လုံးအထိပါ။ DSC နဲ့ 8K 100Hz monitor နှစ်လုံးလည်း သုံးနိုင်ပါတယ်။
Nvidia က RTX 5070 Ti မှလွဲပြီး မော်ဒယ်အားလုံးအတွက် Founders Edition(FE) တွေကို ထုတ်လုပ်ထားပါတယ်။ ဒီ FE မော်ဒယ်တွေက RTX 4090 FE ကဒ်တွေနဲ့ ဆင်တူပြီး ပန်ကာနှစ်ခုလုံးက တစ်ဖက်တည်းမှာသာရှိပါတယ်။ အံ့သြစရာကောင်းတာက ကဒ်ကို 575W နဲ့ သတ်မှတ်ထားပေမဲ့ Nvidia က slot နှစ်ခု ဒီဇိုင်းကိုပဲ သုံးထားတာပါ။ RTX 5080 ကလည်း အလွန်ဆင်တူတဲ့ Founders Edition ဒီဇိုင်းကို သုံးထားပုံရပြီး RTX 5070 က Nvidia ရဲ့ specs တွေအရ 304mm အရှည်အစား 242mm အရှည်ရှိတဲ့ သေးငယ်တဲ့ မော်ဒယ်ကို သုံးထားပါတယ်။
Upscaling နည်းပညာအသစ် DLSS 4
Nvidia က သူတို့ရဲ့ upscaling နည်းပညာရဲ့ နောက်မျိုးဆက် DLSS 4 ကိုလည်း ကြေညာလိုက်ပါတယ်။ ဒီမှာ ထူးခြားတာက DLSS 4 frame generation မှာ frame တစ်ခုအတွက် နောက်ထပ် frame သုံးခု generate လုပ်ပေးနိုင်လာတာပါ။ အရင်က DLSS 3 မှာဆိုရင် frame တစ်ခုအတွက် နောက် frame တစ်ခုပဲ generate လုပ်ပေးနိုင်ခဲ့တာပါ။
ဒီမှာ မေးခွန်းထုတ်စရာတွေ အများကြီးပေါ်လာတာက latency ပိုင်းနဲ့ ရုပ်ထွက်အရည်အသွေးပိုင်းပါပဲ။ frame တစ်ခုပြီးတိုင်း နောက်တစ် frame ကို ထုတ်ပေးတဲ့အခါမှာ ၅၀% က တကယ့် frame ကို မြင်နေရတာပါ။ frame သုံးခု generate လုပ်ပေးတဲ့အခါမှာတော့ ၂၅% ပဲ တကယ့် frame ကို မြင်ရပါတော့တယ်။ ဒါကြောင့် generate လုပ်ပေးထားတဲ့ frame တွေက အရည်အသွေး အရမ်းကောင်းနေဖို့လိုပါတယ်။ မဟုတ်ရင် artifact တွေ အများကြီး မြင်နေရမှာဖြစ်သလို ထုတ်ပေးတဲ့ frame တွေရဲ့ အရည်အသွေးက DLSS 3 ထက် သိသိသာသာ ပြောင်းလဲမသွားဘူးဆိုရင် ဒါက ပြဿနာတစ်ခု ဖြစ်လာနိုင်တယ်။
နောက်တစ်ခုက high-frame-rate အတွက် multi-frame rendering ကို သုံးပြီး လှည့်စားတာပဲ။ Nvidia က DLSS 4 အသုံးမပြုဘဲ ဂိမ်းတစ်ခုကို 30 FPS နဲ့ ကစားနေတာကို ပြသခဲ့ပြီး DLSS 4 ဖွင့်လိုက်တဲ့အခါမှာ 240 FPS ကျော်သွားတာကို ပြသခဲ့တယ်။ ဟုတ်ပါတယ်၊ 30 FPS မှာတောင် DLSS upscaling ကို မဖွင့်ထားပါဘူး။ ဒါပေမဲ့ frame သုံးခု generate လုပ်ပေးတာကို သုံးပြီး 30 FPS ဂိမ်းကို 120 FPS အထိ ရောက်အောင် လုပ်တာဆိုရင် input latency က အတော်အရမ်းဆိုးရွားသွားမှာဖြစ်ပါတယ်။
DLSS 4 မှာပါဝင်တဲ့ Multi-Frame Rendering ကို Blackwell GPU တွေမှာသာ သီးသန့်အသုံးပြုနိုင်မှာဖြစ်ပါတယ်။ ဒါပေမဲ့ DLSS 4 မှာ သာမန် frame generation, super resolution နဲ့ ray reconstruction တွေအတွက်လည်း အဆင့်မြှင့်တင်မှုတွေ ပါဝင်ပြီး အခု လက်ရှိအတိုင်းပဲ အဲဒီ feature တွေကို ဆက်လက်အထောက်အပံ့ပေးသွားမှာဖြစ်ပါတယ်။
ဒီအချက်က တော်တော်လေး စိတ်လှုပ်ရှားစရာကောင်းပြီး ရိုးရိုးသားသားပြောရရင် ကျွန်တော်တို့က DLSS 4 မှာပါတဲ့ upscaling အရည်အသွေးပိုင်းဆိုင်ရာတိုးတက်မှုတွေကို multi-frame rendering ထက် ပိုပြီး စိတ်ဝင်စားပါတယ်။ Nvidia က frame generation model အသစ်က ၄၀% ပိုမြန်ပြီး VRAM ကို ၃၀% လျှော့သုံးတယ်လို့လည်း ပြောပါတယ်။ frame အများအပြား ထုတ်ပေးဖို့အတွက် AI algorithm က render လုပ်ထားတဲ့ frame တစ်ခုစီအတွက် တစ်ကြိမ်ပဲ run ဖို့ လိုအပ်ပါတယ်။ Optical flow ကို ထိရောက်တဲ့ hardware model နဲ့ အစားထိုးထားတာကြောင့် Ada Lovelace မှာ optical flow accelerators ကြောင့် hardware ကန့်သတ်ချက် ရှိခဲ့တာကို ထည့်တွက်ရင် ဘာကြောင့် frame generation က 40 စီးရီးမှာပဲ သီးသန့်ဖြစ်နေရတာလဲဆိုတဲ့ မေးခွန်းတွေ ထွက်ပေါ်လာပါတယ်။
မရှင်းတာက DLSS အတွက် transformer model အသစ်ဟာ စွမ်းဆောင်ရည်ထိခိုက်မှုရှိမရှိနဲ့ ထိခိုက်မှုရှိခဲ့ရင်လည်း GPU အားလုံးအတွက် တူညီမှာလား ဆိုတာပါပဲ။ ဥပမာအားဖြင့် သူတို့က frame generation က အခု ပိုမြန်တယ်လို့ ပြောပေမဲ့ အဲဒါက RTX 50 နဲ့ RTX 40 GPU နှစ်ခုလုံးမှာလား။ upscaling အတွက် transformer model ကို အသုံးပြုရတာကြောင့် စွမ်းဆောင်ရည်ထိခိုက်မှုရှိလား။ Review တွေထွက်လာရင်တော့ ဒီကိစ္စကပိုရုပ်လုံးပေါ်လာမှာပါ။
Source: Nvidia and TechSpot
0 Comments