AI benchmark မှာ စံချိန်ချိုးနိုင်တဲ့ Grok 3 ထွက်ပြီ
အီလွန်မတ်စ်က အခု AI က ထွက်ဖူးသမျှထဲမှာ အကြမ်းဆုံးလို့ ပြောပါတယ်။
သူပြောတာလည်း မလွန်ပါဘူး။ Grok 3 က Chatbot Arena ရဲ့ benchmarking မှာ ထိပ်ဆုံးရောက်သွားလို့ပါ။ Chatbot Arena ဆိုတာက AI chatbots တွေရဲ့ စွမ်းဆောင်ရည်ကို အကဲဖြတ်ရာမှာ ထိပ်တန်း ranking system အဖြစ် AI Benchmarking နယ်ပယ်က လက်ခံထားတဲ့ ပလက်ဖောင်းပါ။
ချောကလက်ကုဒ်နာမည်နဲ့ Grok 3 early ဗားရှင်းကို Chatbot Arena မှာ score 1400 ပေးထားပါတယ်။ score 1400 ရတဲ့ ပထမဆုံး AI model လို့ ပြောရမှာပါ။ Chatbot Arena မှာ အကြမ်းဆုံးဆိုပြီး 1385 score ရထားတဲ့ Gemini 2.0 Flash ကိုပါ ကျော်သွားတာပါ။
ယှဉ်ကြည့်မယ်ဆိုရင် OpenAI ရဲ့ GPT -4o နဲ့ o1 က ၁၃၇၇ မှတ်နဲ့ ၁၃၅၃ မှတ်စီ ရထားပါတယ်။ အခု Grok 3 က အရင် Grok 2 ထက် တွက်ချက်မှုစွမ်းရည် compute power ၁၀ ဆကျော် ပိုကောင်းတယ်လို့ ပြောပါတယ်။ AI chatbots တွေကို သင်္ချာ ၊ သိပ္ပံ နဲ့ coding benchmark တိုင်းရာမှာလည်း Grok 3 က Google Gemini , DeepSeek V3 model , Anthropic Claude နဲ့OpenAI ထုတ် GPT -4o တို့ထက် သာခဲ့တာပါ။
မော်ဒယ်ကို နေ့တိုင်း တောက်လျှောက်ပိုကောင်းအောင် လုပ်နေတာမို့ ပိုအဆင့်မြင့်လာမယ်လို့လည်း အီလွန်မတ်စ်က ပြောထားပါတယ်။ ဒီမော်ဒယ်ရဲ့ ထူးခြားချက်က တရားရုံးမူခင်းနဲ့ ဥပဒေစီရင်ထုံးတွေပါ ထည့်ပြီး train ထားတာပါ။ ဥပဒေဖြတ်ထုံးတွေဘက်မှာ တော်တော့်ကို ကြမ်းမယ့်မော်ဒယ်လို့ ဆိုနိုင်ပါတယ်။
Grok 3 မှာ ရှုပ်ထွေးနက်နဲတဲ့ မေးခွန်းတွေကို ဖြေဖို့ လေ့ကျင့်ထားတဲ့ reasoning mode နှစ်မျိုးရှိပါတယ်။ Grok ရဲ့ reasoning လုပ်ပုံကို ပြတဲ့ Think mode နဲ့ computional power ပိုများပြီး ရှုပ်ထွေးတဲ့ tasks တွေ လုပ်နိုင်တဲ့ Big Brain ဆိုတဲ့ mode ပါ။
ဒါတွေအပြင် AI search engine သစ်ဖြစ်တဲ့ Deep Search လို့ခေါ်တဲ့ product လည်း ထွက်ထားပါတယ်။ Deep Search ကလည်း တွေးခေါ်ဆင်ခြင်နိုင်တဲ့ reasoning chatbot ဖြစ်ပြီး ချပေးတဲ့ query ကို နားလည်နိုင်စွမ်းရှိပြီး သုတေသနလုပ်တာ ၊ brainstorm ဝင်တာနဲ့ ဒေတာဆန်းစစ်သုံးသပ်တာတွေ လုပ်နိုင်တယ်လို့ ပြောပါတယ်။ မကြာခင်မှာ Deep Search က အသံစနစ် ပါလာဖို့ ရှိပါတယ်။
အီလွန်မတ်စ်က သူ့ Grok 3 ကို train ဖို့လည်း ရှယ်အကုန်အကျခံထားတာပါ။ တင်နက်ဆီပြည်နယ် မမ်ဖစ်မှာ ရှိတဲ့ ဧရာမ Colossus စူပါကွန်ပျူတာကြီးနဲ့ လေ့ကျင့်ထားတာပါ။ Grok 3 ကို လေ့ကျင့်ဖို့ Nvidia H100 GPU ပေါင်း ၁ သိန်းလောက် သုံးထားတယ်လို့ ဆိုပါတယ်။
H100 တွေက တစ်ခုဒေါ်လာ ၂ သောင်းခွဲလောက် ရှိပါတယ်။ မကြာခင် GPU ၂ သိန်းအထိ တိုးမှာ ဖြစ်ပြီး Nvidia ရဲ့ အသစ်ထွက်လာမယ့် H200 GPU တွေပါ ပါလာမယ်လို့ ဆိုပါတယ်။ ဒေါ်လာဘီလျံချီ ရှယ်သုံးထားတာ ဖြစ်လို့ အီလွန်မတ်စ်ကလည်း သူ့ chatbot ကို အလကားပေးမသုံးပါဘူး။ အမေရိကန်က တစ်လ ဒေါ်လာ ၄၀ တန် X premium plus ဝယ်ထားသူတွေပဲ ရမှာပါ။
SuperGrok ဆိုပြီး app နဲ့ Grok ဝက်ဘ်ဗားရှင်းတွေမှာလည်း subscription သစ်နဲ့ ဖွင့်တော့မယ်လို့ ပြောပါတယ်။ SuperGrok က တစ်လ ဒေါ်လာ ၃၀ နဲ့ တစ်နှစ် ဒေါ်လာ ၃၀၀ နှုန်း ကောက်ဖို့ ရှိပြီး အရင်ထွက်ထားတဲ့ Gork 2 လည်း မကြာခင် open-source ပေးသွားဖို့လည်း ရှိပါတယ်။
