সপ্তাহজুড়ে নানা জল্পনার পর অবশেষে গুগল উন্মোচন করল তাদের নতুন প্রজন্মের কৃত্রিম বুদ্ধিমত্তা মডেল Gemini 3 Pro। এআই বাজারে এখন প্রতিযোগিতা একেবারে তুঙ্গে— প্রতিটি সংস্থাই চাইছে সবচেয়ে শক্তিশালী এবং সবচেয়ে ব্যবহারযোগ্য মডেল তৈরি করতে। সেই দৌড়ে নিজের হারানো দাপট ফিরে আনতেই এবার নতুন বাজি ধরেছে গুগল।
গুগলের আগের মডেল Gemini 2.5 Pro বহু ক্ষেত্রেই শীর্ষস্থান দখল করেছিল। কিন্তু মাঝখানে ইলন মাস্কের সংস্থা তৈরি Grok-এর উন্নত সংস্করণ কিছু গুরুত্বপূর্ণ পরীক্ষায় এগিয়ে গিয়ে আলোচনার কেন্দ্রে চলে আসে। কেউ কেউ তখন ভাবতে শুরু করেছিলেন— এআই দুনিয়ার শীর্ষস্থান হয়তো অন্য কারও দখলে চলে যেতে চলেছে। গুগল যেন সেই ধারণা বদলে দিতে এবার সমস্ত শক্তি ঢেলে দিয়েছে।
LMArena-য় বিপুল ব্যবধানে প্রথম Gemini 3
নতুন মডেলের সবচেয়ে আলোচিত সাফল্য এসেছে জনপ্রিয় মূল্যায়ন প্ল্যাটফর্ম LMArena-তে। বিভিন্ন মডেলকে একই ধরনের কঠিন পরীক্ষায় বসিয়ে স্কোর নির্ধারণ করে এই প্ল্যাটফর্ম। সেখানে Gemini 3 Pro শুধু প্রথমই হয়নি, বরং ১৫০১ স্কোর নিয়ে অন্য সব প্রতিদ্বন্দ্বীকে অনেকটা পেছনে ফেলে দিয়েছে।
Grok-এর সর্বশেষ সংস্করণ, GPT-5 সিরিজ, Claude— কেউই গুগলের নতুন মডেলের সামনে টিকতে পারেনি। বিশেষ করে ওয়েব ডেভেলপমেন্টে, যেখানে আগে GPT-5 এগিয়ে ছিল, সেই স্থানেও এবার শীর্ষে উঠেছে Gemini 3 Pro।
প্ল্যাটফর্মটির ভাষ্য— কোডিং, গণিত, দীর্ঘ প্রশ্ন বিশ্লেষণ, অথবা সৃজনশীল লেখা— সব ক্ষেত্রেই এই মুহূর্তে ‘নম্বর ওয়ান’ মডেল হলো Gemini 3 Pro।
Humanity’s Last Exam: যুক্তি–বিশ্লেষণে অভূতপূর্ব ফলাফল
এআই নিয়ে সবচেয়ে কঠিন এবং আলোচিত পরীক্ষাগুলির মধ্যে একটি হলো Humanity’s Last Exam— যা মূলত উন্নত একাডেমিক রিজনিং বা গভীর চিন্তাশক্তি যাচাই করে।
এই পরীক্ষায় Gemini 3 Pro পেয়েছে ৩৭.৫%, যেখানে GPT-5.1 পেয়েছে ২৬.৫% এবং Claude Sonnet 4.5 পেয়েছে মাত্র ১৩.৭%।
এত বড় ব্যবধানে শীর্ষে উঠেছে বলে এই ফলাফল বিশেষভাবে নজর কেড়েছে।
MathArena Apex: কঠিন গণিতে ‘গেম চেঞ্জার’
গণিত হলো এআই মডেলগুলোর জন্য সবচেয়ে চ্যালেঞ্জিং ক্ষেত্রগুলির একটি। যেখানে অন্যান্য মডেল ১%–এর কিছু বেশি স্কোর করতে পারে, সেখানে Gemini 3 Pro করেছে অবিশ্বাস্য ২৩.৪%।
এটি বর্তমানে গণিত–চিন্তনক্ষমতায় সব মডেলকে ছাপিয়ে গেছে।
Screen Understanding-এ একচ্ছত্র আধিপত্য
এআই–এর ভবিষ্যতে এজেন্টিক ক্ষমতা বাড়াতে একটি অত্যন্ত গুরুত্বপূর্ণ দক্ষতা হলো স্ক্রিন বুঝতে পারা— অর্থাৎ একটি অ্যাপ বা ইন্টারফেস দেখে কার্যকলাপ, বাটন, অপশন, তথ্যগুলোর সম্পর্ক বুঝতে পারা।
এই দক্ষতা যাচাইয়ের জন্য ScreenSpot Pro-তে স্কোরগুলো হলো—
Gemini 3 Pro — ৭২.৭%
Claude — ৩৬.২%
GPT-5.1 — ৩.৫%
এখানে গুগলের মডেলটি কার্যত একক আধিপত্য দেখিয়েছে।
একটি জায়গায় পিছিয়ে: SWE-Bench Verified
তবে সব পরীক্ষা জিতেনি গুগলের নতুন মডেল। কোডিং–কেন্দ্রিক কঠিন পরীক্ষা SWE-Bench Verified-এ এখনও শীর্ষে রয়েছে Claude Sonnet 4.5।
এখানে স্কোর—
Claude — ৭৭.২%
GPT-5.1 — ৭৬.৩%
Gemini 3 Pro — ৭৬.২%
যদিও ব্যবধান খুব কম, তবুও কোডিং ক্ষেত্রে সামান্য হলেও পিছিয়ে রয়েছে Gemini 3 Pro।
এখনই কি এআই–এর নতুন সেরা মডেল?
সব দিক বিচার করলে দেখা যায়— এই মুহূর্তে বেশিরভাগ মূল্যায়নেই Gemini 3 Pro এগিয়ে। কিন্তু প্রশ্ন হলো— এই অবস্থান কতদিন থাকবে?
কারণ এআই কোম্পানিগুলো প্রায় প্রতি মাসেই নতুন মডেল আনছে, বেঞ্চমার্ক বদলাচ্ছে, নতুন পরীক্ষার ভিত্তিতে মডেলগুলোকে টিউন করা হচ্ছে। ফলে তালিকার শীর্ষস্থান দ্রুত বদলে যেতে পারে।
আরও একটি বিষয় গুরুত্বপূর্ণ—
সব বেঞ্চমার্কই প্রকৃত ব্যবহারকারীর অভিজ্ঞতা পুরোপুরি তুলে ধরে না।
অনেক সময় নির্দিষ্ট পরীক্ষার জন্য বিশেষভাবে প্রস্তুত করা মডেল বাস্তব ব্যবহারে একই কর্মক্ষমতা দেখাতে পারে না।
তবু বড় প্রত্যাবর্তন গুগলের
সকল আলোচনা, বিতর্ক, তুলনা ছাপিয়ে বলা যায়— Gemini 3 Pro গুগলের জন্য এক বড়সড় প্রত্যাবর্তন।
গত কয়েক মাসে প্রতিযোগিতা যতই তীব্র হয়ে উঠুক, এই মডেল গুগলের গবেষণাশক্তি ও প্রযুক্তিগত দক্ষতার নতুন প্রমাণ হিসেবে সামনে এসেছে।
এখন দেখার বিষয়—
বাজারে এর ব্যবহার কেমন হয়, এবং বাস্তব অভিজ্ঞতায় এটি কি সত্যিই সেই একই আধিপত্য ধরে রাখতে পারে?

Hello, I am Biplab Baroi. I have been working in blogging for more than four years. I began my journey in the digital media industry in 2021.
Along with covering daily news and current events, I write articles on tech news, smartphones, and astrology. My work is created strictly for educational purposes use only.