AI চেক করবে AI-এর কাজ: মেটার নতুন এআই মডেল "সেল্ফ-টট এভালুয়েটর"
মেটা, তাদের রিসার্চ বিভাগের কিছু নতুন কৃত্রিম বুদ্ধিমত্তা (AI) মডেল প্রকাশ করেছে। এর মধ্যে অন্যতম হলো "সেল্ফ-টট এভালুয়েটর" মডেল, যা AI উন্নয়নের প্রক্রিয়ায় মানুষের অংশগ্রহণ কমাতে পারে।
এই মডেলটি মূলত AI মডেলগুলোর কাজ নিজে নিজে মূল্যায়ন করতে শেখে, যা ভবিষ্যতে AI-এর আরও স্বয়ংসম্পূর্ণতা নিশ্চিত করতে পারে। আগস্টে একটি গবেষণাপত্রে মেটা প্রথমবারের মতো এই টুলটি নিয়ে আসে, যা OpenAI-এর চেইন অফ থট (Chain of Thought) কৌশল ব্যবহার করে। এই কৌশলটি জটিল সমস্যাকে ছোট ধাপে ভাগ করে সমাধান করতে সাহায্য করে এবং বিজ্ঞান, গণিত ও কোডিংয়ের মতো কঠিন বিষয়ে AI-এর জবাব আরও নির্ভুল করে তোলে।
মেটার গবেষকরা সম্পূর্ণ AI-উৎপাদিত ডেটা ব্যবহার করে এভালুয়েটর মডেলটি প্রশিক্ষণ দিয়েছেন, যেখানে কোনো মানব ইনপুটের প্রয়োজন হয়নি। এই মডেলটি AI মডেলগুলোর কাজ সঠিকভাবে মূল্যায়ন করতে পারে, যা AI এজেন্টদের তাদের নিজস্ব ভুল থেকে শেখার সুযোগ দেয়। গবেষকদের মতে, এই পদ্ধতি AI উন্নয়নের ক্ষেত্রে একটি বড় সম্ভাবনা নিয়ে আসছে, যেখানে স্বয়ংসম্পূর্ণ AI এজেন্টরা মানুষের হস্তক্ষেপ ছাড়াই বিভিন্ন জটিল কাজ করতে সক্ষম হবে।
বর্তমানে, মানব মূল্যায়নের উপর নির্ভরশীল Reinforcement Learning from Human Feedback (RLFH) প্রক্রিয়া ব্যয়বহুল এবং সময়সাপেক্ষ। তবে মেটার নতুন মডেল এ প্রক্রিয়াকে সহজ ও কম খরচে করতে পারে। মেটার গবেষক জেসন ওয়েস্টন বলেছেন, "আমরা আশা করছি, AI যত উন্নত হবে, ততই এটি নিজের কাজ নিজেই মূল্যায়ন করতে সক্ষম হবে এবং সাধারণ মানুষের তুলনায় আরও দক্ষ হয়ে উঠবে।"
গুগল ও অ্যানথ্রপিকের মতো অন্যান্য কোম্পানিও এ বিষয়ে গবেষণা করছে, তবে তারা তাদের মডেলগুলো সাধারণ মানুষের জন্য প্রকাশ করেনি। মেটার উদ্যোগ AI প্রযুক্তির ব্যবহারকে আরও বিস্তৃত করতে সাহায্য করবে।
এছাড়া মেটা আরও কিছু AI টুল প্রকাশ করেছে, যার মধ্যে রয়েছে ইমেজ চেনার মডেল 'সেগমেন্ট এনিথিং', দ্রুত প্রতিক্রিয়া প্রদানকারী টুল এবং নতুন অজৈব উপাদান আবিষ্কারের ডেটাসেট।