চ্যাটজিপিটির নতুন ‘ইমেজেস ২.০’ মডেলে লেখার উন্নতি

চ্যাটজিপিটির নতুন ‘ইমেজেস ২.০’ মডেলে লেখার উন্নতি

অপেনএআই নতুন ‘ইমেজেস ২.০’ মডেলে ছবি তৈরির ক্ষেত্রে উল্লেখযোগ্য অগ্রগতি সাধন করেছে। এই মডেলটি এখন এমন ছবি তৈরি করতে সক্ষম, যেখানে লেখা প্রায় নিখুঁতভাবে উপস্থাপন করা যায়। পূর্বে, ছবির লেখার সঠিকতা ছিল এআইয়ের জন্য একটি বড় চ্যালেঞ্জ।

প্রযুক্তিবিষয়ক সাইট টেকক্রাঞ্চের প্রতিবেদনে জানানো হয়েছে, নতুন মডেলটি এমন মানের লেখা তৈরি করতে পারে, যা সরাসরি ব্যবহারযোগ্য। উদাহরণস্বরূপ, একটি রেস্টুরেন্টের মেনু তৈরি করা হয়েছে, যা বাস্তব মেনুর মতো স্বাভাবিক দেখাচ্ছে।

আগের এআই মডেলগুলো মূলত ‘ডিফিউশন মডেল’ ব্যবহার করত, যেখানে এলোমেলো পিক্সেল থেকে ধীরে ধীরে ছবি তৈরি করা হতো। ফলে ছবির মূল অবজেক্ট তৈরি হলেও ছোট অংশগুলোর মধ্যে ভুল দেখা যেত। বিশেষজ্ঞদের মতে, লেখার অংশটি ছবির খুব ছোট একটি অংশ হওয়ায় মডেলটি সঠিকভাবে শেখাতে পারত না।

নতুন ‘ইমেজেস ২.০’ মডেলে এই সীমাবদ্ধতা কমানো হয়েছে। গবেষকেরা ‘অটোরিগ্রেসিভ’ মডেলের মতো নতুন পদ্ধতি ব্যবহার করছেন, যা ভাষা মডেলের মতো কাজ করে। এই কারণে লেখা বা সূক্ষ্ম উপাদানগুলো বেশি নির্ভুলভাবে তৈরি হচ্ছে। তবে অপেনএআই নতুন মডেলের প্রযুক্তি সম্পর্কে বিস্তারিত জানায়নি।

প্রতিষ্ঠানটি জানিয়েছে, নতুন মডেলে “থিংকিং ক্যাপাবিলিটি” যুক্ত করা হয়েছে, যার ফলে এটি একটি প্রম্পট থেকে একাধিক ছবি তৈরি করতে পারে। প্রয়োজন হলে তথ্য যাচাই করতে পারে এবং জটিল ডিজাইন তৈরি করতে সক্ষম।

এই মডেলটি বিভিন্ন আকারের মার্কেটিং ভিজ্যুয়াল, কমিক স্ট্রিপ বা ইউআই ডিজাইন তৈরি করতে পারে এবং বাংলাসহ নন-ল্যাটিন ভাষার লেখাও তুলনামূলকভাবে ভালোভাবে তৈরি করতে সক্ষম।

তবে মডেলটির কিছু সীমাবদ্ধতা রয়েছে। এর জ্ঞানভান্ডার ২০২৫ সালের ডিসেম্বর পর্যন্ত। ফলে সাম্প্রতিক তথ্যের ক্ষেত্রে এটি সব সময় নির্ভুল নাও হতে পারে।

অপেনএআই জানিয়েছে, নতুন মডেলটি পূর্বের তুলনায় আরও নির্দিষ্ট নির্দেশনা বুঝতে পারে এবং সূক্ষ্ম বিষয়গুলো ফুটিয়ে তুলতে সক্ষম। যদিও উচ্চমানের ছবি তৈরিতে কিছুটা বেশি সময় লাগতে পারে।

চ্যাটজিপিটি ও কোডেক্স ব্যবহারকারীরা ধাপে ধাপে এই ফিচার ব্যবহার করতে পারবেন। পেইড ব্যবহারকারীরা উন্নত মানের আউটপুট তৈরি করতে পারেন এবং ‘জিপিটি-ইমেজ-২’ নামে একটি এপিআইও উন্মুক্ত করা হবে, যার খরচ ছবির মান ও রেজোলিউশনের উপর নির্ভর করবে।

বিশ্লেষকদের মতে, এই উন্নয়ন ডিজিটাল কনটেন্ট তৈরির ক্ষেত্রে বড় পরিবর্তন আনতে পারে, ডিজাইনার, বিপণনকর্মী ও সাধারণ ব্যবহারকারীদের জন্য মানসম্মত ভিজ্যুয়াল তৈরি করা সহজ হবে।

আরও পড়ুন