Artificial Intelligence & Media Pipelines

AI Generation on Zero Budget: Leveraging Free Stable Diffusion APIs via Kaggle/Hugging Face

টেক্সট থেকে ইমেজ জেনারেশনের জন্য **Stable Diffusion (SD)** মডেলটি অত্যন্ত বিখ্যাত। তবে এটি নিজের প্রজেক্টে ব্যাকএন্ড এপিআই হিসেবে ইন্টিগ্রেট করতে গেলে ক্লাউড জিপিইউর (Cloud GPU) জন্য বিশাল অংকের বিল গুনতে হয়। ওপেন সোর্স আর্কিটেকচারের সবচেয়ে বড় সৌন্দর্য হলো, বুদ্ধি খাটালে আমরা এই এআই ইনফরেন্স সম্পূর্ণ ফ্রিতে মেইনটেইন করতে পারি।

হাগিং ফেস (Hugging Face Inference API) এবং ক্যাগল নোটবুক (Kaggle P100/T4 GPUs) ডেভলপারদের কাস্টম স্ক্রিপ্ট হোস্ট করার ফ্রিমিয়াম সুবিধা দেয়। এর যেকোনো একটি ব্যবহার করে গ্রেডিয়ো ক্লায়েন্ট পাইপলাইনের মাধ্যমে সরাসরি জেএস কোড দিয়ে ছবি জেনারেট করার টেকনিক নিচে আলোচনা করা হলো।

১. ফ্রন্টএন্ড জাভাস্ক্রিপ্ট ইন্টিগ্রেশন (Gradio Client Web Trigger)

আপনার ওয়েবসাইটের ইউজার ইন্টারফেস থেকে সরাসরি কোনো কস্টলি ব্যাকএন্ড ছাড়া ইমেজ জেনারেট করতে হাগিং ফেসে হোস্ট করা একটি ফ্রি ওপেন সোর্স এসডি স্পেসের API এন্ডপয়েন্ট হিট করুন:

<script type="module">
  // অফিশিয়াল গ্রেডিও ক্লায়েন্ট মডিউল ইমপোর্ট করা
  import { Client } from "https://cdn.jsdelivr.net/npm/@gradio/client@0.1.4/dist/index.js";

  async function generateAiImage(userPrompt) {
    try {
      console.log("Triggering inference pipeline...");
      // হাগিং ফেসের একটি ওপেন এসডি-এক্সএল স্পেস এন্ডপয়েন্ট কানেক্ট করা
      const app = await Client.connect("prodia/fast-stable-diffusion");
      
      const result = await app.predict("/predict", [		
        userPrompt, // আপনার প্রম্পট (যেমন: "Cyberpunk developer coding on phone")
        "ugly, blurry, low quality", // নেগেটিভ প্রম্পট
      ]);

      const imageUrl = result.data[0].url;
      console.log("Generated Content Asset Live Path:", imageUrl);
      
      // আপনার আইএমজি ট্যাগে ইউআরএল পুশ করে দিন
      document.getElementById("output-image").src = imageUrl;
    } catch (error) {
      console.error("AI Generation Engine Halted:", error);
    }
  }
  
  window.triggerAiAction = generateAiImage;
</script>

ধাপ ২: কাস্টম ক্যাগল ব্যাকএন্ড (Python SD API Engine)

আপনার যদি নিজস্ব ফাইন-টিউনড সিকেপিটি (CKPT) বা সেফটিensors লোরার (LoRA) মডেল থাকে, তবে ক্যাগলে একটি নোটবুক ওপেন করে GPU অন করুন এবং **Gradio UI App** চালু করে পাবলিক লিঙ্ক জেনারেট করে নিন। সেই লিঙ্কটি সরাসরি উপরে দেওয়া জাভাস্ক্রিপ্ট মডিউলের ভেতর বসিয়ে দিলে আপনার কাস্টম এআই মডেলটি সম্পূর্ণ ফ্রিতে ২৪/৭ এপিআই হিসেবে কাজ করবে।

স্কেলিং মেকানিজম ট্রিক: ক্যাগলের সেশন ১২ ঘণ্টা পর পর টাইমআউট হয়ে বন্ধ হয়ে যায়। এটি স্থায়ী করতে হাগিং ফেস স্পেসে একটি ফ্রি অ্যাকাউন্ট খুলে সেখানে ডকার মেকানিজম বা পিওর পাইথন স্ক্রিপ্ট দিয়ে আপলোড করে দিন। এতে আপনার এপিআই স্থায়ী ব্যাকগ্রাউন্ড সার্ভার হিসেবে থেকে যাবে এবং সিঙ্গেল পেজ অ্যাপে চমৎকার পারফর্ম করবে।