Zach Anderson
২৭ ফেব্রুয়ারি, ২০২৬ ১৬:৫৮
নতুন ইন্টিগ্রেশন Ray Data-র ডিস্ট্রিবিউটেড প্রসেসিং এর সাথে Docling-এর ডকুমেন্ট পার্সিং একত্রিত করে RAG অ্যাপ্লিকেশনের জন্য ১০k+ জটিল ফাইল দিনের পরিবর্তে ঘণ্টায় প্রসেস করে।
AI অ্যাপ্লিকেশন তৈরি করা এন্টারপ্রাইজ টিমগুলি তাদের সবচেয়ে হতাশাজনক বাধার সমাধান পেয়েছে। Anyscale বিস্তারিতভাবে জানিয়েছে কীভাবে Ray Data এর সাথে Docling একত্রিত করে সপ্তাহব্যাপী ডকুমেন্ট প্রসেসিংকে ঘণ্টায় রূপান্তরিত করতে পারে—একটি উন্নয়ন যা বিশাল ডকুমেন্ট আর্কাইভে বসে থাকা কোম্পানিগুলির জন্য ডিপ্লয়মেন্ট টাইমলাইন ত্বরান্বিত করতে পারে।
প্রযুক্তিগত ইন্টিগ্রেশন Retrieval-Augmented Generation সিস্টেমে অভ্যন্তরীণ ব্যক্তিরা যাকে "ডেটা বটলনেক" বলে তা সমাধান করে। যদিও ডেমো জেনারেটিভ AI-কে সহজ দেখায়, বাস্তবতায় হাজার হাজার লিগ্যাসি PDF, জটিল টেবিল এবং এম্বেডেড ইমেজের সাথে লড়াই করা জড়িত যা ঐতিহ্যবাহী প্রসেসিং টুলগুলি খারাপভাবে হ্যান্ডেল করে।
আসলে কী পরিবর্তন হয়
Ray Data-র স্ট্রিমিং এক্সিকিউশন ইঞ্জিন একযোগে CPU এবং GPU টাস্ক জুড়ে ডেটা পাইপলাইন করে। Python-নেটিভ আর্কিটেকচার সিরিয়ালাইজেশন ওভারহেড দূর করে যা ভাষা পরিবেশের মধ্যে ডেটা অনুবাদ করার সময় অন্যান্য ফ্রেমওয়ার্ককে জর্জরিত করে। ব্যাচ ইনফারেন্স বা বিশাল ডেটাসেট প্রিপ্রসেসিং চালানো টিমগুলির জন্য, এর অর্থ দ্রুত পুনরাবৃত্তি চক্র।
Docling পার্সিং জটিলতা পরিচালনা করে যা বেশিরভাগ ঐতিহ্যবাহী টুলগুলিকে ভেঙে ফেলে—সিম্যান্টিক কাঠামো সংরক্ষণ করার সময় সঠিকভাবে টেবিল এবং লেআউট এক্সট্র্যাক্ট করে। Ray Data-র সাথে ইন্টিগ্রেট হলে, প্রতিটি ওয়ার্কার নোড মেমরিতে এম্বেডেড AI মডেলসহ একটি Docling ইনস্ট্যান্স চালায়, স্কেলে সমান্তরাল ডকুমেন্ট প্রসেসিং সক্ষম করে।
আর্কিটেকচার এভাবে কাজ করে: একটি Ray Data Driver এক্সিকিউশন পরিচালনা করে এবং বিতরণের জন্য টাস্ক কোড সিরিয়ালাইজ করে। ওয়ার্কাররা সরাসরি স্টোরেজ থেকে ডেটা ব্লক পড়ে এবং প্রসেস করা JSON ফাইলগুলি গন্তব্যে লেখে। ড্রাইভার কখনও বটলনেক হয়ে ওঠে না কারণ এটি প্রকৃত ডেটা থ্রুপুট হ্যান্ডেল করছে না।
Kubernetes ফাউন্ডেশন
KubeRay Kubernetes-এ Ray ক্লাস্টার অর্কেস্ট্রেট করে, স্বচ্ছভাবে ১০ থেকে ১০০ নোড পর্যন্ত ডায়নামিক অটোস্কেলিং পরিচালনা করে। সিস্টেমে স্বয়ংক্রিয় পুনরুদ্ধার অন্তর্ভুক্ত রয়েছে যখন ওয়ার্কার নোড ব্যর্থ হয়—বড় ইনজেশন কাজের জন্য গুরুত্বপূর্ণ যা স্ক্র্যাচ থেকে পুনরায় শুরু করার সামর্থ্য রাখে না।
এন্ড-টু-এন্ড ফ্লো অবজেক্ট স্টোরেজ থেকে পার্সিং এবং চাঙ্কিংয়ের মাধ্যমে ডকুমেন্ট সরায়, GPU নোডে এম্বেডিং তৈরি করে এবং Milvus-এর মতো ভেক্টর ডেটাবেসে লেখে। RAG অ্যাপ্লিকেশনগুলি তারপর LLM-কে প্রসঙ্গ ফিড করতে ডেটাবেস কোয়েরি করে।
Pinterest, DoorDash, এবং Instacart সহ কোম্পানিগুলি ইতিমধ্যে লাস্ট-মাইল প্রসেসিং এবং মডেল ট্রেনিংয়ের জন্য Ray Data ব্যবহার করে, যা পরামর্শ দেয় যে প্রযুক্তি উৎপাদন কার্যকারিতা প্রমাণিত করেছে।
সাধারণ অনুসন্ধানের বাইরে
এখানে বৃহত্তর খেলা এজেন্টিক AI ওয়ার্কফ্লো লক্ষ্য করে যেখানে স্বায়ত্তশাসিত এজেন্টরা বহু-পদক্ষেপ টাস্ক সম্পাদন করে। প্রসেস করা ডেটার গুণমান আরও গুরুত্বপূর্ণ হয়ে ওঠে কারণ এজেন্টরা ব্যবহারকারীদের পক্ষে কাজ করতে সুনির্দিষ্ট ডকুমেন্টেশনের উপর নির্ভর করে। স্কেলযোগ্য আর্কিটেকচার তৈরি করা সংস্থাগুলি এখন একাধিক ক্রমিক LLM কল সহ উন্নত ইনফারেন্স চেইনের জন্য নিজেদের অবস্থান করছে।
Red Hat OpenShift AI এবং Anyscale প্ল্যাটফর্ম এন্টারপ্রাইজ গভর্নেন্স প্রয়োজনীয়তার সাথে ডিপ্লয়মেন্ট অপশন প্রদান করে। ওপেন-সোর্স ফাউন্ডেশন মানে টিমগুলি বড় প্রকিউরমেন্ট বাধা ছাড়াই পরীক্ষা শুরু করতে পারে।
বর্তমানে মডেল টিউনিংয়ের চেয়ে ডেটা প্রস্তুতিতে বেশি সময় ব্যয় করা AI টিমগুলির জন্য, এই ইন্টিগ্রেশন একটি ব্যবহারিক পথ এগিয়ে দেয়। প্রশ্ন নয় যে ডিস্ট্রিবিউটেড ডকুমেন্ট প্রসেসিং গুরুত্বপূর্ণ কিনা—এটি হল আপনার অবকাঠামো পরবর্তীতে যা আসবে তা সামলাতে পারবে কিনা।
ছবির উৎস: Shutterstock
সূত্র: https://blockchain.news/news/ray-data-docling-enterprise-ai-document-processing

