গভীর শিক্ষার সবচেয়ে গুরুত্বপূর্ণ সমস্যা কিsteemCreated with Sketch.

images (5).jpeg

ডিপ লার্নিং কি?

কৃত্রিম নিউরাল নেটওয়ার্ক বা ANN হল মেশিন লার্নিং মডেল যা মানুষের মস্তিষ্কের কার্যকারিতা অনুকরণ করার চেষ্টা করে, যার গঠন তাদের মধ্যে সংযুক্ত প্রচুর সংখ্যক নিউরন থেকে তৈরি হয় — তাই নাম "কৃত্রিম নিউরাল নেটওয়ার্ক"।

গভীর শিক্ষা, আপনি নাম দ্বারা অনুমান করতে পারেন, আমরা নিউরাল নেটওয়ার্কে যে ডেটা দিয়ে থাকি তা থেকে ক্রমান্বয়ে উচ্চ স্তরের বৈশিষ্ট্যগুলি বের করতে নিউরনের অনেক স্তরের ব্যবহার। এটা যে হিসাবে একটি সহজ; আমাদের নিউরাল মডেলের কর্মক্ষমতা বাড়াতে একাধিক লুকানো স্তরের ব্যবহার।

এই সিস্টেমগুলিই এবং অন্যরা নয় যে কাজগুলিতে সবচেয়ে দক্ষ ফলাফল অর্জন করেছে যেগুলি ডিপ লার্নিংয়ের আগে কেবলমাত্র মানুষের দ্বারা মোকাবেলা করা যেতে পারে, যেমন কম্পিউটার ভিশন (ছবিতে বস্তু, নিদর্শন এবং আরও অনেক কিছু সনাক্ত করতে সক্ষম হওয়া) বা প্রাকৃতিক ভাষা প্রক্রিয়াকরণ বা NLP (পাঠ্য এবং প্রাকৃতিক ভাষা বোঝা এবং তৈরি করা)।

যাইহোক, ডিপ লার্নিং এবং কৃত্রিম নিউরাল নেটওয়ার্কগুলিকে এখনও তাদের মানব সমকক্ষের সক্ষমতায় পৌঁছানো পর্যন্ত দীর্ঘ পথ পাড়ি দিতে হবে, এবং এটিই কাগজে আলোচনা করা হয়েছে। গভীর শিক্ষার চ্যালেঞ্জ

ঠিক আছে, এখন যেহেতু আমরা জানি ডিপ লার্নিং কী (যদিও আমার ধারণা আপনি যদি এটি পড়ে থাকেন তবে আপনি ইতিমধ্যেই জানেন), আসুন এটির মুখোমুখি কিছু প্রধান চ্যালেঞ্জ দেখা যাক:

তত্ত্বাবধান ছাড়াই শেখা
ডিপ লার্নিং মডেলগুলি মেশিন লার্নিং বিশ্বের সবচেয়ে ডেটা-হাংরি মডেলগুলির মধ্যে একটি। তাদের সর্বোত্তম পারফরম্যান্সে পৌঁছানোর জন্য তাদের বিপুল পরিমাণ ডেটার প্রয়োজন এবং আমরা তাদের কাছ থেকে আশা করা শ্রেষ্ঠত্বের সাথে আমাদের পরিবেশন করি।

যাইহোক, এত ডেটা থাকা সবসময় সহজ নয়। অতিরিক্তভাবে, যদিও আমাদের কাছে কিছু বিষয়ে প্রচুর পরিমাণে ডেটা থাকতে পারে, অনেক সময় এটিকে লেবেল করা হয় না তাই আমরা এটিকে কোনো ধরনের তত্ত্বাবধানে শেখার অ্যালগরিদম প্রশিক্ষণের জন্য ব্যবহার করতে পারি না।

এটি থেকে প্রাপ্ত ডিপ লার্নিং এর প্রধান চ্যালেঞ্জগুলির মধ্যে একটি হল অনেক কম প্রশিক্ষণ ডেটা সহ দুর্দান্ত পারফরম্যান্স সরবরাহ করতে সক্ষম হওয়া। যেমনটি আমরা পরে দেখব, সাম্প্রতিক অগ্রগতি যেমন স্থানান্তর শিক্ষা বা আধা-তত্ত্বাবধানে শেখা ইতিমধ্যেই এই দিকে পদক্ষেপ নিচ্ছে, কিন্তু এখনও তা যথেষ্ট নয়।

প্রশিক্ষণ বিতরণের বাইরে থেকে ডেটা মোকাবেলা করা
ডেটা গতিশীল, এটি বিভিন্ন ড্রাইভার যেমন সময়, অবস্থান এবং অন্যান্য অনেক অবস্থার মাধ্যমে পরিবর্তিত হয়।

যাইহোক, ডিপ লার্নিং সহ মেশিন লার্নিং মডেলগুলি ডেটার একটি সংজ্ঞায়িত সেট (প্রশিক্ষণ সেট) ব্যবহার করে তৈরি করা হয় এবং যতক্ষণ না সিস্টেমটি তৈরি হওয়ার পরে ভবিষ্যদ্বাণী করতে ব্যবহৃত ডেটাগুলি একই বিতরণ থেকে আসে ততক্ষণ পর্যন্ত ভাল কাজ করে। সিস্টেমটি যে ডেটা দিয়ে তৈরি করা হয়েছিল।

এটি তাদের খারাপ কার্য সম্পাদন করে যখন ডেটা সম্পূর্ণ আলাদা নয়, তবে প্রশিক্ষণের ডেটা থেকে কিছু বৈচিত্র্য রয়েছে যা তাদের দেওয়া হয়। ভবিষ্যতে ডিপ লার্নিং-এর আরেকটি চ্যালেঞ্জ হবে এই সমস্যাটি কাটিয়ে ওঠা এবং যখন প্রশিক্ষণের ডেটার সাথে ঠিক মেলে না এমন ডেটা তাদের খাওয়ানো হয় তখনও যুক্তিসঙ্গতভাবে ভাল কাজ করে।

লজিক অন্তর্ভুক্ত করা
কিছু ধরণের নিয়ম ভিত্তিক জ্ঞান অন্তর্ভুক্ত করা, যাতে যৌক্তিক পদ্ধতিগুলি প্রয়োগ করা যায় এবং জ্ঞানকে আনুষ্ঠানিক করার জন্য ক্রমিক যুক্তি ব্যবহার করা হয়।

যদিও এই কেসগুলি কোডে কভার করা যেতে পারে, মেশিন লার্নিং অ্যালগরিদমগুলি সাধারণত তাদের জ্ঞানের মধ্যে সেট বা নিয়মগুলিকে অন্তর্ভুক্ত করে না। বায়েসিয়ান লার্নিং-এ ব্যবহৃত পূর্বের ডেটা বিতরণের মতো, পূর্ব-নির্ধারিত নিয়মগুলির সেটগুলি ডিপ লার্নিং সিস্টেমগুলিকে তাদের যুক্তিতে সহায়তা করতে পারে এবং 'ডেটা থেকে শেখার' ভিত্তিক পদ্ধতির পাশাপাশি লাইভ করতে পারে।

কম ডেটা এবং উচ্চ দক্ষতার প্রয়োজন
যদিও আমরা আমাদের প্রথম দুটি বিভাগে এটিকে কভার করেছি, এই পয়েন্টটি সত্যিই হাইলাইট করার মতো।

ডিপ লার্নিং-এর সাফল্য আমাদের মডেলগুলিতে অনেকগুলি স্তরকে অন্তর্ভুক্ত করার সম্ভাবনা থেকে আসে, যা তাদেরকে রৈখিক এবং নন-লিনিয়ার প্যারামিটার সংমিশ্রণের একটি উন্মাদ সংখ্যক চেষ্টা করার অনুমতি দেয়। যাইহোক, আরও স্তরের সাথে আরও মডেল জটিলতা আসে এবং এই মডেলটি সঠিকভাবে কাজ করার জন্য আমাদের আরও ডেটা প্রয়োজন।
![