ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং
'ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং' জিনিসটা কি? কেন 'ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং' শিখবেন?
ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং' জিনিসটা কি?
যন্ত্রকে ক্ষমতা দেয়া

Natural Language Processing or NLP is a field of Artificial Intelligence that gives machines the ability to read, understand and derive meaning from human languages.

কৃত্রিম বুদ্ধিমত্তার যে অংশটুকু যন্ত্রকে মানুষের মত করে মানুষের ভাষা ব্যবহার করার ক্ষমতা দেয় সেটাকে 'ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং টুল' বলতে পারি। এই টেকনিক ব্যবহার করে ভাষার ভেতরের ‘লিঙ্গুইস্টিকস’ অর্থাৎ ‘ভাষাতত্ত্ব’ জ্ঞান সহ অথবা ছাড়াই একটা অ্যাপ্লিকেশন বিভিন্ন স্ট্যাটিসটিক্যাল মডেল ব্যবহার করে বাস্তবসম্মত সমস্যাগুলোকে সমাধান করতে পারে। এই মানুষের ভাষাকে বুঝতে, জানতে, শিখতে, লিখতে, পড়তে ইত্যাদি করার জন্য যত ধরনের টুল ব্যবহার করা হয় সেগুলোকে ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিংয়ের সহায়ক টুল বলতে পারি।

একটা আক্ষরিক শব্দকে বুঝতে সেই শব্দের ভেতরে যে ট্রানসফর্মেশন প্রয়োজন সেটাকে আমরা ‘কম্পিউটেশনাল রিপ্রেজেন্টেশন’ বলতে পারি। আবার, এই শব্দের ‘রিপ্রেজেন্টেশন’কে ঠিকমতো বুঝতে, বিশেষ করে ডাটা থেকে শেখার জন্য প্রয়োজন ‘মেশিন লার্নিং’। যন্ত্রকে মানুষের ভাষা বুঝতে শুরু থেকে শেষ পর্যন্ত অনেকগুলো ট্রান্সফরমেশনের মধ্য দিয়ে যেতে হয় সেগুলোর আলাপ করবো রাস্তায় নামলে। সামনে টোকেনাইজেশন, ভেক্টর, এমবেডিং ইত্যাদি ইত্যাদি টার্মগুলো নিয়ে হাতেকলমে দেখবো।

কেন 'ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং' শিখবেন?
‘ওকে গুগল’, ‘সিরি’, ‘অ্যালেক্সা’, ‘গুগল ট্রান্সলেট’ ধরনের প্রোডাক্টগুলো এখন ব্যবহার হচ্ছে আমাদের বাসায় এবং অফিসে। আমাদের পরবর্তী প্রজন্ম ডেক্সটপ কম্পিউটারের সামনে বসলেও গুগল সার্চ করে ‘ওয়েব’ ব্রাউজারের মাইক্রোফোনে চাপ দিয়ে। ‘ওকে গুগল’, ‘সিরি’, ‘অ্যালেক্সা’ দিয়ে চালাতে পারেন বাসার অফিসের লাইট, ফ্যান, টিভি, গ্যারেজ খোলার মতো হাজারো অ্যাপ্লিকেশন। গুগল সার্চ করার সময় সেই শব্দকে মিলিয়ে আর কোন কোন বাক্য সার্চ করা হয়েছে সেই প্রেডিকশন সময় কমিয়ে নিয়ে আসছে আমাদের সার্চে। এই সবগুলো প্রোডাক্ট এর পেছনে কাজ করছে ‘ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং’।

৪১ বিলিয়ন ডলারের বাজার

The global Natural Language Processing (NLP) market size is expected to surpass USD 41 billion by 2025, at a CAGR of ~23%. This is owing to the growing demand for analyzing the data generated from conversations, social media, and other sources to enhance the customer experience.

-- Adroit Market Research

বাংলায় 'ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং' নিয়ে ইংরেজির মতো সেরকম রিসোর্স না থাকলেও সেটা তৈরি করতে হবে আমাদেরই। আর, সেটা থেকে প্রচুর অ্যাপ্লিকেশন অপেক্ষা করছে সামনেই। বাংলায় আইনি সাহায্য নিয়ে প্রচুর কাজ পড়ে আছে সামনে। একটা বড় বাজার অপেক্ষা করছে, সেটার জন্য তৈরি হতে হবে আমাদের। ইংরেজি বাংলা যাই হোক, ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং ঢুকে যাচ্ছে সব জায়গায়। আমি চাইছি, বাংলায় প্রচুর ডাটাসেট আসুক আপনাদের হাত ধরে। তাহলেই বাংলা হবে আসল 'প্রযুক্তির ভাষা', যখন সেটার ব্যবহার হবে সব মাত্রায়।

'ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং' শেখার পেছনে কয়েকটা ট্রেন্ডের কথা বলা যেতে পারে। প্রথমত: বর্তমানে এই ইন্টারনেটের যুগে আমরা নিজেরাই জেনারেট করছি প্রচুর ডাটা প্রতিমুহূর্তে। সঙ্গে থাকা প্রতিটা ডিভাইস প্রতি সেকেন্ডে এত লগ জেনারেট করছে, এখন এগুলোই আমাদের জন্য ট্রেনিং ডেটা। ডেটার পাশাপাশি প্রচুর ডেটা স্টোর করার ডিভাইসগুলোর দাম কমছে লাফিয়ে লাফিয়ে। আমরা নিজেদের চোখেই দেখছি, অসাধারণ প্রসেসিং স্পিড এবং ডেটাকে প্রসেস করার জন্য ‘স্পেশালাইজড’ প্রসেসর দিয়ে ভর্তি আমাদের কাজের পরিবেশ। এই মুহূর্তে ডাটার এতো ক্ষমতা থেকে এই সুবিধাগুলো না নিতে পারলে ভবিষ্যতে আমরা পিছিয়ে পড়বো আরও।

‘ম্যাথমেটিক্স’ অথবা ‘লিনিয়ার অ্যালজেবরা’ নিয়ে আমাদের কিছুটা ধারনা থাকলেও আমরা চেষ্টা করব - ‘ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং’ ব্যাপারটা হাতে-কলমে দেখার জন্য। আমার গত চারটা বই লেখার অভিজ্ঞতা থেকে এটা বলতে পারি, আমরা যখন কোন জিনিস চোখের সামনে হতে দেখি এবং এর ভেতরে ট্রানসফর্মেশনে কি কি ঘটছে সেটা যদি স্টেপ বাই স্টেপ বুঝতে পারি তাহলে পুরো ব্যাপারটাই সহজ হয়ে যায় আমাদের জন্য।

শুরুতেই বলে নিচ্ছি - এ ব্যাপারে আপনাদের 'আর্টিফিশিয়াল ইন্টেলিজেন্ট' এক্সপার্ট অথবা 'ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং'য়ে বোদ্ধা হবার প্রয়োজন নেই। আমি আপনাদের গাইড এই পুরো রাস্তায়। পুরো ব্যাপারটাকে ঠিকমতো 'কন্টেক্সটচুয়ালাইজেশন' লেভেলে আনতে সাহায্য নিয়েছি গুগলের। বিশেষ করে লরেন্স মরোনির কোর্সেরার কোর্স এবং আরোও অনেকের (কৃতজ্ঞতা দেখুন) কাছ থেকে। এখন কোলাবোরেশনের যুগ। সেটার একটা ভালো ধারণা পাবেন রাস্তায় নামলে।
***
#চলুন, যন্ত্রের সাথে কথা বলি বাংলায়!
ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং
SOAEB ABDULLAH
13 December, 2021
Share this post
Archive
Sign in to leave a comment


কম্পিউটারের কিবোর্ড এর কিছু শটকার্ট | কাজ করুন আরও দ্রুত।
কম্পিউটারের কিবোর্ড এর কিছু শটকার্ট