অনুভূতিপূর্ণ এজেন্টের জন্য একটি আরজিবি-এলইডি-ভিত্তিক আবেগ প্রদর্শনের মূল্যায়ন

1. ভূমিকা ও সংক্ষিপ্ত বিবরণ

এই গবেষণাপত্রটি অনুভূতিপূর্ণ এজেন্ট ও রোবটে কৃত্রিম আবেগ প্রকাশের জন্য একটি কম-খরচ ও সরলীকৃত মাধ্যম হিসেবে কম-রেজোলিউশন আরজিবি-এলইডি ডিসপ্লের ব্যবহার অনুসন্ধান করে। মূল অনুমান হলো যে নির্দিষ্ট রং ও গতিশীল আলোর প্যাটার্ন মানুষের মৌলিক আবেগ—আনন্দ, রাগ, দুঃখ ও ভয়—এর সাথে সংযোগ তৈরি করতে পারে, যার ফলে মানুষ-রোবট মিথস্ক্রিয়ায় (এইচআরআই) অ-মৌখিক আবেগগত যোগাযোগ সহজতর হয়। এই কাজটি আবেগগত কম্পিউটিং-এর বৃহত্তর ক্ষেত্রের মধ্যে অবস্থিত, যার লক্ষ্য মিথস্ক্রিয়াগুলোকে আরও স্বজ্ঞাত ও আবেগগতভাবে অনুরণিত করে প্রযুক্তি গ্রহণযোগ্যতা বৃদ্ধি করা।

এই গবেষণা জটিল ও ব্যয়বহুল অ্যানড্রয়েড অভিব্যক্তি এবং চেহারা-সীমাবদ্ধ রোবটগুলোর জন্য সরল, বাস্তবায়নযোগ্য সমাধানের প্রয়োজনীয়তার মধ্যকার ফাঁক মোকাবেলা করে। একটি ব্যবহারকারী গবেষণার মাধ্যমে প্রস্তাবিত আলোর প্যাটার্ন যাচাই করে, এই পত্রটি এই পদ্ধতির কার্যকারিতার জন্য অভিজ্ঞতামূলক প্রমাণ সরবরাহ করে।

2. পদ্ধতি ও সিস্টেম ডিজাইন

সিস্টেমটি মুখের বৈশিষ্ট্যের বিকল্প হিসেবে কম-রেজোলিউশন হিসাবে ডিজাইন করা একটি কাস্টম-নির্মিত আরজিবি-এলইডি ডিসপ্লেকে কেন্দ্র করে।

2.1 আরজিবি-এলইডি ডিসপ্লে কনফিগারেশন

ডিসপ্লেটি আরজিবি এলইডির একটি ম্যাট্রিক্স নিয়ে গঠিত। মূল পরামিতিগুলোর মধ্যে রয়েছে:

রেজোলিউশন: কম-সংখ্যক ম্যাট্রিক্স (যেমন, ৮x৮ বা অনুরূপ), যেখানে বিস্তারিতের চেয়ে প্যাটার্নের স্বচ্ছতাকে অগ্রাধিকার দেওয়া হয়।
নিয়ন্ত্রণ: মাইক্রোকন্ট্রোলার-চালিত, যা হিউ, স্যাচুরেশন, ব্রাইটনেস (এইচএসভি/এইচএসএল কালার স্পেস) এবং সময়গত গতিবিদ্যার উপর সুনির্দিষ্ট নিয়ন্ত্রণ অনুমোদন করে।
ফর্ম ফ্যাক্টর: প্রচলিত মুখাবয়ববিহীন রোবটে সংহত করার জন্য ডিজাইন করা হয়েছে।

2.2 আবেগ-থেকে-আলো ম্যাপিং

কালার সাইকোলজি ও এইচআরআই-এর পূর্ববর্তী গবেষণার (যেমন, [১১]) ভিত্তিতে, একটি মৌলিক ম্যাপিং প্রতিষ্ঠিত হয়েছিল:

আনন্দ/খুশি: উষ্ণ রং (হলুদ, কমলা)। উচ্চ ব্রাইটনেস, স্থির বা মৃদুভাবে স্পন্দিত আলো।
রাগ: উষ্ণ রং (লাল, গাঢ় কমলা)। উচ্চ তীব্রতা, দ্রুত ফ্ল্যাশিং বা স্পন্দিত প্যাটার্ন।
দুঃখ: শীতল রং (নীল, সায়ান)। কম ব্রাইটনেস, ধীরে ধীরে ম্লান হওয়া বা মৃদু স্পন্দন।
ভয়/উদ্বেগ: শীতল বা নিরপেক্ষ রং (নীল, সাদা, বেগুনি)। অনিয়মিত, দ্রুত জ্বলুনি বা ঝিকিমিকি প্যাটার্ন।

2.3 গতিশীল প্যাটার্ন জেনারেশন

স্থির রঙের বাইরে, গতিশীল প্যাটার্ন (ওয়েভফর্ম) অত্যন্ত গুরুত্বপূর্ণ। এই গবেষণাপত্রটি নিম্নলিখিত পরামিতিগুলো অন্বেষণ করে:

ফ্রিকোয়েন্সি: প্যাটার্ন পুনরাবৃত্তির গতি (যেমন, হার্টজ)।
ওয়েভফর্ম: সময়ের সাথে ব্রাইটনেস মড্যুলেশনের আকৃতি (সাইনুসয়েডাল, আয়তক্ষেত্রাকার, করাত-দাঁত)।
অ্যামপ্লিচিউড: ব্রাইটনেস পরিবর্তনের পরিসীমা।

উদাহরণস্বরূপ, রাগের জন্য একটি উচ্চ-ফ্রিকোয়েন্সির আয়তক্ষেত্রাকার তরঙ্গ ($f_{anger} > 5Hz$) ব্যবহার করা হতে পারে, অন্যদিকে দুঃখের জন্য একটি নিম্ন-ফ্রিকোয়েন্সির সাইন তরঙ্গ ($f_{sadness} < 1Hz$) ব্যবহৃত হয়।

3. পরীক্ষামূলক নকশা ও যাচাইকরণ

এলইডি প্যাটার্ন থেকে আবেগের স্বীকৃতি যাচাই করার জন্য একটি ব্যবহারকারী গবেষণা পরিচালিত হয়েছিল।

3.1 অংশগ্রহণকারীদের জনসংখ্যাগত বৈশিষ্ট্য

গবেষণায় N সংখ্যক অংশগ্রহণকারী জড়িত ছিল, যাদের একটি বিশ্ববিদ্যালয় পরিবেশ থেকে নিয়োগ দেওয়া হয়েছিল, সাধারণীকরণ মূল্যায়নের জন্য প্রযুক্তিগত ও অ-প্রযুক্তিগত পটভূমির মিশ্রণ সহ।

3.2 পদ্ধতি ও মেট্রিক্স

অংশগ্রহণকারীদের এলইডি প্যাটার্নের ক্রম দেখানো হয়েছিল, যার প্রতিটি চারটি লক্ষ্য আবেগের মধ্যে একটি উপস্থাপন করে, এলোমেলো ক্রমে। প্রতিটি প্রদর্শনের পরে, তাদের একটি বদ্ধ তালিকা থেকে প্রকাশিত আবেগ চিহ্নিত করতে বলা হয়েছিল (ফোর্সড-চয়েস)। প্রাথমিক মেট্রিক্সের মধ্যে অন্তর্ভুক্ত ছিল:

স্বীকৃতির নির্ভুলতা: প্রতি আবেগের জন্য সঠিক শনাক্তকরণের শতাংশ।
কনফিউশন ম্যাট্রিক্স: কোন আবেগগুলি প্রায়শই বিভ্রান্ত হয়েছিল তার বিশ্লেষণ।
ব্যক্তিগত প্রতিক্রিয়া: প্যাটার্নগুলোর স্বজ্ঞাততা সম্পর্কে গুণগত তথ্য।

4. ফলাফল ও বিশ্লেষণ

4.1 স্বীকৃতির নির্ভুলতা

ফলাফলগুলি আবেগ জুড়ে সাফল্যের বিভিন্ন স্তর নির্দেশ করে। প্রাথমিক তথ্য পরামর্শ দেয়:

উচ্চ স্বীকৃতি (>৭০%): আনন্দ ও রাগ প্রায়শই সঠিকভাবে শনাক্ত করা হয়েছিল, সম্ভবত উচ্চ উত্তেজনা অবস্থার সাথে উষ্ণ রঙের শক্তিশালী সাংস্কৃতিক ও মনস্তাত্ত্বিক সংযোগের কারণে।
মাঝারি স্বীকৃতি (৫০-৭০%): দুঃখ মাঝারি স্বীকৃতি দেখিয়েছে, সম্ভবত একটি নিরপেক্ষ বা "ঘুমন্ত" অবস্থার সাথে বিভ্রান্ত হতে পারে।
নিম্ন স্বীকৃতি (<৫০%): ভয় সবচেয়ে চ্যালেঞ্জিং প্রমাণিত হয়েছে, যেখানে প্যাটার্নগুলি প্রায়শই রাগ বা দুঃখের মতো অন্যান্য নেতিবাচক আবেগ হিসাবে ভুল শনাক্ত করা হয়, যা শীতল-রঙের গতিশীল প্যাটার্নের অস্পষ্টতা তুলে ধরে।

চার্ট বর্ণনা (কল্পিত): একটি বার চার্টে y-অক্ষে স্বীকৃতির নির্ভুলতা (০-১০০%) এবং x-অক্ষে চারটি আবেগের প্রতিটির জন্য দেখানো হবে। আনন্দ ও রাগের বারগুলি সবচেয়ে লম্বা হবে, দুঃখ মাঝারি এবং ভয় সবচেয়ে ছোট হবে। একটি লাইন ওভারলে আত্মবিশ্বাসের ব্যবধান নির্দেশ করতে পারে।

4.2 পরিসংখ্যানগত তাৎপর্য

পরিসংখ্যানগত পরীক্ষা (যেমন, চি-স্কয়ার) নিশ্চিত করেছে যে আনন্দ ও রাগের স্বীকৃতির হার সম্ভাব্য স্তরের (৪-পছন্দের কাজের জন্য ২৫%) থেকে উল্লেখযোগ্যভাবে বেশি ছিল, অন্যদিকে ভয়ের স্বীকৃতি পরিসংখ্যানগতভাবে সম্ভাব্য স্তর থেকে আলাদা করা যায়নি। এটি ভয়ের মতো জটিল আবেগের জন্য পরিশোধিত প্যাটার্ন ডিজাইনের প্রয়োজনীয়তার উপর জোর দেয়।

5. প্রযুক্তিগত বিবরণ ও গাণিতিক কাঠামো

আবেগগত অবস্থা $E$ কে আলোর আউটপুট পরামিতিকে প্রভাবিতকারী একটি ভেক্টর হিসাবে মডেল করা যেতে পারে। একটি প্রদত্ত আবেগ $e_i$ এর জন্য, সময় $t$ এ ডিসপ্লে অবস্থা $L(t)$ সংজ্ঞায়িত করা হয়:

$L(t) = [H(e_i), S(e_i), V(e_i, t), f(e_i), w(e_i, t)]$

যেখানে:

$H$: হিউ (প্রধান তরঙ্গদৈর্ঘ্য, কালার সাইকোলজি থেকে ম্যাপ করা)।
$S$: স্যাচুরেশন (রঙের বিশুদ্ধতা, যেমন, তীব্র আবেগের জন্য উচ্চ)।
$V$: মান/ব্রাইটনেস, সময় ও আবেগের একটি ফাংশন: $V(t) = A(e_i) \cdot w(2\pi f(e_i) t) + V_{base}(e_i)$। $A$ হল অ্যামপ্লিচিউড, $w$ হল ওয়েভফর্ম ফাংশন (সাইন, বর্গ), $f$ হল ফ্রিকোয়েন্সি।
$f$: প্যাটার্নের সময়গত ফ্রিকোয়েন্সি।
$w$: ওয়েভফর্ম ফাংশন যা সময়ের সাথে প্যাটার্নের আকৃতি সংজ্ঞায়িত করে।

উদাহরণস্বরূপ, রাগ ($e_a$) কে নিম্নরূপ প্যারামিটারাইজ করা যেতে পারে: $H_{a} \approx 0\text{° (লাল)}, S_{a} \approx 1.0, V_{a}(t) = 0.8 \cdot \text{square}(2\pi \cdot 5 \cdot t) + 0.2, f_{a}=5\text{Hz}$।

6. মূল অন্তর্দৃষ্টি ও বিশ্লেষকের দৃষ্টিভঙ্গি

মূল অন্তর্দৃষ্টি: এই গবেষণাপত্রটি একটি ভালো আবেগগত মুখ তৈরি করার বিষয়ে নয়; এটি "মুখহীন" রোবট অর্থনীতির জন্য একটি ব্যবহারিক হ্যাক। এটি প্রস্তাব করে যে গণবাজার, খরচ-সংবেদনশীল রোবটগুলোর জন্য (গুদাম রোবট, সরল গৃহ সহকারী), একটি $৫ এলইডি গ্রিড আনন্দ ও রাগের মতো মৌলিক অবস্থার জন্য একটি $৫০,০০০ অ্যানড্রয়েড মুখের আবেগগত স্বীকৃতিযোগ্যতার ৭০% অর্জন করতে পারে। প্রকৃত মূল্য প্রস্তাব হল ডলার প্রতি আবেগগত ব্যান্ডউইথ।

যুক্তিগত প্রবাহ: যুক্তিটি পরিষ্কার ও শিল্পভিত্তিক: ১) জটিল মুখাবয়ব ব্যয়বহুল ও গণনাগতভাবে ভারী (জেমিনয়েড, কোবিয়ান উদ্ধৃত)। ২) অ-মৌখিক সংকেত এইচআরআই গ্রহণযোগ্যতার জন্য গুরুত্বপূর্ণ। ৩) আলো সস্তা, প্রোগ্রামযোগ্য এবং সর্বজনীনভাবে উপলব্ধিযোগ্য। ৪) আসুন মৌলিক আবেগগুলিকে সরলতম আলোর পরামিতিতে (রঙ, জ্বলুনি) ম্যাপ করি। ৫) পরীক্ষা করুন এটি কাজ করে কিনা। প্রবাহটি মনস্তাত্ত্বিক গভীরতার চেয়ে কম এবং আবেগগত অভিব্যক্তিতে একটি সর্বনিম্ন কার্যকরী পণ্যের (এমভিপি) জন্য প্রকৌশল যাচাইকরণ সম্পর্কে বেশি।

শক্তি ও ত্রুটি: এর শক্তি হল এর নির্মম ব্যবহারিকতা এবং উচ্চ-উত্তেজনা আবেগের জন্য স্পষ্ট পরীক্ষামূলক যাচাই। এটি রোবট ডিজাইনারদের জন্য একটি ব্যবহারযোগ্য স্পেসিফিকেশন সরবরাহ করে। ত্রুটিটি, যা লেখকরা স্বীকার করেছেন, তা হল অগভীর আবেগগত প্যালেট। ভয়ের ব্যর্থতা তাৎপর্যপূর্ণ—এটি শব্দার্থিক প্রসঙ্গ ছাড়া একটি সম্পূর্ণরূপে সিনট্যাকটিক পদ্ধতির (রঙ + জ্বলুনির গতি) সীমাবদ্ধতা প্রকাশ করে। পিকার্ডের (১৯৯৭) মৌলিক আবেগগত কম্পিউটিং কাজে উল্লিখিত হিসাবে, প্রকৃত আবেগগত যোগাযোগের প্রায়শই মূল্যায়ন ও প্রসঙ্গের প্রয়োজন হয়, যা একটি আলোর স্ট্রিপের অভাব রয়েছে। সাইকেলজিএএন গবেষণাপত্রে (ঝু এট আল., ২০১৭) আলোচিত স্টাইল ট্রান্সফারের জন্য অভিব্যক্তির আরও পরিশীলিত, জেনারেটিভ মডেলের তুলনায়, এই পদ্ধতিটি নির্ধারক এবং অভিযোজনযোগ্যতার অভাব রয়েছে।

কার্যকরী অন্তর্দৃষ্টি: পণ্য ব্যবস্থাপকদের জন্য: অ-সামাজিক রোবটগুলিতে মৌলিক অবস্থা সংকেতের জন্য এটি অবিলম্বে বাস্তবায়ন করুন (কাজ সম্পন্ন = খুশি সবুজ স্পন্দন, ত্রুটি = রাগ লাল ফ্ল্যাশ)। গবেষকদের জন্য: ভবিষ্যৎ এই স্থির ম্যাপিং পরিশোধন করার মধ্যে নয়, বরং এটিকে অভিযোজিত করার মধ্যে। ব্যবহারকারীর শারীরবৃত্তীয় প্রতিক্রিয়া (ক্যামেরা বা পরিধানযোগ্যের মাধ্যমে) একটি বদ্ধ লুপে ব্যবহার করে প্যাটার্নগুলি রিয়েল-টাইমে সামঞ্জস্য করুন, একটি "সাইকেলজিএএন-এর মতো" সিস্টেমের দিকে অগ্রসর হন যা ব্যক্তিগতকৃত আবেগগত ম্যাপিং শেখে। এআর/ভিআর দলের সাথে অংশীদারিত্ব করুন—এই প্রযুক্তিটি হেডস-আপ ডিসপ্লেতে অদৃশ্য এআই এজেন্টের আবেগগত অবস্থা নির্দেশ করার জন্য উপযুক্ত।

7. বিশ্লেষণ কাঠামো ও উদাহরণ কেস

কাঠামো: আবেগগত চ্যানেল ক্ষমতা (এসিসি) কাঠামো
আমরা এই ধরনের সিস্টেম মূল্যায়নের জন্য একটি সরল কাঠামো প্রস্তাব করি: আবেগগত চ্যানেল ক্ষমতা। এটি পরিমাপ করে যে একটি চ্যানেল (যেমন একটি এলইডি ডিসপ্লে) একটি নির্দিষ্ট সময় উইন্ডোর মধ্যে একজন মানব পর্যবেক্ষকের কাছে কতগুলি স্বতন্ত্র আবেগগত অবস্থা নির্ভরযোগ্যভাবে প্রেরণ করতে পারে। $ACC = log_2(N_{reliable})$, যেখানে $N_{reliable}$ হল সম্ভাব্য স্তরের থেকে উল্লেখযোগ্যভাবে স্বীকৃত আবেগের সংখ্যা।

উদাহরণ কেস বিশ্লেষণ: এই গবেষণাপত্রের ফলাফলে এসিসি প্রয়োগ করা:

আনন্দ: নির্ভরযোগ্যভাবে স্বীকৃত।
রাগ: নির্ভরযোগ্যভাবে স্বীকৃত।
দুঃখ: প্রান্তিকভাবে নির্ভরযোগ্য (সীমান্তবর্তী তাৎপর্য)।
ভয়: নির্ভরযোগ্য নয়।

সুতরাং, $N_{reliable} \approx 2.5$। $ACC \approx log_2(2.5) \approx 1.32$ বিট। এটি দাবিটি পরিমাণগতভাবে প্রকাশ করে: এই সরল ডিসপ্লেটি মাত্র ১ বিটের বেশি আবেগগত তথ্য সরবরাহ করে—একটি বাইনারি "ভাল/খারাপ" সংকেতের জন্য যথেষ্ট, কিন্তু মানুষের মুখের সমৃদ্ধি থেকে অনেক দূরে। এই কাঠামোটি বিভিন্ন আবেগগত ডিসপ্লে মাধ্যমগুলিকে বস্তুনিষ্ঠভাবে তুলনা করতে সাহায্য করে।

নন-কোড বাস্তবায়ন দৃশ্যকল্প: একটি হাসপাতালের করিডোরে একটি সার্ভিস রোবট তার সামনের দিকে মুখ করা এলইডি প্যানেল ব্যবহার করে। ডিফল্ট: নরম সাদা স্পন্দন (নিরপেক্ষ/সক্রিয়)। একজন ব্যক্তির কাছে যাওয়ার সময়: ধীর হলুদ স্পন্দনে পরিবর্তিত হয় (বন্ধুত্বপূর্ণ/খুশি)। যখন এর পথ অবরুদ্ধ থাকে: ধীর লাল স্পন্দনে পরিবর্তিত হয় (বিরক্ত/অপেক্ষা করছে)। একটি ডেলিভারি কাজ সম্পন্ন করার পর: দ্রুত সবুজ ফ্ল্যাশ দুইবার (সাফল্য/আনন্দ)। এই সরল প্রোটোকল, গবেষণাপত্রের যাচাইকৃত ম্যাপিং থেকে সরাসরি উদ্ভূত, বক্তব্য ছাড়াই উপলব্ধ স্বজ্ঞাততা বাড়ায়।

8. ভবিষ্যতের প্রয়োগ ও গবেষণার দিকনির্দেশনা

ব্যক্তিগতকৃত আবেগ ম্যাপিং: মেশিন লার্নিং ব্যবহার করে আলোর প্যাটার্নগুলিকে পৃথক ব্যবহারকারীর ব্যাখ্যার সাথে অভিযোজিত করা, বিভিন্ন জনসংখ্যার মধ্যে স্বীকৃতির হার বৃদ্ধি করা।
মাল্টি-মোডাল ফিউশন: এলইডি ডিসপ্লেকে সরল শব্দ সংকেত বা গতি প্যাটার্নের (যেমন, রোবট বেস কম্পন) সাথে একত্রিত করে একটি আরও শক্তিশালী ও স্বতন্ত্র যৌগিক আবেগগত সংকেত তৈরি করা, সম্ভাব্যভাবে এসিসি বৃদ্ধি করা।
প্রসঙ্গ-সচেতন ডিসপ্লে: পরিবেশগত সেন্সর সংহত করা যাতে আবেগগত অভিব্যক্তি প্রসঙ্গ দ্বারা নিয়ন্ত্রিত হয় (যেমন, একটি উজ্জ্বল কক্ষে ম্লান দুঃখ)।
এক্সটেন্ডেড রিয়েলিটি (এক্সআর) ইন্টিগ্রেশন: এআই সহকারী বা ডিজিটাল টুইনের আবেগগত অবস্থা নির্দেশ করতে এআর চশমায় ভার্চুয়াল এলইডি ডিসপ্লে ব্যবহার করা, মেটা ও মাইক্রোসফটের এআর গবেষণা রোডম্যাপের সাথে সামঞ্জস্যপূর্ণ একটি দিক।
প্রক্সেমিক্স ও আলো: মানব মিথস্ক্রিয়াকারীর দূরত্বের ভিত্তিতে আলোর তীব্রতা ও রঙ কীভাবে পরিবর্তন করা উচিত তা গবেষণা করা যাতে উপযুক্ত উপলব্ধ আবেগগত তীব্রতা বজায় রাখা যায়।
মানকীকরণ: ইলেকট্রনিক্সের স্ট্যাটাস এলইডির মতো, ক্রস-প্ল্যাটফর্ম বোধগম্যতা নিশ্চিত করার জন্য রোবটগুলির জন্য একটি শিল্প-মানক "আবেগগত আলোর ভাষা" এর জন্য চাপ দেওয়া।

9. তথ্যসূত্র

এম. এল. ওয়াল্টার্স এট আল., "Exploring the design space for robots displaying emotion," Proc. EMCSR, ২০০৬।
আর. এল. বার্ডহুইস্টেল, Kinesics and Context। ইউনিভার্সিটি অফ পেনসিলভানিয়া প্রেস, ১৯৭০।
এ. মেহরাবিয়ান, Nonverbal Communication। অ্যালডাইন-অ্যাথারটন, ১৯৭২।
সি. এল. ব্রেজিয়াল, Designing Sociable Robots। এমআইটি প্রেস, ২০০২।
ডি. হ্যানসন এট আল., "Upending the uncanny valley," Proc. AAAI, ২০০৫।
এইচ. ইশিগুরো, "Android science," Cognitive Science Society, ২০০৫।
এল. ডি. রিক এট আল., "How anthropomorphism affects empathy for robots," Proc. HRI, ২০০৯।
জে. ফোরলিজি ও সি. ডিসালভো, "Service robots in the domestic environment," Proc. HRI, ২০০৬।
জে. গ্র্যাচ ও এস. মার্সেলা, "A domain-independent framework for modeling emotion," Cognitive Systems Research, ২০০৪।
ওয়াই. জেকা এট আল., "KOBIAN: A new whole-body emotion expression humanoid robot," Proc. IEEE ICAR, ২০০৯।
এ. এল. থমাজ এট আল., "Robot learning via socially guided exploration," Proc. ICDL, ২০০৮।
আর. ডব্লিউ. পিকার্ড, Affective Computing। এমআইটি প্রেস, ১৯৯৭।
জে.-ওয়াই. ঝু এট আল., "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks," Proc. IEEE ICCV, ২০১৭।