Penilaian Paparan Emosi Berasaskan RGB-LED untuk Agen Afektif

1. Pengenalan & Gambaran Keseluruhan

Kertas kerja ini menyiasat penggunaan paparan RGB-LED beresolusi rendah sebagai modaliti yang kos efektif dan dipermudahkan untuk meluahkan emosi buatan dalam agen afektif dan robot. Hipotesis teras ialah warna dan corak cahaya dinamik tertentu boleh membangkitkan perkaitan dengan emosi asas manusia—kegembiraan, kemarahan, kesedihan, dan ketakutan—sekali gus memudahkan komunikasi emosi bukan lisan dalam interaksi manusia-robot (HRI). Kerja ini terletak dalam bidang pengkomputeran afektif yang lebih luas, bertujuan meningkatkan penerimaan teknologi dengan menjadikan interaksi lebih intuitif dan beresonansi secara emosi.

Penyelidikan ini menangani jurang antara ekspresi android yang kompleks dan mahal dengan keperluan penyelesaian mudah dan boleh dilaksanakan untuk robot yang mempunyai kekangan rupa bentuk. Dengan mengesahkan corak cahaya yang dicadangkan melalui kajian pengguna, kertas kerja ini memberikan bukti empirikal untuk kebolehgunaan pendekatan ini.

2. Metodologi & Reka Bentuk Sistem

Sistem ini berpusat pada paparan RGB-LED yang dibina khas, direka sebagai alternatif beresolusi rendah kepada ciri-ciri wajah.

2.1 Konfigurasi Paparan RGB-LED

Paparan terdiri daripada matriks LED RGB. Parameter utama termasuk:

Resolusi: Matriks bilangan rendah (contohnya, 8x8 atau serupa), mengutamakan kejelasan corak berbanding butiran.
Kawalan: Didorong oleh mikropengawal, membolehkan kawalan tepat ke atas hue, ketepuan, kecerahan (ruang warna HSV/HSL), dan dinamik temporal.
Faktor Bentuk: Direka untuk integrasi ke dalam robot yang tidak mempunyai wajah tradisional.

2.2 Pemetaan Emosi-Kepada-Cahaya

Berdasarkan penyelidikan terdahulu dalam psikologi warna dan HRI (contohnya, [11]), pemetaan asas telah ditetapkan:

Kegembiraan/Sukacita: Warna hangat (Kuning, Jingga). Kecerahan tinggi, cahaya stabil atau berdenyut lembut.
Kemarahan: Warna hangat (Merah, Jingga Tua). Keamatan tinggi, corak berkelip atau berdenyut pantas.
Kesedihan: Warna sejuk (Biru, Sian). Kecerahan rendah, pudar perlahan atau denyutan malap.
Ketakutan/Kebimbangan: Warna sejuk atau neutral (Biru, Putih, Ungu). Corak berkelip atau berkilau pantas yang tidak menentu.

2.3 Penjanaan Corak Dinamik

Selain warna statik, corak dinamik (bentuk gelombang) adalah penting. Kertas kerja ini meneroka parameter seperti:

Frekuensi: Kelajuan pengulangan corak (contohnya, Hz).
Bentuk Gelombang: Bentuk modulasi kecerahan mengikut masa (sinusoid, segi empat tepat, gigi gergaji).
Amplitud: Julat variasi kecerahan.

Sebagai contoh, kemarahan mungkin menggunakan gelombang segi empat tepat frekuensi tinggi ($f_{kemarahan} > 5Hz$), manakala kesedihan menggunakan gelombang sinus frekuensi rendah ($f_{kesedihan} < 1Hz$).

3. Reka Bentuk Eksperimen & Pengesahan

Satu kajian pengguna telah dijalankan untuk mengesahkan pengecaman emosi daripada corak LED.

3.1 Demografi Peserta

Kajian ini melibatkan N peserta, yang direkrut daripada persekitaran universiti, dengan campuran latar belakang teknikal dan bukan teknikal untuk menilai kebolehumuman.

3.2 Prosedur & Metrik

Peserta ditunjukkan urutan corak LED, setiap satunya mewakili salah satu daripada empat emosi sasaran, dalam susunan rawak. Selepas setiap paparan, mereka diminta mengenal pasti emosi yang diluahkan daripada senarai tertutup (pilihan paksa). Metrik utama termasuk:

Ketepatan Pengecaman: Peratusan pengenalpastian betul bagi setiap emosi.
Matriks Kekeliruan: Analisis emosi yang paling kerap dikelirukan.
Maklum Balas Subjektif: Data kualitatif mengenai keintuitifan corak.

4. Keputusan & Analisis

4.1 Ketepatan Pengecaman

Keputusan menunjukkan tahap kejayaan yang berbeza-beza merentas emosi. Data awal mencadangkan:

Pengecaman Tinggi (>70%): Kegembiraan dan Kemarahan sering dikenal pasti dengan betul, kemungkinan besar disebabkan oleh perkaitan budaya dan psikologi yang kuat antara warna hangat dengan keadaan rangsangan tinggi.
Pengecaman Sederhana (50-70%): Kesedihan menunjukkan pengecaman sederhana, berpotensi dikelirukan dengan keadaan neutral atau "tidur".
Pengecaman Lebih Rendah (<50%): Ketakutan terbukti paling mencabar, dengan corak sering disalah kenal sebagai emosi negatif lain seperti kemarahan atau kesedihan, menonjolkan kekaburan corak dinamik warna sejuk.

Penerangan Carta (Dibayangkan): Satu carta bar akan menunjukkan ketepatan pengecaman pada paksi-y (0-100%) untuk setiap empat emosi pada paksi-x. Bar Kegembiraan dan Kemarahan akan paling tinggi, Kesedihan sederhana, dan Ketakutan paling pendek. Satu garis tindihan boleh menunjukkan selang keyakinan.

4.2 Kepentingan Statistik

Ujian statistik (contohnya, Chi-square) mengesahkan bahawa kadar pengecaman untuk kegembiraan dan kemarahan adalah jauh melebihi tahap kebetulan (25% untuk tugasan 4 pilihan), manakala pengecaman ketakutan tidak dapat dibezakan secara statistik daripada kebetulan. Ini menekankan keperluan untuk reka bentuk corak yang diperhalusi untuk emosi kompleks seperti ketakutan.

5. Butiran Teknikal & Kerangka Matematik

Keadaan emosi $E$ boleh dimodelkan sebagai vektor yang mempengaruhi parameter output cahaya. Untuk emosi tertentu $e_i$, keadaan paparan $L(t)$ pada masa $t$ ditakrifkan oleh:

$L(t) = [H(e_i), S(e_i), V(e_i, t), f(e_i), w(e_i, t)]$

Di mana:

$H$: Hue (panjang gelombang dominan, dipetakan daripada psikologi warna).
$S$: Ketepuan (kesucian warna, contohnya, tinggi untuk emosi sengit).
$V$: Nilai/Kecerahan, fungsi masa dan emosi: $V(t) = A(e_i) \cdot w(2\pi f(e_i) t) + V_{base}(e_i)$. $A$ ialah amplitud, $w$ ialah fungsi bentuk gelombang (sinus, segi empat), $f$ ialah frekuensi.
$f$: Frekuensi temporal corak.
$w$: Fungsi bentuk gelombang yang mentakrifkan bentuk corak mengikut masa.

Sebagai contoh, kemarahan ($e_a$) boleh diparameterkan sebagai: $H_{a} \approx 0\text{° (Merah)}, S_{a} \approx 1.0, V_{a}(t) = 0.8 \cdot \text{segi empat}(2\pi \cdot 5 \cdot t) + 0.2, f_{a}=5\text{Hz}$.

6. Inti Pati & Perspektif Penganalisis

Inti Pati: Kertas kerja ini bukan tentang membina wajah emosi yang lebih baik; ia adalah satu 'hack' pragmatik untuk ekonomi robot "tanpa wajah". Ia mengandaikan bahawa untuk robot pasaran massa yang sensitif kos (fikirkan robot gudang, pembantu rumah mudah), grid LED $5 boleh mencapai 70% daripada kebolehkenalan emosi wajah android $50,000 untuk keadaan asas seperti kegembiraan dan kemarahan. Proposisi nilai sebenar ialah lebar jalur emosi per dolar.

Aliran Logik: Hujahnya bersih dan perindustrian: 1) Wajah kompleks mahal dan berat secara pengiraan (merujuk Geminoid, KOBIAN). 2) Isyarat bukan lisan kritikal untuk penerimaan HRI. 3) Cahaya murah, boleh diprogram, dan boleh dilihat secara universal. 4) Mari kita petakan emosi asas kepada parameter cahaya termudah (warna, kelip). 5) Uji jika ia berfungsi. Alirannya kurang tentang kedalaman psikologi dan lebih tentang pengesahan kejuruteraan untuk produk minimum yang boleh dilaksanakan (MVP) dalam ekspresi afektif.

Kekuatan & Kelemahan: Kekuatannya ialah kepraktisan brutal dan pengesahan eksperimen yang jelas untuk emosi rangsangan tinggi. Ia menyampaikan spesifikasi yang boleh digunakan untuk pereka robot. Kelemahan, yang diakui oleh penulis, ialah palet emosi yang cetek. Kegagalan Ketakutan adalah bermakna—ia mendedahkan batasan pendekatan sintaks semata-mata (warna + kelajuan kelip) tanpa konteks semantik. Seperti yang dinyatakan dalam kerja pengkomputeran afektif asas oleh Picard (1997), komunikasi emosi sejati sering memerlukan penilaian dan konteks, yang tidak dimiliki oleh jalur cahaya. Berbanding dengan model ekspresi yang lebih canggih dan generatif seperti yang dibincangkan dalam kertas kerja CycleGAN (Zhu et al., 2017) untuk pemindahan gaya, kaedah ini adalah deterministik dan kurang kebolehsesuaian.

Wawasan Boleh Tindak: Untuk pengurus produk: Laksanakan ini untuk isyarat keadaan asas (tugas selesai = denyutan hijau gembira, ralat = kelip merah marah) dalam robot bukan sosial dengan segera. Untuk penyelidik: Masa depan bukan dalam memperhalusi pemetaan statik ini, tetapi dalam menjadikannya adaptif. Gunakan maklum balas fisiologi pengguna (melalui kamera atau boleh pakai) dalam gelung tertutup untuk melaraskan corak secara masa nyata, bergerak ke arah sistem "seperti CycleGAN" yang mempelajari pemetaan emosi peribadi. Bekerjasama dengan pasukan AR/VR—teknologi ini sesuai untuk menunjukkan keadaan emosi ejen AI yang tidak kelihatan dalam paparan kepala.

7. Kerangka Analisis & Contoh Kes

Kerangka: Kerangka Kapasiti Saluran Afektif (ACC)
Kami mencadangkan kerangka mudah untuk menilai sistem sedemikian: Kapasiti Saluran Afektif. Ia mengukur berapa banyak keadaan emosi yang boleh dibezakan yang boleh disampaikan oleh saluran (seperti paparan LED) kepada pemerhati manusia dalam tetingkap masa tertentu. $ACC = log_2(N_{boleh dipercayai})$, di mana $N_{boleh dipercayai}$ ialah bilangan emosi yang dikenali jauh melebihi kebetulan.

Analisis Contoh Kes: Menggunakan ACC pada keputusan kertas kerja ini:

Kegembiraan: Dikenali dengan boleh dipercayai.
Kemarahan: Dikenali dengan boleh dipercayai.
Kesedihan: Boleh dipercayai secara marginal (kepentingan sempadan).
Ketakutan: Tidak boleh dipercayai.

Oleh itu, $N_{boleh dipercayai} \approx 2.5$. $ACC \approx log_2(2.5) \approx 1.32$ bit. Ini mengkuantifikasikan dakwaan: paparan mudah ini menyediakan sedikit lebih daripada 1 bit maklumat afektif—cukup untuk isyarat binari "baik/buruk", tetapi jauh daripada kekayaan wajah manusia. Kerangka ini membantu membandingkan modaliti paparan afektif yang berbeza secara objektif.

Skenario Pelaksanaan Bukan Kod: Sebuah robot perkhidmatan di lorong hospital menggunakan panel LED menghadap hadapannya. Lalai: Denyutan putih lembut (neutral/aktif). Apabila menghampiri seseorang: Beralih kepada denyutan kuning perlahan (mesra/gembira). Apabila laluannya dihalang: Bertukar kepada denyutan merah perlahan (kesal/menunggu). Setelah menyelesaikan tugas penghantaran: Kelip hijau pantas dua kali (kejayaan/sukacita). Protokol mudah ini, diperoleh terus daripada pemetaan yang disahkan kertas kerja, meningkatkan keintuitifan yang dirasakan tanpa pertuturan.

8. Aplikasi Masa Depan & Hala Tuju Penyelidikan

Pemetaan Emosi Peribadi: Menggunakan pembelajaran mesin untuk menyesuaikan corak cahaya kepada tafsiran pengguna individu, meningkatkan kadar pengecaman merentas populasi pelbagai.
Gabungan Pelbagai Modal: Menggabungkan paparan LED dengan isyarat bunyi mudah atau corak gerakan (contohnya, getaran asas robot) untuk mencipta isyarat emosi komposit yang lebih teguh dan boleh dibezakan, berpotensi meningkatkan ACC.
Paparan Sedar Konteks: Mengintegrasikan sensor persekitaran supaya ekspresi emosi dimodulasi oleh konteks (contohnya, kesedihan lebih malap dalam bilik terang).
Integrasi Realiti Lanjutan (XR): Menggunakan paparan LED maya pada cermin mata AR untuk menunjukkan keadaan emosi pembantu AI atau kembar digital, satu hala tuju yang selari dengan peta jalan penyelidikan AR Meta dan Microsoft.
Proksemik & Cahaya: Menyelidik bagaimana keamatan dan warna cahaya harus berubah berdasarkan jarak kepada manusia yang berinteraksi untuk mengekalkan keamatan emosi yang dirasakan sesuai.
Pemiawaian: Mendorong "bahasa cahaya emosi" piawai industri untuk robot, serupa dengan LED status pada elektronik, untuk memastikan kebolehfahaman merentas platform.

9. Rujukan

M. L. Walters et al., "Exploring the design space for robots displaying emotion," dalam Proc. EMCSR, 2006.
R. L. Birdwhistell, Kinesics and Context. University of Pennsylvania Press, 1970.
A. Mehrabian, Nonverbal Communication. Aldine-Atherton, 1972.
C. L. Breazeal, Designing Sociable Robots. MIT Press, 2002.
D. Hanson et al., "Upending the uncanny valley," dalam Proc. AAAI, 2005.
H. Ishiguro, "Android science," dalam Cognitive Science Society, 2005.
L. D. Riek et al., "How anthropomorphism affects empathy for robots," dalam Proc. HRI, 2009.
J. Forlizzi and C. DiSalvo, "Service robots in the domestic environment," dalam Proc. HRI, 2006.
J. Gratch and S. Marsella, "A domain-independent framework for modeling emotion," Cognitive Systems Research, 2004.
Y. Zecca et al., "KOBIAN: A new whole-body emotion expression humanoid robot," dalam Proc. IEEE ICAR, 2009.
A. L. Thomaz et al., "Robot learning via socially guided exploration," dalam Proc. ICDL, 2008.
R. W. Picard, Affective Computing. MIT Press, 1997.
J.-Y. Zhu et al., "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks," dalam Proc. IEEE ICCV, 2017.