Duygusal Ajanlar için RGB-LED Tabanlı Bir Duygu Ekranının Değerlendirilmesi

1. Giriş ve Genel Bakış

Bu makale, düşük çözünürlüklü bir RGB-LED ekranının, duygusal ajanlar ve robotlarda yapay duyguları ifade etmek için uygun maliyetli ve basitleştirilmiş bir modalite olarak kullanımını araştırmaktadır. Temel hipotez, belirli renklerin ve dinamik ışık desenlerinin temel insan duyguları—mutluluk, öfke, üzüntü ve korku—ile çağrışımlar uyandırabileceği ve böylece insan-robot etkileşiminde (HRI) sözsüz duygusal iletişimi kolaylaştırabileceğidir. Bu çalışma, etkileşimleri daha sezgisel ve duygusal olarak yankı uyandırıcı hale getirerek teknoloji kabulünü artırmayı amaçlayan duygusal hesaplamanın daha geniş alanı içinde yer almaktadır.

Araştırma, karmaşık ve pahalı android ifadeleri ile görünümü kısıtlı robotlar için basit, uygulanabilir çözümler arasındaki boşluğu ele almaktadır. Önerilen ışık desenlerini bir kullanıcı çalışmasıyla doğrulayarak, makale bu yaklaşımın uygulanabilirliği için ampirik kanıt sunmaktadır.

2. Metodoloji ve Sistem Tasarımı

Sistem, yüz özelliklerine düşük çözünürlüklü bir alternatif olarak tasarlanmış özel bir RGB-LED ekranına odaklanmaktadır.

2.1 RGB-LED Ekran Konfigürasyonu

Ekran, bir RGB LED matrisinden oluşmaktadır. Temel parametreler şunlardır:

Çözünürlük: Düşük sayılı matris (örn., 8x8 veya benzeri), detaydan ziyade desen netliğini önceliklendirir.
Kontrol: Mikrodenetleyici tabanlı, renk tonu, doygunluk, parlaklık (HSV/HSL renk uzayı) ve zamansal dinamikler üzerinde hassas kontrol sağlar.
Form Faktörü: Geleneksel yüzü olmayan robotlara entegrasyon için tasarlanmıştır.

2.2 Duygu-Işık Eşleştirmesi

Renk psikolojisi ve HRI alanındaki önceki araştırmalara dayanarak (örn., [11]), temel bir eşleştirme oluşturulmuştur:

Mutluluk/Neşe: Sıcak renkler (Sarı, Turuncu). Yüksek parlaklık, sabit veya hafifçe nabız atan ışık.
Öfke: Sıcak renkler (Kırmızı, Koyu Turuncu). Yüksek yoğunluk, hızlı yanıp sönen veya nabız atan desenler.
Üzüntü: Soğuk renkler (Mavi, Camgöbeği). Düşük parlaklık, yavaş solan veya loş nabız atan ışık.
Korku/Kaygı: Soğuk veya nötr renkler (Mavi, Beyaz, Mor). Düzensiz, hızlı yanıp sönen veya titreyen desenler.

2.3 Dinamik Desen Üretimi

Statik renk ötesinde, dinamik desenler (dalga formları) çok önemlidir. Makale şu parametreleri araştırmaktadır:

Frekans: Desen tekrar hızı (örn., Hz).
Dalga Formu: Parlaklık modülasyonunun zaman içindeki şekli (sinüzoidal, dikdörtgen, testere dişi).
Genlik: Parlaklık değişim aralığı.

Örneğin, öfke yüksek frekanslı bir dikdörtgen dalga kullanabilir ($f_{öfke} > 5Hz$), üzüntü ise düşük frekanslı bir sinüs dalgası kullanabilir ($f_{üzüntü} < 1Hz$).

3. Deneysel Tasarım ve Doğrulama

LED desenlerinden duyguların tanınmasını doğrulamak için bir kullanıcı çalışması yapılmıştır.

3.1 Katılımcı Demografisi

Çalışma, genellenebilirliği değerlendirmek için teknik ve teknik olmayan geçmişlere sahip, üniversite ortamından seçilen N katılımcıyı içermiştir.

3.2 Prosedür ve Metrikler

Katılımcılara, dört hedef duygudan birini temsil eden LED desen dizileri rastgele sırayla gösterilmiştir. Her gösterimden sonra, ifade edilen duyguyu kapalı bir listeden (zorunlu seçim) tanımlamaları istenmiştir. Temel metrikler şunlardır:

Tanıma Doğruluğu: Duygu başına doğru tanımlama yüzdesi.
Karışıklık Matrisi: Hangi duyguların en sık karıştırıldığının analizi.
Öznel Geri Bildirim: Desenlerin sezgiselliği hakkında nitel veriler.

4. Sonuçlar ve Analiz

4.1 Tanıma Doğruluğu

Sonuçlar, duygular arasında değişen başarı seviyeleri göstermiştir. Ön veriler şunu önermektedir:

Yüksek Tanıma (>%70): Mutluluk ve Öfke genellikle doğru tanımlanmıştır; bu muhtemelen sıcak renklerin yüksek uyarılma durumlarıyla güçlü kültürel ve psikolojik çağrışımlarından kaynaklanmaktadır.
Orta Düzeyde Tanıma (%50-70): Üzüntü orta düzeyde tanıma göstermiş, potansiyel olarak nötr veya "uyuyor" durumuyla karıştırılabilir.
Düşük Tanıma (<%50): Korku en zorlayıcı olmuş, desenler sıklıkla öfke veya üzüntü gibi diğer olumsuz duygular olarak yanlış tanımlanmıştır; bu da soğuk renkli dinamik desenlerin belirsizliğini vurgulamaktadır.

Grafik Açıklaması (Tasarlanmış): Bir çubuk grafik, y ekseninde tanıma doğruluğunu (%0-100), x ekseninde dört duyguyu gösterecektir. Mutluluk ve Öfke çubukları en uzun, Üzüntü orta, Korku ise en kısa olacaktır. Üstte bir çizgi güven aralıklarını gösterebilir.

4.2 İstatistiksel Anlamlılık

İstatistiksel testler (örn., Ki-kare), mutluluk ve öfke için tanıma oranlarının şans seviyesinin (4 seçenekli bir görev için %25) önemli ölçüde üzerinde olduğunu doğrularken, korkunun tanınmasının şanstan istatistiksel olarak ayırt edilemez olduğunu göstermiştir. Bu, korku gibi karmaşık duygular için rafine desen tasarımına olan ihtiyacı vurgulamaktadır.

5. Teknik Detaylar ve Matematiksel Çerçeve

Duygusal durum $E$, ışık çıktı parametrelerini etkileyen bir vektör olarak modellenebilir. Belirli bir $e_i$ duygusu için, $t$ zamanındaki ekran durumu $L(t)$ şu şekilde tanımlanır:

$L(t) = [H(e_i), S(e_i), V(e_i, t), f(e_i), w(e_i, t)]$

Burada:

$H$: Renk Tonu (baskın dalga boyu, renk psikolojisinden eşlenir).
$S$: Doygunluk (renk saflığı, örn., yoğun duygular için yüksek).
$V$: Değer/Parlaklık, zaman ve duygunun bir fonksiyonu: $V(t) = A(e_i) \cdot w(2\pi f(e_i) t) + V_{base}(e_i)$. $A$ genlik, $w$ dalga formu fonksiyonu (sinüs, kare), $f$ frekanstır.
$f$: Desenin zamansal frekansı.
$w$: Desenin zaman içindeki şeklini tanımlayan dalga formu fonksiyonu.

Örneğin, öfke ($e_a$) şu şekilde parametrize edilebilir: $H_{a} \approx 0\text{° (Kırmızı)}, S_{a} \approx 1.0, V_{a}(t) = 0.8 \cdot \text{kare}(2\pi \cdot 5 \cdot t) + 0.2, f_{a}=5\text{Hz}$.

6. Temel Çıkarımlar ve Analist Perspektifi

Temel Çıkarım: Bu makale, daha iyi bir duygusal yüz yapmakla ilgili değildir; "yüzsüz" robot ekonomisi için pragmatik bir çözümdür. Kitlesel pazara, maliyet duyarlı robotlar için (depo robotları, basit ev asistanları gibi) 5$'lık bir LED ızgarasının, mutluluk ve öfke gibi temel durumlar için 50.000$'lık bir android yüzün duygusal tanınabilirliğinin %70'ini başarabileceğini öne sürmektedir. Gerçek değer önerisi, dolar başına duygusal bant genişliğidir.

Mantıksal Akış: Argüman temiz ve endüstriyeldir: 1) Karmaşık yüzler pahalı ve hesaplama açısından ağırdır (Geminoid, KOBIAN referans gösterilir). 2) Sözsüz ipuçları HRI kabulü için kritiktir. 3) Işık ucuz, programlanabilir ve evrensel olarak algılanabilir. 4) Temel duyguları en basit ışık parametrelerine (renk, yanıp sönme) eşleyelim. 5) İşe yarayıp yaramadığını test edelim. Akış, psikolojik derinlikten ziyade, duygusal ifade için asgari uygulanabilir ürün (MVP) mühendislik doğrulamasıyla ilgilidir.

Güçlü ve Zayıf Yönler: Güçlü yanı, acımasız pratikliği ve yüksek uyarılma duyguları için net deneysel doğrulamasıdır. Robot tasarımcıları için kullanılabilir bir spesifikasyon sunar. Yazarların da kabul ettiği zayıf yan, sığ duygusal paletidir. Korkunun başarısızlığı anlamlıdır—semantik bağlam olmadan, tamamen sentaktik bir yaklaşımın (renk + yanıp sönme hızı) sınırlamasını ortaya koyar. Picard'ın (1997) temel duygusal hesaplama çalışmasında belirtildiği gibi, gerçek duygusal iletişim genellikle değerlendirme ve bağlam gerektirir, ki bunlar bir ışık şeridinde eksiktir. CycleGAN makalesinde (Zhu ve diğerleri, 2017) tartışılan stil transferi gibi daha sofistike, üretken ifade modelleriyle karşılaştırıldığında, bu yöntem deterministiktir ve uyarlanabilirlikten yoksundur.

Uygulanabilir Çıkarımlar: Ürün yöneticileri için: Sosyal olmayan robotlarda temel durum sinyallemesi için (görev tamam = mutlu yeşil nabız, hata = öfkeli kırmızı yanıp sönme) bunu hemen uygulayın. Araştırmacılar için: Gelecek, bu statik eşleştirmeyi iyileştirmekte değil, onu uyarlanabilir hale getirmektedir. Kullanıcının fizyolojik geri bildirimini (kamera veya giyilebilir cihaz aracılığıyla) kapalı bir döngüde kullanarak desenleri gerçek zamanlı olarak ayarlayın, kişiselleştirilmiş duygusal eşlemeler öğrenen "CycleGAN-benzeri" bir sisteme doğru ilerleyin. AR/VR ekipleriyle ortaklık kurun—bu teknoloji, baş üstü ekranlarda görünmez yapay zeka ajanlarının duygusal durumunu göstermek için mükemmeldir.

7. Analiz Çerçevesi ve Örnek Vaka

Çerçeve: Duygusal Kanal Kapasitesi (ACC) Çerçevesi
Bu tür sistemleri değerlendirmek için basit bir çerçeve öneriyoruz: Duygusal Kanal Kapasitesi. Bir kanalın (LED ekran gibi) belirli bir zaman penceresinde bir insan gözlemciye güvenilir şekilde iletebileceği ayırt edilebilir duygusal durum sayısını ölçer. $ACC = log_2(N_{güvenilir})$, burada $N_{güvenilir}$ şans seviyesinin önemli ölçüde üzerinde tanınan duygu sayısıdır.

Örnek Vaka Analizi: Bu makalenin sonuçlarına ACC uygulandığında:

Mutluluk: Güvenilir şekilde tanındı.
Öfke: Güvenilir şekilde tanındı.
Üzüntü: Marjinal olarak güvenilir (sınırda anlamlılık).
Korku: Güvenilir değil.

Böylece, $N_{güvenilir} \approx 2.5$. $ACC \approx log_2(2.5) \approx 1.32$ bit. Bu, iddiayı nicelendirir: bu basit ekran sadece 1 bitin biraz üzerinde duygusal bilgi sağlar—"iyi/kötü" gibi ikili bir sinyal için yeterli, ancak bir insan yüzünün zenginliğinden uzak. Bu çerçeve, farklı duygusal ekran modalitelerini objektif olarak karşılaştırmaya yardımcı olur.

Kod Olmayan Uygulama Senaryosu: Bir hastane koridorundaki bir hizmet robotu, öne bakan LED panelini kullanır. Varsayılan: Yumuşak beyaz nabız (nötr/aktif). Bir kişiye yaklaşırken: Yavaş sarı nabıza geçer (dostça/mutlu). Yolu engellendiğinde: Yavaş kırmızı nabıza geçer (rahatsız/bekliyor). Bir teslimat görevini tamamladığında: Hızlı yeşil yanıp sönme iki kez (başarı/neşe). Makalenin doğrulanmış eşlemelerinden doğrudan türetilen bu basit protokol, konuşma olmadan algılanan sezgiselliği artırır.

8. Gelecek Uygulamalar ve Araştırma Yönleri

Kişiselleştirilmiş Duygu Eşleştirmesi: Işık desenlerini bireysel kullanıcı yorumlarına uyarlamak için makine öğrenimi kullanarak, farklı popülasyonlarda tanıma oranlarını artırmak.
Çok Modlu Füzyon: LED ekranı basit ses ipuçları veya hareket desenleriyle (örn., robot taban titreşimi) birleştirerek, daha sağlam ve ayırt edilebilir bir bileşik duygusal sinyal oluşturmak, potansiyel olarak ACC'yi artırmak.
Bağlam Farkındalıklı Ekranlar: Çevresel sensörler entegre ederek duygusal ifadenin bağlama göre modüle edilmesi (örn., aydınlık bir odada daha loş üzüntü).
Genişletilmiş Gerçeklik (XR) Entegrasyonu: AR gözlüklerde sanal LED ekranları kullanarak yapay zeka asistanlarının veya dijital ikizlerin duygusal durumunu göstermek, Meta ve Microsoft'un AR araştırma yol haritalarıyla uyumlu bir yön.
Proksemikler ve Işık: Uygun algılanan duygusal yoğunluğu korumak için, insan etkileşimcisine olan mesafeye bağlı olarak ışık yoğunluğunun ve renginin nasıl değişmesi gerektiğini araştırmak.
Standardizasyon: Elektronik cihazlardaki durum LED'leri gibi, robotlar için platformlar arası anlaşılırlığı sağlamak amacıyla endüstri standardı bir "duygusal ışık dili" için çaba göstermek.

9. Referanslar

M. L. Walters ve diğerleri, "Exploring the design space for robots displaying emotion," Proc. EMCSR, 2006.
R. L. Birdwhistell, Kinesics and Context. University of Pennsylvania Press, 1970.
A. Mehrabian, Nonverbal Communication. Aldine-Atherton, 1972.
C. L. Breazeal, Designing Sociable Robots. MIT Press, 2002.
D. Hanson ve diğerleri, "Upending the uncanny valley," Proc. AAAI, 2005.
H. Ishiguro, "Android science," Cognitive Science Society, 2005.
L. D. Riek ve diğerleri, "How anthropomorphism affects empathy for robots," Proc. HRI, 2009.
J. Forlizzi ve C. DiSalvo, "Service robots in the domestic environment," Proc. HRI, 2006.
J. Gratch ve S. Marsella, "A domain-independent framework for modeling emotion," Cognitive Systems Research, 2004.
Y. Zecca ve diğerleri, "KOBIAN: A new whole-body emotion expression humanoid robot," Proc. IEEE ICAR, 2009.
A. L. Thomaz ve diğerleri, "Robot learning via socially guided exploration," Proc. ICDL, 2008.
R. W. Picard, Affective Computing. MIT Press, 1997.
J.-Y. Zhu ve diğerleri, "Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks," Proc. IEEE ICCV, 2017.