Вештачката интелигенција станува прилично добра во имитирањето човечки разговори. Од друга страна, нејзините колеги – хуманоидните роботите, се чини дека каскаат во напредокот, барем кога станува збор за соодветно прикажување на емоциите. Предизвикот за беспрекорна гестикулација и експресија на емоции кај хуманоидните роботи одамна е во тек, а инженерите од Лабораторијата за креативни машини од Универзитетот Колумбија имаат нови интересни резултати.
Ако сакате вашиот хуманоиден робот реално да симулира изрази на лицето, сè е до тајмингот. Сепак, машина којашто погрешно проценува кога треба да се насмее не само што е чудна, туку и штрчи, привлекувајќи внимание кон нејзината извештаченост. Човечкиот мозок, од друга страна, е неверојатно умешен во толкувањето на огромните количини визуелни знаци во реално време, што овозможува соодветна реакција изразена преку различни движења на лицето. И не е само овој проблем. Ако нијансите во фацијалните експресии се мошне тешки за совладување за роботите со вештачка интелигенција, речиси подеднакво тешко е и да се направи механичко лице кое ќе биде способно за изведба на реални движења на мускулите, кои нема да делуваат чудно.
Креаторите на Емо, од Лабораторијата за креативни машини, се обидуваат да решат некои од овие проблеми, или во најмала рака, да помогнат да се намали јазот помеѓу експресивноста на човекот и онаа на роботот. При конструирањето на нивниот нов бот, тимот предводен од експертот за вештачка интелигенција и роботика Ход Липсон, најнапред дизајнирал реалистична роботска човечка глава во која се вградени 26 посебни актуатори што овозможуваат реализирање на движења за добивање на фини детали во фацијалните изрази. Обете “зеници” на Емо, исто така биле опремени со камери со висока резолуција што овозможило следење на очите на неговиот соговорник, што е уште една важна, невербална визуелна карктеристика на луѓето. Конечно, за целиот процес да биде уште, па да кажеме поприроден, тимот на Липсон поставил силиконска „кожа“ врз механичките делови на Емо.
Покрај ова, истражувачите вградиле и два одделни модела на вештачка интелигенција што функционираат во тандем – еден за предвидување на изразите на човекот, преку “читање” на микроекспресиите на соговорникот, и друг за брзо побудување на моторен одговор на лицето од роботот. Потоа, користејќи примероци од видеа со изрази на лице од човек, вештачката интелигенција на Емо ги учела емоционалните сложености на изразувањето, кадар по кадар. За само неколку часа, Емо бил способен да ги забележи, да ги протолкува и соодветно да одговори на малите промени што се јавуваат на лицето на луѓето кога тие почнуваат да се насмевнуваат. Што е уште поневеројатно, роботот сега може да го стори тоа во рок од едвај 840 милисекунди!
Во моментов, Емо нема никакви вештини за вербално толкување, така што може да комуницира само преку анализа на изразите на лицето на луѓето. Липсон, Ху и останатите нивни соработници, се надеваат дека наскоро ќе ги успеат да ги искомбинираат физичките способности на Емо со некој голем јазичен модел од типот на ChatGPT. Ако успеат да го постигнат ова, тогаш Емо ќе се доближи уште повеќе кон изразување на (речиси) природни човечки интеракции.
Резултатите од овој проект се детално опишани во трудот објавен во Science Robotics.