ხუთშაბათი, 9 მაისი, 2024 წ

დესკტოპის v4.2.1

Root NationსიახლეებიIT სიახლეებიტოკიოში აჩვენეს GPT-3-ზე დაფუძნებული ჰუმანოიდური რობოტის Alter4 წარმატებები

ტოკიოში აჩვენეს GPT-3-ზე დაფუძნებული ჰუმანოიდური რობოტის Alter4 წარმატებები

-

ტოკიოს უნივერსიტეტის გუნდმა წარმოადგინა Alter3, ჰუმანოიდური რობოტი, რომელსაც შეუძლია მოძრაობების შესრულება GPT-4 Large Language Model (LLM) გამოყენებით. Alter3 იყენებს უახლეს ხელსაწყოს გახსენით AI დინამიურად მიიღოს სხვადასხვა პოზები, სელფის პოზიდან მოჩვენებამდე, ეს ყველაფერი წინასწარ დაპროგრამებული მონაცემთა ბაზაში ჩანაწერების გარეშე.

„Alter3-ის პასუხი სასაუბრო შინაარსზე სახის გამონათქვამებისა და ჟესტების გამოყენებით არის მნიშვნელოვანი წინსვლა ჰუმანოიდური რობოტიკაში, რომელიც ადვილად ადაპტირდება სხვა ანდროიდებთან მინიმალური ცვლილებებით“, - განაცხადეს მკვლევარებმა.

Alter3

რობოტებთან LLM ინტეგრაციის სფეროში, ყურადღება გამახვილებულია ძირითადი კომუნიკაციის გაუმჯობესებაზე და რეალისტური პასუხების მოდელირებაზე. მკვლევარები ასევე სწავლობენ LLM-ის შესაძლებლობებს, რათა რობოტებს საშუალება მისცენ გაიგონ და შეასრულონ რთული ინსტრუქციები, რითაც გაზარდონ მათი ფუნქციონირება.

ტრადიციულად, დაბალი დონის მენეჯმენტი რობოტები დაკავშირებულია აპარატურასთან და სცილდება LLM კორპორაციების კომპეტენციას. ეს ქმნის სირთულეებს LLM-ზე დაფუძნებული სამუშაოების უშუალო მართვისთვის. ამ პრობლემის გადასაჭრელად, იაპონურმა გუნდმა შეიმუშავა ადამიანის მოძრაობის გამონათქვამები Android-ისთვის გასაგებ კოდად გადაქცევის მეთოდი. ეს ნიშნავს, რომ რობოტს შეუძლია დამოუკიდებლად შექმნას მოქმედებების თანმიმდევრობა დროთა განმავლობაში, დეველოპერების მიერ სხეულის თითოეული ნაწილის ინდივიდუალურად დაპროგრამების საჭიროების გარეშე.

ურთიერთქმედების დროს ადამიანს შეუძლია მისცეს Alter3 ბრძანებები, როგორიცაა „გადაიღეთ სელფი თქვენი iPhone-ით“. შემდგომში, რობოტი იწყებს GPT-4-ის მიმართ მოთხოვნის სერიას, რათა მიიღოს მითითებები აუცილებელ ნაბიჯებზე. GPT-4 გადათარგმნის ამას პითონის კოდში, რომელიც საშუალებას აძლევს ნამუშევარს "გაიგოს" და შეასრულოს საჭირო მოძრაობები. ეს ინოვაცია საშუალებას აძლევს Alter3-ს გადაადგილდეს მისი ზედა სხეული, ხოლო ქვედა სხეული სტაციონარული რჩება, მიმაგრებული სადგამზე.

Alter3 არის Alter-ის ჰუმანოიდური რობოტების სერიის მესამე გამეორება 2016 წლიდან, ამაყობს 43 აქტივატორით, რომლებიც პასუხისმგებელნი არიან სახის გამომეტყველებაზე და კიდურების მოძრაობაზე, რომლებიც იკვებება შეკუმშული ჰაერით. ეს კონფიგურაცია უზრუნველყოფს ექსპრესიული ჟესტების ფართო სპექტრს. რობოტს არ შეუძლია სიარული, მაგრამ მას შეუძლია მიბაძოს ტიპიური სიარული და სირბილი.

Alter3-მა ასევე აჩვენა ადამიანის პოზების კოპირების უნარი კამერისა და OpenPose ჩარჩოს გამოყენებით. რობოტი არეგულირებს სახსრებს დაკვირვებულ პოზებს და ინახავს წარმატებულ იმიტაციებს შემდგომი გამოყენებისთვის. ადამიანთან ურთიერთქმედებამ განაპირობა უფრო მრავალფეროვანი პოზები, რაც მხარს უჭერდა იმ აზრს, რომ განსხვავებული მოძრაობები მოდის ადამიანის იმიტირებიდან, ისევე როგორც ახალშობილები სწავლობენ იმიტაციით.

LLM-მდე მკვლევარებს მოუწიათ გულდასმით ეკონტროლებინათ 43-ვე აქტივატორი, რათა ხელახლა შეექმნათ ადამიანის პოზა ან მოეხდინათ ქცევის სიმულაცია, როგორიცაა ჩაის მირთმევა ან ჭადრაკის თამაში. ამას მოითხოვდა მრავალი ხელით კორექტირება, მაგრამ AI დაეხმარა გუნდს ამ რუტინისგან გათავისუფლებაში. „ჩვენ ველით, რომ Alter3 ეფექტურად ჩაერთვება დიალოგში კონტექსტთან დაკავშირებული სახის გამონათქვამებისა და ჟესტების ჩვენებით. მან აჩვენა ემოციების ასახვის უნარი, მაგალითად, სევდის ან ბედნიერების საპასუხოდ ჩვენება, რითაც ემოციები ჩვენთან გაზიარება“, - აცხადებენ მკვლევარები.

ასევე წაიკითხეთ:

დარეგისტრირდით
შეატყობინეთ შესახებ
სასტუმრო

0 კომენტარები
ჩაშენებული მიმოხილვები
ყველა კომენტარის ნახვა
გამოიწერეთ განახლებები